首页 理论教育 大学计算机基础:波形声音参数

大学计算机基础:波形声音参数

时间:2023-11-19 理论教育 版权反馈
【摘要】:波形声音的主要参数包括取样频率、采样位数、声道数目、使用的压缩编码方法以及比特率。同时还建议增加一个低音音箱,以加强对低频信号的回放处理。其实5.1声音系统来源于4.1环绕,不同之处在于它增加了一个中置单元。目前很多在线音乐播放器,比如说QQ音乐,已经提供5.1声道音乐试听和下载。

大学计算机基础:波形声音参数

波形声音的主要参数包括取样频率、采样位数、声道数目、使用的压缩编码方法以及比特率。比特率也称码率,它指的是每秒钟的数据量。

1.采样频率

指每秒钟取得声音样本的次数。声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。

采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多。由于人耳的分辨率很有限,太高的频率并不能分辨出来。22050的采样频率是常用的,44100已是CD音质,超过48000或96000的采样对人耳已经没有意义。这和电影的每秒24帧图片的道理差不多。如果是双声道(stereo),采样就是双份的,文件也差不多要大一倍。

根据奈奎斯特采样理论,为了保证声音不失真,采样频率应该在40kHz左右。这个定理怎么得来,我们不需要知道,只需知道这个定理告诉我们,如果我们要精确的记录一个信号,我们的采样频率必须大于等于音频信号的最大频率的两倍,记住,是最大频率。

数字音频领域,常用的采样率有:

·8000 Hz—电话所用采样率,对于人的说话已经足够;

·11025 Hz—电话音质,基本上能让你分辨出通话人的声音;

·22050 Hz—无线电广播所用采样率;

·32000 Hz—miniDV数码视频camcorder、DAT(LP mode)所用采样率;

·44100 Hz—音频CD,也常用于MPEG—1音频(VCD,SVCD,MP3)所用采样率;

·47250 Hz—商用PCM录音机所用采样率;

·48000 Hz—数字电视、DVD、DAT、电影和专业音频所用的数字声音采样率;

·50000 Hz—商用数字录音机所用采样率;

·96000 Hz或者192000 Hz—DVD—Audio、一些LPCM DVD音轨、BD—ROM(蓝光盘)音轨、和HD—DVD(高清晰度DVD)音轨所用所用采样率;

2.采样位数

采样位数也叫采样大小或量化位数。它是用来衡量声音波动变化的一个参数,也就是声卡的分辨率或可以理解为声卡处理声音的解析度。它的数值越大,分辨率也就越高,录制和回放的声音就越真实。而声卡的位是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数,声卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。常见的声卡主要有8位和16位两种,如今市面上所有的主流产品都是16位及以上的声卡。(www.xing528.com)

每个采样数据记录的是振幅,采样精度取决于采样位数的大小:

·1字节(8比特)只能记录256个数,也就是只能将振幅划分成256个等级;

·2字节(16比特)可以细到65536个数,这已是CD标准了;

·4字节(32比特)能把振幅细分到4294967296个等级,远远超过需要。

3.通道数

即声音的通道的数目。常见的单声道和立体声(双声道),现在发展到了四声环绕(四声道)和5.1声道。

·单声道:单声道是比较原始的声音复制形式,早期的声卡采用的比较普遍。单声道的声音只能使用一个扬声器发声,有的也处理成两个扬声器输出同一个声道的声音,当通过两个扬声器回放单声道信息的时候,我们可以明显感觉到声音是从两个音箱中间传递到我们耳朵里的,无法判断声源的具体位置。

·立体声:双声道就是有两个声音通道,其原理是人们听到声音时可以根据左耳和右耳对声音相位差来判断声源的具体位置。声音在录制过程中被分配到两个独立的声道,从而达到了很好的声音定位效果。这种技术在音乐欣赏中显得尤为有用,听众可以清晰地分辨出各种乐器来自的方向,从而使音乐更富想象力,更加接近于临场感受。

·双声目前最常用途与两个,在卡拉OK中,一个是奏乐,一个是歌手的声音;在VCD中,一个是普通话配音,一个是粤语配音。

·四声环绕:四声道环绕规定了前左、前右,后左、后右四个发声点,听众则被包围在这中间。同时还建议增加一个低音音箱,以加强对低频信号的回放处理(这也就是如今4.1声道音箱系统广泛流行的原因)。就整体效果而言,四声道系统可以为听众带来来自多个不同方向的声音环绕,可以获得身临各种不同环境的听觉感受,给用户以全新的体验。如今四声道技术已经广泛融入各类中高档声卡的设计中,成为未来发展的主流趋势。

·5.1声道:5.1声道已广泛运用于各类传统影院和家庭影院中,一些比较知名的声音录制压缩格式,譬如杜比AC—3(Dolby Digital)、DTS等都是以5.1声音系统为技术蓝本的,其中“.1”声道,则是一个专门设计的超低音声道,这一声道可以产生频响范围20~120Hz的超低音。其实5.1声音系统来源于4.1环绕,不同之处在于它增加了一个中置单元。这个中置单元负责传送低于80Hz的声音信号,在欣赏影片时有利于加强人声,把对话集中在整个声场的中部,以增加整体效果。目前很多在线音乐播放器,比如说QQ音乐,已经提供5.1声道音乐试听和下载。

4.比特率

比特率也叫码率,指音乐每秒播放的数据量,用bps表示,b就是比特(bit),s就是秒(second),p就是每(per)。也就是说128bps的4分钟的歌曲的文件大小是这样计算的(128/8)*4*60=3840KB=3.8MB,一般mp3在128比特率左右为益,一首歌大概3—4 MB的大小。

在计算机应用中,能够达到最高保真水平的就是PCM(脉冲编码调制,Pulse—code modulation),被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,但并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。

PCM音频流的码率=采样率值×采样大小值×声道数。一个采样率为44.1kHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率为44.1K×16×2=1411.2Kbps。我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。

双声道的PCM编码的音频信号,1秒钟需要176.4KB的空间,1分钟则约为10.34M,这对当前很多通过网络听音乐的用户来说是不能接受的,为了降低带宽的占用,只有2种方法,降低采样指标或者压缩。降低采样指标会影响体验,所以是不可取的,因此专家们研发了各种压缩方案。最原始的有DPCM、ADPCM,其中最出名的为MP3。所以,采用了数据压缩以后的码率远小于原始码。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈