在进行音频处理过程中,往往会遇到音频编码的一些概念,如采样率、采样大小等。不同的音频编码方式对应于不同的音频文件存储格式。下面简单介绍音频编码的基本概念和常用音频编码方式。
1.音频编码的基本概念
(1)采样率和采样大小。声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,可以用无数点组成的弦线来逼近。由于存储空间有限,在数字编码过程中必须对弦线的点进行采样,为了复原波形,在一次振动中必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少40kHz的采样来表达,这就是采样率。常见CD的采样率为44.1kHz。在采样过程中,还需获得采样频率的能量值并量化,来表示信号的强度,这被称为采样大小。量化电平数为2的整数次幂,常见CD的采样大小为16bit,即2的16次方。采样率和采样大小的值越大,记录的波形越接近原始信号。
(2)有损和无损。根据采样率和采样大小可以得知,相对自然界的信号,音频编码最多只能做到无限接近,相对自然界的信号,任何数字音频编码方案都是有损的。在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存,在CD、DVD以及WAV文件编码中均有应用。MP3被称为有损音频编码是相对PCM编码的,这种有损和无损是强调编码的相对性而言的。
(3)音频压缩技术。一个采样率为44.1kHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据位速率则为44.1×16×2=1411.2 kbit/s。数据位速率(bit/s)也被称为数据带宽,它与互联网的带宽是一个概念。将数据位速率除以8,就可以得到这个WAV的数据字节速率,即176.4kB/s。这表示存储1s采样率为44.1kHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4kB的磁盘空间,1min则约为10.34MB,这对大部分用户是不能接受的,要降低磁盘占用空间,只有两种方法:降低采样指标和对数据进行压缩。降低指标是不可取的,首选数据压缩方法。针对不同用途,各种音频压缩编码方式所达到的音质和压缩比不同。
(4)流特征。随着网络的发展,人们要求网络在线音频能够实现音频文件一边传输一边播放,而不需要把整个文件全部下载后播放,正是基于这种需求,流媒体技术已逐渐并广泛应用于数字广播的网络实时传输。
2.常用音频编码方式
(1)PCM编码。PCM是Pulse Code Modulation(脉冲编码调制)的缩写。PCM编码的最大优点就是音质好,缺点就是占用磁盘空间大。常见CD都采用PCM编码的编码方式,一张普通CD光盘的容量只能容纳72min的音频信息。(www.xing528.com)
(2)WAVE编码。WAVE由微软开发,它符合RIFF(Resource Interchange File Format)规范,其文件扩展名为WAV。所有的WAV都有一个文件头,保存了音频流的编码参数。WAV文件的编码方式除了PCM之外,还有几乎所有支持ACM规范的编码方式。在Windows平台下,基于PCM编码的WAV是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质要求,因此,WAV是音乐编辑创作的首选格式,适合保存音乐素材。基于PCM编码的WAV被作为一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMA。
(3)MP3编码。MP3是目前最为普及的音频压缩格式,支持MP3编码的软件及硬件产品很多,它是MPEG(Moving Picture Experts Group)Audio Layer 3的简称,是MPEG1的衍生编码方案,1993年由德国Fraunhofer IIS研究院和汤姆生公司合作开发。MP3可以做到12∶1的压缩比并保持基本可听的音质。MP3格式符合流媒体的最基本特征,也就是说播放器可以不用预读文件的全部内容就可以播放,即使是文件有部分损坏。正因为这种特性,出现了一种叫VBR(Variable bitrate,动态数据速率)的技术,可以让MP3文件的每一段甚至每一帧都可以有单独的bitrate,这样做的好处就是在保证音质的前提下最大程度地限制了文件的大小。
(4)OGG编码。OGG是一个多媒体开发计划的项目名称,它涉及视频音频等方面的编码开发。整个OGG项目计划的目的就是向任何人提供完全免费的多媒体编码方案,Vorbis是OGG项目中音频编码的正式命名。Ogg Vorbis是高质量的音频编码方案,它可以在相对较低的数据速率下实现比MP3更好的音质。Ogg Vorbis可以支持多声道,而不像MP3只能编码2个声道,Ogg Vorbis是一种灵活开放的音频编码,能够在编码方案已经固定下来后还能对音质进行明显的调节和新算法的改良。因此,未来它的声音质量将会越来越好,OGG也支持VBR编码技术。
(5)WMA编码。WMA是Windows Media Audio编码的缩写,由微软公司开发,WMA针对的不是单机市场而是网络,其竞争对手是网络媒体市场著名的Real Networks。在只有64kbit/s的码率情况下,WMA可以达到接近CD的音质。和以往的编码不同,WMA支持防复制功能,它支持通过Windows Media Rights Manager加入版权保护,可以限制播放时间和播放次数甚至于播放的机器等。WMA也符合流媒体技术规范,应用WMA可以实现在线广播。
(6)RA编码。RA是Real Audio格式,它完全针对网络媒体市场,支持非常丰富的功能。最大特点是可以根据带宽来控制播放的码率,在保证流畅的前提下尽可能提高音质。RA不但符合流媒体技术规范,同时还支持使用特殊协议来隐匿文件的真实网络地址,从而实现只在线播放而不提供下载的欣赏方式。目前,RA和WMA是互联网上使用最多的音频媒体格式。
(7)APE编码。APE是Monkey′s Audio提供的一种无损压缩格式。Monkey′s Audio提供了音频播放器的插件支持,因此,可以像MP3一样在音频播放软件和硬件中播放APE格式文件。这种格式的压缩比远低于其他格式,但能够做到真正无损,目前已被逐渐推广应用。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。