音频(audio)指人能听到的声音,包括语音、音乐和其他声音(声响、环境声、音效声、自然声)。
1.声音的基本概念
声音是一种纵向压力波,其客观物理属性主要有振幅和频率,而其主观感知特性则有响度、音高和音色等,对于音乐还有风格、节奏、旋律等特征。
声波振幅的大小是人对音量大小的感觉。
声波振动频率反映声音的音调。频率在20 Hz~20 kHz 的波称为音频波,是人耳能听见的声波;频率小于20 Hz 的波称为次声波;频率大于20 kHz 的波则称为超声波。在日常生活中,音调实际上就是对声音频率的描述。当频率快时,也就是频率高时,声音就尖;反之则显得低沉。
从应用的角度看,多媒体计算机中处理的声音主要是人耳可听到的声音,大概有三类:第一类是人的说话声音,即话音或语音;第二类是音乐,是由各种乐器产生的;第三类是效果声音和人工产生的声音,如风雨声、雷声、爆炸声,等等。
2.声音的数字化
声音信息的数字化,即研究如何将随时间连续变化的声音波形信号进行量化。从技术上说,就是将连续的模拟声音信息通过模/数(A/D)转换器,转换为计算机可以处理并识别的用“0”“1”表示的数字信号。声音的数字化涉及采样、量化及编码等多种技术,而影响数字声音质量的主要因素有三个:采样频率、量化位数以及声道数。把模拟声音信号转变成数字声音信号的过程称为声音的数字化。
在声音的数字化中起重要作用的硬件是音频卡。多媒体计算机中的音频卡用于处理音频信息,它可以把话筒、录音机、电子乐器等输入的声音信息进行模数转换(A/D)、压缩等处理,也可以把经过计算机处理的数字化的声音信号通过还原(解压缩)、数模转换(D/A)后用音箱播放出来,或者用录音设备记录下来。
3.音频文件格式

wave 音频
数字音频同CD 音乐一样,是将真实声音以数字信号的形式保存起来,播放时通过声卡将信号恢复成悦耳的声音。主要文件格式如下。
(1)WAVE
WAVE 文件又称波形文件,它的文件扩展名为“.WAV”,是由Microsoft 公司和IBM 公司共同开发的PC 机标准声音格式,是最早的数字音频格式,被Windows 平台及其应用程序广泛支持。WAV 格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz 的采样频率,16 位量化位数。WAVE 文件的优点是音质好,与CD 音质相差无几;缺点是文件存储空间需求大,不利于交流和传播。
(2)MIDI
为了解决电子乐器的通信问题,1982年,国际乐器制造者协会的十几家厂商(其中主要是美国和日本的厂商)会聚一堂,各抒己见。会议通过了美国Sequential Circuits 公司的大卫·史密斯提出的“通用合成器接口”的方案,并改名为“音乐设备数字接口(Musical Instrument Digital Interface,简称MIDI)”。1983年,MIDI 协议1.0 版正式发布,1985年11月,国际乐器制造者协会公布了《MIDI 1.0 版的细节规定》,为MIDI 的推广打下了坚实的基础。
MIDI 定义了计算机音乐程序、合成器及其他电子设备交换音乐信号的方式,还规定了不同厂家的电子乐器与计算机连接的电缆、硬件及其他设备间的数据传输协议,可用于为不同乐器创建数字声音,比如模拟笛子、大提琴、小提琴、钢琴等常见乐器。在MIDI文件中,只包含产生某种声音的指令,计算机将这些指令发送给声卡,声卡按照指令将声音合成出来。与声音文件相比,MIDI 文件显得更加紧凑,文件容量也小。
(3)MP3

midi 音频
MPEG 音频文件格式是指MPEG 标准中的音频部分,即MPEG 音频层(MPEG Audio Layer)。MPEG 音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层,即MPEG Audio Layer 1/2/3,分别对应MP1、MP2 和MP3 这三种声音文件。其中MP3 音乐压缩格式的编码算法取自于MPEG Audio Layer 3,即MPEG 音频编码算法的一部分。MPEG 音频编码具有很高的压缩率,MP1 和MP2 的压缩率分别为4 ∶1 和6 ∶1~8 ∶1,而MP3 的压缩率则高达10 ∶1~12 ∶1,也就是说1 分钟CD 音质的音乐,未经压缩需要10 MB 存储空间,而经过MP3 压缩编码后只需1MB 左右,同时其音质基本保持不失真,因此,目前使用最多的是MP3 文件格式。
(4)WMA

mp3 音频(https://www.xing528.com)

wma 音频
WMA(Windows Media Audio)是微软公司推出的与MP3 格式齐名的一种新的音频格式,是继MP3 后最受欢迎的音乐格式,在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),能在较低的采样频率下产生好的音质。WMA 可以用Windows Media Player 进行播放,目前网上的许多音乐纷纷转向WMA 格式,因此许多播放器软件也纷纷开发出了支持WMA 格式的插件程序,使WMA 文件得到了更大的发展。
(5)Real Audio(RA)
Real Audio(RA)是RealMedia 中的音频压缩规范,也是一种流式文件格式,文件扩展名是“.RA”。RealNetworks 公司所制定的音频视频压缩规范称为RealMedia,是目前在Internet 上相当流行的跨平台的客户/服务器结构多媒体应用标准,它采用音频/视频流同步回放技术,来实现在Internet 上全带宽地提供优质的多媒体。RA 和WMA 一样,RA 不但支持边读边放,也同样支持使用特殊协议来隐匿文件的真实网络地址,从而实现只在线播放而不提供下载的欣赏方式,这对唱片公司和唱片销售公司很重要。RA 和WMA 是目前互联网上用于在线试听最多的音频媒体格式。
(6)Apple Lossless(Apple Lossless Audio Codec、ALAC)
Apple Lossless(Apple Lossless Audio Codec、ALAC)为苹果的无损音频压缩编码格式,可将非压缩音频格式(WAV、AIFF)压缩至原先容量的40%~60%,编解码速度很快。同时也因为是无损压缩,听起来与原文件完全一样,不会因解压缩和压缩而改变。
ALAC 是Apple 公司开发的语音数据可逆压缩格式之一。可逆压缩(无损失压缩)与通常的文件压缩相同,可以将被压缩的数据完全恢复成以前的数据。从原理性上来说,是完全不恶化音质的压缩方式。由于压缩率受到语音内容的很大影响,不能一概而论,但如果把音乐CD 等作为音源,与其他的可逆压缩方式相比,ALAC 常常可以压缩到源文件的一半甚至1/3 左右。
从2004年4月发表的iTunes 4.5 开始就可以使用该格式,并能够用iPod 等设备播放。该格式可以使用Apple 公司的iTunes 软件从WAV 无损音乐格式转码获得。
4.音频格式转换
随着MP3 和MP4 播放机的普及,目前流行的各种音频格式文件,可以使用软件在它们之间进行格式转换。目前的音频编辑软件和转换工具软件几乎都支持转成WAVE 格式。下面介绍几种其他格式间转换的方式和常用软件。
(1)WAVE 格式换成MP3 格式
这个转换过程中声音文件的质量关键在于MP3 的编码器。MP3 编码器之中音质最好的是MP3 规范制定者Fraunhofer IIS 小组开发的Fraunhofer IIS Mpeg Lyaer3 编码器。装有Fraunhofer IIS Mpeg Lyaer3 编码器的音频编辑软件有GoldWave、Cooledit Pro、Sound Forge等,使用它们也很简单,一般选择文件菜单中的“另存为”(Save as)命令来选择MP3 格式,就可以完成转换(如图7-2-1所示)。

图7-2-1 Goldwave
(2)WAVE、MP3 格式转换成WMA 格式
GoldWave、Sound Forge 等音频编辑软件同样也支持把WAVE、MP3 等格式转成WMA流媒体格式文件,同样也是通过文件菜单中的“另存为”命令转换成WMA 格式。
(3)利用格式转换工具软件
在网络上有很多共享软件,其中许多可用于音频格式转化,如共享软件“全能音频转换通”和“AVI MPEG WMV RM to MP3 Converter”等。
全能音频转换通是一款国产共享音视频文件格式转换软件。它支持目前所有流行的媒体文件格式(MP3/MP2/OGG/APE/WAV/WMA/AVI/RM/RMVB/ASF/MPEG/DAT),并支持批量转换。该软件能从视频文件中分离出音频流,转换成完整的音频文件,也可以从整个媒体中截取出部分,转成一个音频文件,或者将几个不同格式的文件转换并连接成一个音频文件。
“AVI MPEG WMV RM to MP3 Converter”支持目前所有流行的媒体文件格式,也支持从视频文件中分离出音频流转换成音频文件。典型的应用有WAV 转MP3、MP3 转WMA、WAV 转WMA、RM(RMVB)转MP3、AVI 转MP3、RM(RMVB)转WMA 等(如图7-2-2所示)。

图7-2-2 AVI MPEG WMV RM TO MP3 Converter
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
