首页 理论教育 声音的获取与振幅、频率相关的数字化处理

声音的获取与振幅、频率相关的数字化处理

时间:2023-11-03 理论教育 版权反馈
【摘要】:图9-1声音的波形表示从图9-1中可以看出,波形的最高点或最低点与基线(时间轴)之间的距离称为该波形的“振幅”。振幅表示声音的音量。声音按其频率的不同可分为次声、可听声和超声三种。声音信息的计算机获取过程主要是进行数字化处理,因为只有数字化以后声音信息才能像文字、图形信息那样进行存储、检索、编辑和各种处理。采样后得到的样本,其数值仍然是模拟量。

声音的获取与振幅、频率相关的数字化处理

声音(sound)是文字、图形之外表达信息的另一种有效方式。从物理学角度来认识,空气振动而被人们耳朵所感知的就是声音。通常,声音用一种连续的随时间变化的波形来表示,该波形描述了空气的振动,如图9-1所示。

图9-1 声音的波形表示

从图9-1中可以看出,波形的最高点或最低点与基线(时间轴)之间的距离称为该波形的“振幅”。振幅表示声音的音量。波形中两个连续波峰间的距离称为“周期”,波形的“频率”是1秒钟内所出现的周期数目,单位是赫兹(Hz)。声音按其频率的不同可分为次声、可听声和超声三种。次声的频率低20赫兹,它是一种人耳听不见的声音。可听声的频率在20~20 000赫兹,这是人耳可感受的声波。超声的振动频率高于20 000赫兹,也是人耳听不见的声波。多媒体计算机中处理的声音信息主要是指可听声,所以也叫作音频信息(audio)。声音信息的计算机获取过程主要是进行数字化处理,因为只有数字化以后声音信息才能像文字、图形信息那样进行存储、检索、编辑和各种处理。要使用计算机对音频信息进行处理,就要将模拟信号(如语音、音乐等)转化为数字信号,这一过程称为模拟音频的数字化。模拟音频的数字化过程涉及音频信号的采样、量化和编码。声音信息的数字化如图9-2所示。

图9-2 声音信息的数字化(www.xing528.com)

(1)采样。采样指的是以固定时间间隔对波形的值进行抽取。如果以Xa(t)表示声音的连续波形,则采样后得到的是一个离散的序列X(n)。如果以T作为时间间隔(称为采样周期),则采样后得到的声音信号序列为

X(n)=Xa(nt) n=1,2,…

序列中的每一个信号,称为“样本”。采样后得到的样本,其数值仍然是模拟量。采样过程最重要的参数是采样频率。采样频率越高,声音保真度越好,但要求的数据存储量也就越大。理论研究表明,采样频率为声音信号的最高频谱分量的两倍时,即可不失真地还原了原始声音信号,若超过此采样频率,则就包含某些冗余信息;若低于此频率,则产生失真。实验表明,使用8千赫兹采样频率时,人们讲话所产生的语言信号的处理已可以基本满足要求了。多媒体计算机在声音信号获取时,采样频率通常可以有三种选择,它们是44.1千赫兹,22.05千赫兹和11.025千赫兹。

(2)量化。量化是将每个采样点得到的幅度值进行数字归化处理存储。量化位数(即采样的精度)表示存放采样点振幅值的二进制位数,它决定了模拟信号数字化以后的动态范围。通常,量化位数有8位、16位,分别表示有28、216个等级。量化位数越多,声音的质量越高,而需要的存储空间越大。

(3)编码。编码是将采样和量化后的数字数据以一定得格式记录下来。编码的方式很多,常用的编码方式是脉冲编码调制,其主要特点是抗干扰能力强、失真小、传输特性稳定。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈