声音素材的获取与处理

时间：2026-01-27 理论教育可欣版权反馈

【摘要】：从声音素材库获取市场上有很多音乐、音效素材的光盘，一般以WAV、MIDI 等格式为主，用户可以根据需要选择购买，这是一种最直接最方便的获取声音素材的方法。最多混合128 个声道，可编辑单个音频文件，创建回路并可使用45 种以上的数字信号处理效果。

声音是人们用于传递信息最方便最熟悉的方式，人耳听到的声音是一种具有振幅周期性（频率）的声波，包括语言和音乐两类。语言和音乐同属于音频范畴，动听的音乐和解说可以使呆板的文字和静态画面更加生动。

计算机多媒体音频处理技术包括音频信息的采集技术，音频信号的编码和解码技术，音乐合成技术，语音的识别和理解技术，音频和视频的同步技术，音频的编辑以及音频数据传输技术等。

1.音频素材文件的常用格式

在多媒体声音处理技术中，最常见的几种声音存储格式是：WAVE 波形文件，VOC 声音文件，MIDI 音乐数字文件和MP3 音乐文件。

（1）WAVE 波形文件

WAVE 波形文件是基于PCM 技术的波形音频文件，文件扩展名是WAV，是Windows 操作系统所使用的标准数字音频文件。

在适当的软硬件条件下，使用波形文件能够重现各种声音，但波形文件有一个很大的缺点就是产生的文件太大，不适合长时间的记录。

WAVE 文件可以通过Windows 的对象链接嵌入（OLE）技术，嵌在其他Windows 上的应用系统中使用。另外，由于WAVE 文件记录的是数字音频信息，因此，可利用一定软硬件手段对其进行分析、加工、处理。

（2）MIDI 音乐数字文件

前面所说的WAV 和VOC 文件都是波形音频文件，而MIDI 文件则是按MIDI 数字化音乐的国际标准来记录描述音符、音道、音长、音量和触键力度（键从触按到最低位置的速度）等音乐信息的指令，通常称为MIDI 音频文件。它在Windows 下的扩展名为MID。

由于MIDI 文件记录的不是声音信息本身，它只是对声音的一种数字化描述方式，因此，它与波形文件相比要小得多。

MIDI 文件的主要缺点是缺乏重现真实自然声音的能力，另外，MIDI 只能记录标准所规定的有限几种乐器的组合，并且受音频适配卡上芯片性能的限制难以产生真实的音乐效果。

（3）MP3 文件

MP3 全称为MPEG Layer3，MP3 文件就是以MPEG Layer3 为标准的一种压缩编码的数字音频格式文件。

由于在MPEG 的视频信息标准中，也规定了视频伴音系统，因此，MPEG 标准里也就包括了音频压缩方面的标准。在MPEG 的音频标准里包含三个使用高性能音频数据方法的感知编码方案，按照压缩质量和编码方案的复杂程度分为Layerl、Layer2 和Layer3，它们的基本结构是相同的。它们在采用传统的频谱分析和编码技术的基础上，应用了子带分析和心理声学模型的感知子带编码，即利用人的听觉系统特性来压缩数据，在编码时先分析声音文件波形，然后利用过滤器，去掉人耳不敏感的信号，最后编码成为MPEG 文件。

MP3 音频压缩具有很高的压缩比率，一般说来，1 分钟CD 音质的WAV 文件约需10MB的存储空间，而经过MPEG Layer3 标准压缩可以压缩为1MB 左右并基本保持不失真。所以，采用MP3 格式，在普通光盘上可以保存相当于10～12 张CD 的音乐。

（4）RA 文件

RA 音频文件全称是RealAudio，是由RealNetworks 公司开发的一种具有较高压缩比的音频文件。由于其压缩比高，因此文件小，适合于网络传输，属于流媒体音频文件格式。同样也由于其压缩比高，声音失真也比较严重，但在可接受范围内。

【思考】

MP3、WAV、RA 以及MIDI 音乐文件各自有哪些特性？在网上常见的音乐文件有哪些？它们的文件大小一样吗？为什么？

2.音频素材的获取

（1）利用电子乐器数字接口采集

电子乐器数字接口（MIDI）是用在音乐合成器、乐器和计算机之间交换音乐信息的一种标准协议，它指示乐器要做什么以及怎样做，如演奏音符、加大音量、生成音效等。MIDI 生成的文件比较小，容易编辑，并可作为背景音乐与其他媒体一起播放增强演示效果。

（2）利用声音编辑软件制作

利用一些音乐编辑软件，如GoldWave、Adobe Audition、Cool Edit 等，既可以录音，也可以对已有音乐文件进行编辑处理，获得自己所需的音频文件。

（3）从声音素材库获取

市场上有很多音乐、音效素材的光盘，一般以WAV、MIDI 等格式为主，用户可以根据需要选择购买，这是一种最直接最方便的获取声音素材的方法。

（4）网络下载(https://www.xing528.com)

随着网络技术的快速发展，网络上的声音资源越来越丰富。用户可根据提供的链接直接下载各种音乐、音效等。

【提示】

音频文件存储容量的大小，以声道来区分，随着声道数的增加，音频文件所占用的存储容量也成倍增加，同时声音质量也会提高。

3.声音素材的编辑

声音的编辑软件很多，如Adobe Audition、Sound Forge、Wave Edit、Gold Wav 等，它们都可以对声音进行各种各样的编辑，但是功能与应用范围略有不同。下面以应用广泛的Adobe Audition CS 5.5 软件为例，讲解如何对声音进行录音、降噪、混响、滤波、变调等常用编辑。

Audition 是一个专业音频编辑和混合环境。它是由Cool Edit 发展而来的。Audition 专为在照相室、广播设备和后期制作设备方面工作的音频和视频专业人员设计，可提供先进的音频混合、编辑、控制和效果处理功能。最多混合128 个声道，可编辑单个音频文件，创建回路并可使用45 种以上的数字信号处理效果。Audition 是一个完善的多声道录音室，可提供灵活的工作流程并且使用简便。无论是要录制音乐、无线电广播，还是为录像配音，Avdition中的恰到好处的工具均可提供充足动力，以创造最高质量的丰富、细微的音响。

（1）录音

打开软件，选择“文件”—“新建”—“音频文件”，就会弹出对话框。其中，“文件名”是指即将新建的音频文件的名称。要将模拟的声波转换为该声波的数字描述，就要在指定时间间隔内对声波进行采样。每秒的采样数称为采样频率，也称为采样率，单位为赫兹（Hz）。采样频率的倒数是采样周期（也称为采样时间），表示采样之间的时间间隔，多媒体素材中比较通用的是44 100Hz 和48 000Hz。

声道是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号，所以声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。自然界发出的声音是立体声，但我们如果把这些立体声经记录、放大等处理后而重放时，所有的声音都从一个扬声器放出来，这种重放声（与原声源相比）就不是立体的了。这是由于各种声音都从同一个扬声器发出，原来的空间感（特别是声群的空间分布感）也消失了。这种重放声称为单声。如果从记录到重放整个系统能够在一定程度上恢复原发生的空间感（不可能完全恢复），那么，这种具有一定程度的方位层次等空间分布特性的重放声，称为音响技术中的立体声。与单声道相比，立体声有如下优点：①具有各声源的方位感和分布感；②提高了信息的清晰度和可懂度；③提高节目的临场感、层次感和透明度。5.1 声道就是使用5 个喇叭和1 个超低音扬声器来实现身临其境的音乐播放方式，它是由杜比公司开发的，所以叫作“杜比5.1 声道”。在5.1 声道系统里采用左（L）、中（C）、右（R）、左后（IS）、右后（RS）五个方向输出声音，使人产生犹如身临音乐厅的感觉。五个声道相互独立，其中“.1”声道，则是一个专门设计的超低音声道。正是因为前后左右都有喇叭，所以就会产生被音乐包围的真实感。

和图像一样，音频文件也用它的位深度来度量（也称谓采样分辨率或者字深度），位深度越大代表声音的采样频率越高。

本实例取名“声音编辑”，采样率选择44 100Hz，声道选择“立体声”，位深度选择24 位，确定后，界面如图1-5-3所示。界面上会出现一个红色圆点，鼠标放到圆点上面就会出现“录制”的字样，点击红色圆点，就可以开始录制。录制结束后选择“文件”—“存储”，可以保存成wav、mov、mp3 等格式。

图1-5-3　录音界面

（2）降噪

降噪是指减少音乐中的噪音，使音乐更加清晰，音质更加完美。针对不同类型的噪音，有不同的处理方法。需要说明的是，理论上讲，降噪会在一定程度上影响音质，所以在可以的情况下应尽量避免降噪，不过如果噪音严重影响到了音乐或音频的质量，降噪则是必需的工作。利用Audition 提供的“降噪”功能可以对音频文件进行采样降噪，图1-5-4 是利用Audition“降噪”功能的降噪界面。采样降噪是一种有效的降噪方法，它的原理是采集噪音音频获得噪音样本，再通过分析获得的噪音样本得到噪音特征，最后利用分析结果降低夹杂在音乐中的噪音。比如说，在录制歌曲时旁边有人在走动，则录入的音频中混有了脚步声。脚步声的音频具有频率相对稳定的特点，在这种情况下应该使用采样降噪方法降噪。首先提取脚步声的噪音样本，接着进行分析，最后利用噪音特征在歌曲中找出噪音并将其去除。在使用这种方法降噪时，取得一个稳定的噪音样本十分重要，因此本种方法仅适用于除去频率稳定的噪音。

图1-5-4　降噪界面

（3）混响

声音遇到障碍会反射，所以我们这个世界充满了混响。混响是室内声音的一种自然现象。室内声源连续发声，当达到平衡时（室内被吸收的声能等于发射的声能时）关断声源，在室内仍留有余音，此现象被称为混响，图1-5-5 是Audition 的混响界面。混响声可以加强声源的响度，可以改变声源的主观音质，可以给声音温暖感，也可以使声音丰满或明亮。混响声比例的大小有助于听者判断声源的距离。

专业的录音棚是有混响的，用很多板状的材料，可以灵活地把房间改造成具有各种混响特征。但随着数字录音技术的飞速发展，数字混响效果器能够模拟真实情况下的混响，所以人们就干脆把录音棚弄成无混响的，录完音后再用效果器来模拟混响效果，想要什么混响就有什么混响，这就是为什么现在的录音棚，尤其是中小录音棚和个人工作室，都做成无混响的原因。

（4）滤波

滤波是将信号中特定波段频率滤除的操作，是抑制和防止干扰的一项重要措施，分经典滤波和现代滤波。滤波一词起源于通信理论，指从含有干扰的接收信号中提取有用信号的一种技术。“接收信号”相当于被观测的随机过程，“有用信号”相当于被估计的随机过程。例如，用雷达跟踪飞机，测得的飞机位置的数据中含有测量误差及其他随机干扰，如何利用这些数据尽可能准确地估计出飞机在每一时刻的位置、速度、加速度等，并预测飞机未来的位置，就是一个滤波与预测问题。这类问题在电子技术、航天科学、控制工程及其他科学技术部门中都是大量存在的。

图1-5-5　混响界面

Audition 软件中的滤波效果可以针对声音的不同频率部分进行不同的操作。在Audition 中，导入音频文件，选择“效果”—“滤波与均衡”，可以发现有“FFT 滤波”“图示均衡器”“参数均衡”等选项。其中，“FFT 滤波”在波形处理中是一个常用的高品质滤波效果器，可以滤除共振和模拟环境特性的频响；“图示均衡器”主要作用是过滤掉不需要的声音，保留需要的声音；“参数均衡”采用IIR 滤波器，拥有自动生成连接频点EQ 均衡曲线的功能，各频段衔接的连续性比较好，大大简化用户的操作。

（5）变调

声音频率的高低叫作音调。音调表示人的听觉分辨一个声音调子高低的程度。音调主要由声音的频率决定，同时也与声音强度有关。对一定强度的纯音，音调随频率的升降而升降；对一定频率的纯音、低频纯音，音调随声强增加而下降，高频纯音的音调却随强度增加而上升。调的高低还与发声体的结构有关，因为发声体的结构影响了声音的频率。音调也与声音持续的时间有关。非常短促（毫秒量级或更短）的纯音，只能听到像打击或弹指那样的“咔嚓”一响，感觉不出音调。持续时间从10毫秒增加到50毫秒，听起来觉得音调是由低到高连续变化的。超过50毫秒，音调就稳定不变了。

在Audition 中，可以利用“伸缩与变调”功能调节音调，制造一些有趣效果。例如，将歌曲变调，原本男歌手的声音变成了女歌手的声音。

【提示】

常见的音频制作和转换工具有Goldwave、Audio Editor、SoundForge、CoolEdit、Cakewalk 等。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

工作计划

年度工作

工作规划

教学计划

实施方案

工作方案

教学工作

发展计划

德育工作

管理工作

发展规划

工作总结

教育工作

体育教师

年度计划

后勤工作

安全教育

工作思路

教育计划

小学教师

幼儿教师

数学教师

食品安全

英语教学

声音素材的获取与处理

相关推荐

声音素材的获取与处理

相关文章：

相关推荐