音频处理的方法主要包括:音频降噪、自动增益控制、回声抑制、静音检测和生成舒适噪声,主要的应用场景是音视频通话领域。而数字音频的主要应用包括下面三个方面:
(1)声音采集及回放技术
无论是语音还是音乐,在运行计算机录音程序并通过声卡录制后,可以以扩展名为.wav的文件放到磁盘上。再运行相应的程序,以便对它们进行数字化音频处理,也可将它们通过声卡回放。这些文件的大小取决于录制它们时所选取的参数。
(2)声音识别技术
声音识别技术的主要研究和应用是语音识别。计算机技术正在朝着微型化的方向飞速发展,原有的输入设备将被新的输入方式代替,语言输入将逐渐成为一种趋势。语言操作系统出现后,用语言命令代替键盘和图标命令成为非常自然的事情。(www.xing528.com)
人类使用的文字大致可分为两类:拼音文字和象形文字。拼音文字在学习、拼写、阅读、自动化控制(如计算机)等方面存着绝对的优势。现代计算机技术发展中,拼音文字起着关键性的作用。汉字作为一种象形文字,伴随着计算机技术的发展,其发音方式在计算机的语音识别中却有着突出的优点。同英语相比,汉语语音有着明显的音节,这就使汉语在计算机语音命令处理中有可能成为优秀的操作语言。目前,汉语语音识别的听写系统的平均最高识别率可达95%以上,而汉字录入速度可达150汉字/分钟,与正常的说话速度相当。
(3)声音合成技术
声音合成技术主要用于语音合成和音乐合成(如MIDI音乐)。语音合成技术的作用刚好与语音识别作用相反。语音识别是将语音转换成为文本(文字)或代码,而语音合成则是将是文本(文字)或代码转换成相应的发音。语音识别可以在某人讲演的同时自动形成讲话记录稿。而语音合成将在人们输入讲稿时,实时地播出演讲发音。
MIDI音乐应属于合成音乐,它的工作原理是:在计算机系统和应用软件中固化了各种乐器不同情况下的发声波形采样数据,并且每组数据都对应有一定的代码。这称为“波表”(Wave Table,WT)。当使用MIDI音乐编辑软件作曲时,便形成了MIDI音乐文件(扩展名为.mid),该文件实际上是上述代码组成的序列。播放该文件,计算机将根据其中代码取出各种波形数据合成为音乐。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。