当两个响度不同的声音作用于人耳时,则响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,这种现象称为掩蔽效应。一般来说,对于中等掩蔽强度,纯音最有效的掩蔽出现在它的频率附近,低频的纯音可以有效地掩蔽高频的纯音,而高频时纯音对低频的纯音的掩蔽作用很小。掩蔽效应会造成因一个声音的存在而使另一个声音的听阈上升。
噪声的存在也会影响到纯音的接收,即对纯音产生掩蔽。可以把噪声视为由许多纯音组成的宽带音。掩蔽作用最明显的是被掩蔽纯音的频率附近的一个窄带的掩蔽分量。因此常用“频率群”掩蔽的概念来解释。为了描述这种掩蔽的效果引入临界带宽的概念。一个纯音可以被以它为中心频率,且具有一定频率带宽的连续噪声所掩蔽,如果在这一频带内,噪声功率等于该纯音的功率,这时纯音处于刚能被听到的临界状态,即称这一带宽为临界宽度。一个临界带宽可用巴克(Bark)来表示。在20Hz~16kHz范围内的声音可分为24个频率群,或者说共有24个巴克(Bark)。表4-1给出了24个临界带宽的编号、中心频率及其带宽的数据。
表4-1 临界带宽
在音频文件中嵌入秘密信息的各种方法都要利用人类听觉系统的某些特性。
人的听觉具有掩蔽效应,弱音会被强音所淹没而产生听觉掩蔽现象,听觉掩蔽取决于掩蔽者与掩蔽对象的幅值与时域特性,可分为频域掩蔽和时域掩蔽。
频域掩蔽是指听觉信号中,若两个信号的频率相近,较强的信号将使弱信号变得不可听见。频率掩蔽模型可以很方便地从当代高质量音频编码技术中获得。时域掩蔽比较直观,它是指强音和弱音同时或几乎同时出现时,强音掩蔽弱音的现象,时域掩蔽包括前掩蔽与后掩蔽,前掩蔽是指在强的掩蔽音出现前,被掩蔽音不可听见,后掩蔽是指在强掩蔽音消失后,被掩蔽音不可听见。
其次,人耳对声音信号的绝对相位不敏感,而只对其相对相位敏感。(www.xing528.com)
人耳对不同频段声音的敏感程度不同,通常人耳可以听到20Hz~18kHz的信号,但对2~4kHz范围内的信号最为敏感,幅度很低的信号也能被听到,而在低频区和高频区,能被人耳听到信号幅度要高得多,即使对同样声压级的声音,人耳实际察觉到的音量也是随频率而变化的。
人耳的言语感觉是一个非常复杂的感知过程,它包含了数据驱动和知识驱动两个过程。实验表明,人耳具有以下两个重要的特性:
①人耳听觉系统(HAS)对附加随机噪声的敏感性。人类听觉系统对音频文件中的加性随机噪声很敏感,能够觉察出微小的扰动。因此,即便在时域对话音信号做微小的改变,也会对话音信号的清晰度造成比较大的影响。
图4-2 听觉系统对话音的时域屏蔽特性图
②人耳听觉系统对话音的屏蔽性。人的听觉屏蔽性指的是当两个声音同时存在,或者在相隔很短的时间内存在,相对微弱的话音会被更强的话音所隐蔽的一种听觉现象。图4-2示出了人耳对声音信号的时域屏蔽特性,强度位于曲线内的信号,均会被出现在零时刻的主要声音所屏蔽。人耳的这一听觉特性为话音隐匿的实现提供了客观的条件。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。