通常听觉系统有两个输入通道,即左耳和右耳。心理声学的研究表明,双耳听音既不是左耳和右耳分别听音的简单叠加,也不是左耳和右耳单独听音的平均,而是引入了新的信息,即空间信息。
所谓空间信息就是声源的空间位置,包括距离(Range),方位角(Azimuth)和高度角(Elevation)。人耳对声源的空间定位是一个复杂的物理、生理和心理的过程,如图3-3所示。
图3-3 声源的空间定位(www.xing528.com)
这个过程在心理层面上不仅与听觉相关,还与视觉等其他感官、心理状态以及先验知识有关,这意味着相同的声音不一定形成相同的空间位置判断。1997年Blauert在Spatial hearing一书中指出,即使接收完全相同的声音,测试者在不同环境下也会产生不同声场感受[91]。此外,人耳对声音感知也是一个学习的过程。1998年Hofman等人通过实验发现,通过改变耳廓(Pinnae)的形状,实验对象从一开始几乎完全失去声源高度判断能力到最后可以达到正常高度判断能力[92]。这一现象说明,实验对象通过一段时间的适应后,建立起了新耳廓下感知声音的频谱特性与声源高度的对应关系,并以此指导高度角的定位。因此,双耳听音在心理层面上相对来说比较复杂,音频编码系统中难以考虑心理层对听音者的影响。
在物理层面上,声源发出的声波经过不同的路径达到人的双耳,传输过程包括与耳廓、头颅、躯干、墙壁等其他反射面的反射,还包括声波的干涉和衍射以及声波在耳蜗的传导,使得最终接收到声波信号中携带了声源位置的客观信息。在生理层面上,听觉器官将外部世界的声波激励转化为神经兴奋或抑制,不同类型的听觉细胞对特定的激励有不同的响应,这样就把强度、频率、延时等物理信号转变为相应的生理信号。
总之,在音频信号处理中通常是从物理和生理层面上考虑信息的压缩编码。下面针对本章研究对象双耳线索,讨论其物理和生理层面上的表示方法,建立双耳听音的生理感知BCPPM模型。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。