首页 理论教育 优化双耳线索特征分析实验系统,降低码率并提高听觉感知

优化双耳线索特征分析实验系统,降低码率并提高听觉感知

时间:2023-06-18 理论教育 版权反馈
【摘要】:图1-3主要研究工作内容去除双耳线索的感知冗余,降低4.28%~11.78%的空间参数码率。本文的主要工作在于:①设计双耳线索特征分析实验系统,进行大量的统计实验和主观听觉实验。在有效降低空间参数码率的同时,主观测试MUSHRA得分平均提高2.6分,客观测试ODG得分平均提高1.1分。先后在MDCT域信号能量补偿和相位调整方面申请两项国家发明专利。

优化双耳线索特征分析实验系统,降低码率并提高听觉感知

针对移动音频编码的基础理论和关键技术(国家自然科学基金重点项目,批准号60832002),以及音频编码算法框架与关键技术(国家863高技术研究发展计划子项目,2004AA119010),本文在基础理论、算法框架以及关键技术上展开了研究工作,下面从码率和复杂度两个角度进行说明,如图1-3所示。

图1-3 主要研究工作内容

(1)去除双耳线索的感知冗余,降低4.28%~11.78%的空间参数码率。

当前空间音频编码中,人耳的空间感知特征量以ITD、ILD和IC这三个双耳线索为主,对其的研究致力于这些感知特征量的表示与编码。本文的主要工作在于:

①设计双耳线索特征分析实验系统,进行大量的统计实验和主观听觉实验。搭建国内领先的双耳线索特征实验系统,并就ITD、ILD和IC这三个双耳线索的感知特征量的测量方法及其装置先后申请了三项国家发明专利

②分析双耳线索的频率感知特性和统计分布特性,提出空间参数选取、量化及整体熵编码方法,指导双耳线索冗余信息的去除。在有效降低空间参数码率的同时,主观测试MUSHRA得分平均提高2.6分,客观测试ODG得分平均提高1.1分。在国际会议CSSE上发表了相关研究成果,同时申请了三项相关国家发明专利,其中两项已于2009年8月完成实审。(www.xing528.com)

③建立双耳线索生理感知BCPPM模型,给出基于模型的空间感知信息计算方法。首次明确提出并定义空间感知熵的概念,并在空间感知信息的度量方法、基于空间感知熵的空间参数选取方法和比特分配方法等方面先后申请三项国家发明专利,成为国内该领域拥有专利数最多的研究人员。并在该领域的SCI期刊EURASIP JWCN(2009年影响因子0.976)上发表相关文章。

(2)实现MDCT域的双耳线索表示,将复杂度从O(N2)下降到O(N)。

移动应用系统对编解码延时和复杂度等性能要求苛刻,针对当前空间音频编码系统在延时及复杂度上存在的缺陷,本文的主要工作在于:

①从信号处理的角度分析双耳线索的形成机理,研究MDCT谱线特征及其对双耳线索的影响关系。先后在MDCT域信号能量补偿和相位调整方面申请两项国家发明专利。

②提出一种通用的基于共轭窗函数的MDCT复数化扩展方法,并针对新方法引入MDST带来复杂度增加的问题,提出基于转换矩阵稀疏性的MDCT-MDST快速转换算法,将复杂度从O(N2)下降到O(N)。本项研究成果受到国内外音频编码领域专家的肯定,先后在音频编码领域的国际顶级会议ICME(2009年录用率23%)、国际会议MUE、及SCI期刊MTP(5年期影响因子0.704)上发表相关文章,并在ICME的IBM优秀奖学金角逐中成为唯一的中国获奖者(共6人获奖)。

③分析空间音频编码系统中各功能操作模块及其内在联系,提出滤波和下混的并行处理技术以及合成与分析滤波的共享技术,结合本文上述研究成果,构建基于ABS的空间音频编码框架和系统。缩短5%的系统延时,减少33.33%~84.97%的实数加法运算和42.70%~87.13%的实数乘法运算,并在2008年的国际会议WiCOM上发表相关研究成果。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈