【摘要】:统计方法成为语音识别技术的主流,更多地从整体平均(统计)的角度来建立最佳的语音识别系统。另外,人工神经网络方法、基于文法规则的语言处理机制等也在语音识别中得到了应用。图16.2隐马尔科夫链与连续语音识别一个完整的基于统计的语音识别系统可大致分为3部分:①语音信号预处理与特征提取。语言模型对中、大词汇量的语音识别系统特别重要。HMM语音识别系统应用框架如图16.3所示。图16.3HMM语音识别系统应用框架
统计方法成为语音识别技术的主流,更多地从整体平均(统计)的角度来建立最佳的语音识别系统。在声学模型方面,以隐马尔科夫链为基础的语音序列建模方法HMM有效地解决了语音信号短时稳定、长时时变的特性,并且能根据一些基本建模单元构造成连续语音的句子模型,达到了比较高的建模精度和建模灵活性(图16.2)。在语言层面上,通过统计真实大规模语料的词之间同现概率即N元统计模型来区分识别带来的模糊音和同音词。另外,人工神经网络(ANN)方法、基于文法规则的语言处理机制等也在语音识别中得到了应用。
图16.2 隐马尔科夫链与连续语音识别
一个完整的基于统计的语音识别系统可大致分为3部分:
①语音信号预处理与特征提取。梅尔刻度式倒频谱参数考虑了人类发声与接收声音的特性,具有更好的鲁棒性(Robustness)。
②声学模型与模式匹配。声学模型通常是将获取的语音特征使用训练算法进行训练后产生。在识别时将输入的语音特征同声学模型(模式)进行匹配与比较,得到最佳的识别结果。(www.xing528.com)
③语言模型与语言处理。语言模型对中、大词汇量的语音识别系统特别重要。当分类发生错误时可以根据语言学模型、语法结构、语义学进行判断纠正,特别是一些同音字则必须通过上下文结构才能确定词义。
HMM语音识别系统应用框架如图16.3所示。
图16.3 HMM语音识别系统应用框架
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。