【摘要】:目前语音识别系统的分类主要有孤立和连续语音识别系统、特定人与非特定人语音识别系统、大词汇量和小词汇量语音识别系统以及嵌入式和服务器模式语音识别系统。以前的语音识别系统主要是以单字或单词为单位的孤立的语音识别系统。近年来,连续语音识别系统已经渐渐成为主流。根据声学模型建立的方式,特定人语音识别系统在前期需要大量的用户发音数据来训练模型。
语音识别技术,也被称为自动语音识别Automatic Speech Recognition(ASR),其目标是将人类语音中的词汇内容转换为计算机可读的输入,如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等,具有广阔的应用前景,如语音检索、命令控制、自动客户服务、机器自动翻译等。
目前语音识别系统的分类主要有孤立和连续语音识别系统、特定人与非特定人语音识别系统、大词汇量和小词汇量语音识别系统以及嵌入式和服务器模式语音识别系统。(www.xing528.com)
自然语言只是在句尾或者文字需要加标点的地方有个间断,其他部分都是连续的发音。以前的语音识别系统主要是以单字或单词为单位的孤立的语音识别系统。近年来,连续语音识别系统已经渐渐成为主流。根据声学模型建立的方式,特定人语音识别系统在前期需要大量的用户发音数据来训练模型。非特定人语音识别系统则在系统构建成功后,不需要事先进行大量语音数据训练就可以使用。在语音识别技术的发展过程中,词汇量是不断积累的,随着词汇量的增大,对系统的稳定性要求也越来越高,系统的成本也越来越高。例如,一个识别电话号码的系统只需要听懂10个数字就可以了,一个订票系统就需要能识别各个地名,而识别一个报道稿就需要一个拥有大量词汇的语音识别系统。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。