【摘要】:神经网络是一种应用类似于大脑神经突触连接的结构进行信息处理的数学模型,是一种模仿生物神经网络的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。图12.2神经网络的基本结构神经网络主要由输入层、隐藏层、输出层构成。当隐藏层只有一层时,该网络为两层神经网络,由于输入层未做任何变换,可以不看作单独的一层。神经网络的3个激活函数如图12.3所示。
在当今的大数据时代里,对于处理大量未经标注的原始语音数据的传统机器学习算法,很多都已不再适用。深度学习模型凭借其对海量数据的强大建模能力,能够直接对未标注数据进行处理,成为当前语音识别领域的一个研究热点。在语音识别研究及应用领域,从最早期的特征参数匹配法,发展到已经商用的隐马尔可夫建模及识别方法,现在神经网络特别是深度神经网络(DNN)、卷积神经网络(CNN)方法在语音识别过程中大力应用,取得了明显效果。
2006年以前,人们尝试用神经网络的方法去训练语音数据,试图建立起深度架构。这些用浅层网络的学习训练一个深度的有监督前馈神经网络都失败了。失败的主要原因是梯度不稳定,并且监督学习数据的获取也非常昂贵,梯度下降算法对初始值的敏感也使深度网络参数难以训练。(www.xing528.com)
直到2006年,研究者提出逐层贪婪无监督预训练深度网络之后,一些知名的研究团队成功地将深度学习应用到自己的语音识别系统中,相比起来使单词错误率降低了约30%,取得了语音识别领域中的突破性进展。随后,基于上下文相关的深度神经网络—隐马尔可夫模型(DNN-HMM)对大词汇量语音识别的研究取得成果,改变了语音识别系统的原有技术框架。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。