用RBF网络和多层感知器方法进行表情分类的研究

更新时间：2025-01-08 工作计划版权反馈

【摘要】：参考文献[47]分别采用RBF网络和多层感知器两种方法进行分类。在JAFFE表情数据库上进行测试，准确率分别达到了65%和73%。文中的训练和测试图像来源于Yale人脸数据库，对于陌生样本的表情识别率可以达到84.5%。如何合理地构造ANN，并且准确估计初值的范围，使神经网络的训练不会陷入局部最小点等，仍然是学者们努力探讨的问题。

人工神经网络是由大量简单的基本单元——神经元（Neuron）相互连接而成的非线性动态系统，虽然每个神经元结构和功能比较简单，而由其组成的系统却可以非常复杂，它具备一般非线性动力学系统的全部特点，如不可预测性、不可逆性、多吸引因子等。这样一个复杂的非线性动力学系统具有人脑的某些特性，在自学习、自组织、联想及容错方面具有较强的能力，能用于联想、识别和决策。

一个典型的神经网络系统应该包括三部分：输入层、隐层和输出层，它们之间通过权值相联系，构成了一个类似于人类大脑的非线性系统。神经网络模型有几十种，其中误差BP（反向传播算）法网络模型是模式识别应用最广泛的网络之一。它利用给定的样本，在学习过程中不断修正内部连接权值和阈值，使实际输出与期望输出在一定误差范围内相等。

神经网络在人脸识别中的应用有很长的历史，它有其特殊的适合于人脸识别的优势，它不像其他方法那样要用一套由人确定的规则，同时避免了复杂的特征提取工作，它能根据有代表性的样本自我学习，具有鲁棒性和自适应性。此外，神经网络以并行方式处理信息，如果能用硬件实现，就能显著提高速度。(www.xing528.com)

近年来，用于表情识别的人工神经网络分类器主要有：多层感知器、BP网络、径向基函数（RBF）网络。参考文献[46]中，将原始图像经过Gabor滤波和PCA降维，转化为50维的特征向量，作为单层神经网络分类器的输入，利用delta规则训练，将表情分成六种。参考文献[47]分别采用RBF网络和多层感知器两种方法进行分类。在JAFFE表情数据库上进行测试，准确率分别达到了65%和73%。参考文献[48]由Hebbian规则训练的BP网络分类器是在系统中使用专门的模块来完成的，这个神经网络结果包含4层神经元，可将数据分为不同的表情类别。文中的训练和测试图像来源于Yale人脸数据库，对于陌生样本的表情识别率可以达到84.5%。参考文献[49]比较了两种训练RBF网络的方法，发现利用监督聚类来初始化RBF网络比用非监督聚类来初始化并通过梯度下降算法进行改善的效果更好，但是梯度下降算法对监督聚类初始化的RBF网络并没有很好的改善作用。

ANN可以作为单纯的分类器（不包含特征提取、选择），也可以用作功能完善的分类器。ANN分类器是一种非线性的分类器，它可以提供我们很难想象到的复杂的类间分界面，这也为复杂分类问题的解决提供了一种可能的解决方式。当然，目前在对于人脸识别或是人脸表情识别的分类问题上，ANN的规模通常比较大，需要大量的训练样本和训练时间，很难满足实时处理的要求。如何合理地构造ANN，并且准确估计初值的范围，使神经网络的训练不会陷入局部最小点等，仍然是学者们努力探讨的问题。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈