首页 百科知识 通过学习,BP神经网络能降低误差

通过学习,BP神经网络能降低误差

时间:2024-01-08 百科知识 版权反馈
【摘要】:对于BP神经网络来说,它的工作程序主要由“正确信息的正向传播”和“信息误差的反向传播”组成。所以说,在消减误差方面,BP神经网络是具备了强大优势的。当然,在应用过程中,BP神经网络同样是存在部分缺陷的。因为在整个学习过程当中,BP神经网络采取的是“梯度下降法”,这可能会使得最终的收敛值为“局部最优”,而不是“全局最优”。

通过学习,BP神经网络能降低误差

人工神经网络理论问世以来,在很长的一段时间里,人们都没能寻找到网络中间层节点权值调整的方法,一直到BP神经网络概念被提出之后,这一问题才得到有效缓解。那么,BP神经网络的工作原理是什么?它又是如何通过逆向传播的方式达到修改节点权值、减小运算误差的呢?

首先,我们需要从人工神经网络的自主化学习说起。假设编程人员对英文字母“A”和“B”做出了如下设定:当键盘输入“A”时,人工神经网络输出显示“1”;当键盘输入“B”时,人工神经网络输出显示“2”。

对于人工神经网络来说,它必须要先按照一定的规律来进行学习,之后才能进行工作。比如当键盘输入“A”时,对应的输出显示为“2”,那么这就需要人工神经网络进行自身调整来修正错误,进而减少出错的概率。

针对这一状况,编程工作者先对网络节点的阈值区间限定为随机性的0、1。那么,当数据“A”试图通过此节点完成数据输出时,网络输出显示的数字就为0或者1,其中这两个数字出现的概率各为50%。而根据之前的设定,当输入字母“A”时,显示数字“1”是正确的,那么设计者就会将连接权值加大;如果显示“2”,那么这一结论是错误的,连接权值就会缩小。经过如此调整,当这个网络模型经过了若干个“A”和“B”的轮番“实验”后,它就会舍弃错误的输出结果,只保留正确的选项。而这一网络自我优化的过程,也就是人工神经网络的自主化学习之路。

对于BP神经网络来说,它的工作程序主要由“正确信息的正向传播”和“信息误差的反向传播”组成。当感知到外界信号时,触感系统将信息进行转化识别之后,由输入层神经元接收,继而传递给中间层各个神经元。经历了中间层神经元的层层转换、传递之后,这个数据信息将会最终被上传到核心处理器,然后由输出层将信息表现展示出来,这一过程就是“正确信息的正向传播”。

而“误差的反向传播”,则是当正向传播结束之后,输出结果与期望值不符,那么BP神经网络体系就会将这一误差值反向传导,即信息的传输路径更改为“输出层—神经元—输入层”。在这一传输过程当中,各个神经节点会根据误差值的范围调整本节点的权值和阈值,最终达到传播信息与期望值相符的目的。

对于“误差反向传播”理论,最先提出BP神经网络概念的大卫·鲁姆哈特就曾经这样解释过:“一位点了三块黄油面包的客人,发现服务生端过来的是两块牛排和一杯饮料,那么老板就会核查导致上菜错误的原因。最可靠的方法就是,先找到上菜的服务生,看看他是否拿错了餐盘,接下来是找到做菜的厨师,看看他是否看错了订单,然后是找到下订单的服务员,看看是否输错了菜品编码。这一逆向的纠错过程,实际上就与BP神经网络理念相类似,假如是服务生拿错了餐盘,那么就需要他重新找到正确的餐盘送来即可;如果是厨师看错了订单,那么他就应该在下一次核对票据时多加留意。在这里,黄油面包就是‘期望值’,‘两块牛排和一杯饮料’就是输出值,而服务生和厨师都可以看作是不同的‘神经节点’。”(www.xing528.com)

所以说,在消减误差方面,BP神经网络是具备了强大优势的。信息误差的反向传播,可以针对各个不同的节点进行判定和修正。而经过更正之后的节点权值,可以在之后的数据传输、计算过程当中保证精准性。

当然,在应用过程中,BP神经网络同样是存在部分缺陷的。首先,在学习速率方面,BP神经网络的反应频率是固定的,这在面对一些复杂问题的时候,它往往需要更长的时间来读取、学习、更正。

其次,BP算法可以让节点权值收敛到一个稳定的值,但却不能保证这个值是全局当中最优的选择。因为在整个学习过程当中,BP神经网络采取的是“梯度下降法”,这可能会使得最终的收敛值为“局部最优”,而不是“全局最优”。

再次,人工神经网络当中所隐含的层数和单元数是难以测量的,目前也缺乏有效的理论依据来测算。所以针对一个人工网络模型当中所包含的元素和变量,一般都是通过反复人为实验和测算得出的,因此这个网络模型必然是充满了冗余、无效因素的,这对于BP神经网络的学习也带来了沉重的负担。

最后,网络的学习和记忆,都是具有不稳定性的。比如工程师给一个成熟的网络模型提出了一个新的学习样本,那么已经经历过自主化学习的神经网络又需要推倒之前的权值参数,进行新一轮的学习训练。类似这样的“推倒重建”,对于部分成熟神经网络模型来说是“爱恨交加”的,一方面,有新的学习样本需要读解训练;另一方面,旧有的成熟权值又都会被破坏。在这里,如果想要保留部分测算优良的权值,就需要将它们提前保存、加密。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈