首页 理论教育 连接主义学习与学习的关系

连接主义学习与学习的关系

时间:2023-06-30 理论教育 版权反馈
【摘要】:在连接主义学习中,学习算法基本上可以分为三种类型,即非监督学习、监督学习和强化学习。这种类型的学习完全是开环的,在神经网络学习中,称之为相关规则,即神经网络中的Hebb学习规则。监督学习规则是一种反馈学习规则,当输入信号作用于系统后,观察其输出,由教师提供理想的输出信号,所产生的误差信号反馈给系统来指导学习,在神经网络学习中,称之为最小误差学习规则,或称之为δ规则。具有上述特点的学习就是强化学习。

连接主义学习与学习的关系

学习人类获取知识的主要形式,也是人类具有智能、提高智能水平的基本途径。建造具有类似人的智能机器是智能控制、人工智能研究的目标。要使机器具有一定的智能,一种方式是靠人事先编程来建立知识库和推理机制,这具有明显的局限性。我们希望机器具有从环境中学习的能力,即自动获取知识、积累经验、不断更新和扩充知识、改善知识性能的能力。学习的概念在日常生活中使用极其广泛,其内涵虽然通俗但难于给出精确的定义。人们可以从不同的学科角度、根据不同的理解来表述学习。

按照人工智能大师西蒙(H.Simon)的观点,学习就是系统在不断重复的工作中对本身能力的增强或改进,使得系统在下一次执行同样的任务时,会比现在做得更好或效率更高。[1]

通常,具有学习能力的智能系统有以下特点:①有一定的自主性:学习系统的性能是自我改进的;②是一种动态过程:学习系统的性能随时间而变,性能的改进是在与外界反复作用的过程中进行的;③有记忆功能:学习系统需要积累经验,用以改进其性能;④有性能反馈:学习系统需要明确它的当前性能与某个目标性能之间的差距,施加改进操作。(www.xing528.com)

在连接主义学习中,学习算法基本上可以分为三种类型,即非监督学习(Unsupervised Learning)、监督学习(Supervised Learning)和强化学习(Reinforcement Learning)。非监督学习规则在生理学上就是巴甫洛夫(Pavlov)的条件反射原理,当我们用一个毫无意义的刺激信号(如铃的响声)同时伴有另一个刺激信号(如食物)反复加给动物的时候,经过一段时间的训练后,动物就会建立一种联想,当再接收到相似的刺激信号时,动物就会产生条件反射。这种类型的学习完全是开环的,在神经网络学习中,称之为相关规则,即神经网络中的Hebb学习规则。监督学习规则是一种反馈学习规则,当输入信号作用于系统后,观察其输出,由教师提供理想的输出信号,所产生的误差信号反馈给系统来指导学习,在神经网络学习中,称之为最小误差学习规则,或称之为δ规则。观察生物(特别是人)为适应环境的学习过程可以发现它有两个特点:一是人从来不是静止地被动地等待,而是主动对环境做试探;二是从环境对试探动作的反馈信号看,多数情况下是评价性(奖或罚)的,而不是像监督学习那样给出正确答案。生物在行动评价的环境中获得知识,改进行动方案以适应环境达到预想的目的。具有上述特点的学习就是强化学习(或称再励学习、评价学习,简记为RL)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈