首页 理论教育 机器学习分类方式与应用简介

机器学习分类方式与应用简介

时间:2023-06-23 理论教育 版权反馈
【摘要】:机器学习是人工智能学科的分支领域和重要研究方向,它包含着丰富的知识体系,因此,按照一定的规则对其进行细分显得尤为必要。机器学习的主要分类有两种:基于学习方式的分类和基于学习任务的分类。机器学习根据学习方式的不同,可分为监督学习、无监督学习和强化学习。但机器学习显然不可能仅从一张图中便习得准确辨识“猫”的技能。

机器学习分类方式与应用简介

机器学习人工智能学科的分支领域和重要研究方向,它包含着丰富的知识体系,因此,按照一定的规则对其进行细分显得尤为必要。机器学习的主要分类有两种:基于学习方式的分类和基于学习任务的分类。机器学习根据学习方式的不同,可分为监督学习、无监督学习和强化学习。根据学习任务的不同,可分为分类、回归、聚类和降维。不同的分类方式彼此又存在着联系,分类和回归属于监督学习,而聚类和降维属于无监督学习,如图2-34所示。

1.监督学习

监督学习的含义为利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。监督学习的主要目标是从有标签的训练数据中学到或者建立一个学习模型,以便对未知或未来的数据做出预测。图2-35所示简要总结了监督学习的工作流程。

图2-34 机器学习分类

图2-35 监督学习流程

对于机器学习来说,监督学习就是训练数据既有特征(feature)又有标签(label),通过训练,让机器可以自己找到特征和标签之间的联系。在面对只有特征没有标签的数据时,可以判断出标签。例如,高考前所做的练习题是有标准答案的。在学习的过程中,可以通过对照答案,来分析问题,找出方法,下一次在面对没有答案的问题时,往往也可以正确地解决。

在监督学习下,计算机就像一个“学生”,根据“老师”给出的带有标签的数据进行学习。如图2-36所示,老师告诉学生,图片里是一只猫,计算机便会总结图中“猫”的特征,并将符合这些特征的事物定义为“猫”。如果换一张不同的“猫”,计算机能够识别出这是一只“猫”,那么便可以说这是一次成功的标签分类。但机器学习显然不可能仅从一张图中便习得准确辨识“猫”的技能。计算机可能无法识别新的“猫”或者将其识别成其他动物,这时“老师”就会纠正计算机的偏差,并告诉计算机这个也是“猫”。通过大量的反复训练让计算机习得不同的“猫”具有的共同特征,这样,再遇到新的“猫”时,计算机就更可能给出正确的答案。

图2-36 监督学习举例

2.无监督学习(www.xing528.com)

现实生活中常常会遇到这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。很自然的,人们希望计算机能代替人工完成这些工作,或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称为无监督学习。在无监督学习中,建立机器学习模型的过程不依赖于标签训练数据,由于没有可用的标签,只能从得到的数据中提取需要的东西。假设想建立一个系统去把一组数据集分割成多个组,棘手的是不知道分离的标准是什么。因此,一个无监督学习算法需要将给定的数据集以尽可能好的方式进行分组。

简单来说,给定一批数据,但不告诉计算机这批数据是什么,让计算机自己通过学习构建出这批数据的模型,至于能学到什么,取决于数据自身所具备的特性。俗话说“物以类聚,人以群分”,可以将其看作是在“无监督学习”环境下构建模型的过程,一开始我们并不知道这些“类”和“群”中元素的标签,经过长期的归纳和总结,我们将具有共同特征的事物归为一个“类”或“群”中。以后再遇到新的事物,就根据它的特征更接近哪个“类”或“群”,就“预测”它属于哪个“类”或“群”,如图2-37所示,从而完成对新数据的“分类”或“分群”。与此同时,通过学习构建的模型也进一步完善。

图2-37 无监督学习举例

3.强化学习

强化学习(Reinforcement Learning,RL)又称为再励学习、评价学习,是一种通过模拟大脑神经细胞中的奖励信号来改善行为的机器学习方法,强调如何基于环境行为,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。强化学习计算模型也已经应用于机器人、分析预测等人工智能领域。

如图2-38所示,小孩子第一次见到火,来到火边,感受到温暖,觉得火是一个好东西;靠火太近被烫,又觉得火并不是那么好。然后得出一个结论:在火旁边是好的,靠得太近会被烫,这类似于人的自然活动。强化学习对类似的场景抽象出一套结构,如图2-39所示,其中大脑对应于智能体agent,地球对应于环境environment。强化学习核心思想是:智能体agent在环境environment中学习,根据环境的状态state,执行动作action,并根据环境的反馈reward(奖励)来指导更好的动作,是一种可以根据行为进行计算的学习方法。

图2-38 强化学习举例

图2-39 强化学习结构

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈