对于机器学习,根据不同的方式会有不同的分类,可以按照学习策略进行分类,也可以按照所获取知识的表示形式进行分类,或者按照机器学习的算法类似性进行分类等。在这里我们是按照机器学习的学习方式进行分类,这种分类方式常常是人们在机器学习或者人工智能领域首先考虑到的分类方式。这是因为考虑到数据类型的不同,对一个问题的建模有不同的方式。这样的分类可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。
按照学习方式我们将机器学习分成监督学习、非监督学习、半监督学习和强化学习四类,下面针对每一种学习方式做一下简单的介绍。
1.监督学习
监督学习(Supervised Learning)是从给定的训练数据集(在监督学习中,输入数据被称为训练数据)中学习一个函数(模型),当新的数据到来时,可以根据这个函数(模型)预测结果。监督学习的训练集要求包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注(标量)的。例如现在有一批训练数据,其中每组训练数据有一个明确的标识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,或者是对手写数字识别中的“1”,“2”,“3”,“4”等。在建立预测模型的时候,监督式学习建立一个学习过程,将预测结果与训练数据的实际结果进行比较,不断地调整预测模型,直到模型的预测结果达到一个预期的准确率。监督式学习的常见应用场景如分类问题和回归问题。常见算法有逻辑回归(Logistic Regression)和反向传递神经网络(Back Propagation Neural Network)。
2.非监督学习(www.xing528.com)
非监督学习(Unsupervised Learning),也叫无监督学习。与监督学习相比,非监督学习用到的训练集没有人为标注的结果。在非监督学习中,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构,这听起来似乎有点不可思议,但是在我们自身认识世界的过程中很多地方都用到了非监督学习。比如我们去参观一个画展,我们完全对艺术一无所知,但是欣赏完多幅作品之后,我们也能把它们分成不同的派别(比如哪些更朦胧一点,哪些更写实一些,即使我们不知道什么叫作朦胧派,什么叫作写实派,但是至少我们能把他们分为两个类)。非监督学习常见的应用场景包括关联规则的学习以及聚类等。常见的算法包括Apriori算法和k-Means算法。这类学习的目标不是让效用函数最大化,而是找到训练数据中的近似点。图9-2展示的是以R语言内建的鸢尾花数据集进行聚类分析然后画出散点图的例子,其中petal width表示花瓣宽度,petal length表示花瓣长度,sepal length表示花萼长度。
3.半监督学习
半监督学习(Semi-Supervised Learning)是介于监督学习与非监督学习之间一种机器学习方式,是模式识别和机器学习领域研究的重点问题,它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。传统的机器学习技术分为监督学习和非监督学习两类。监督学习则只利用标记的样本集进行学习,而非监督学习只利用未标记的样本集。但在很多实际问题中,只有少量的带有标记的数据,因为对数据进行标记的代价有时很高,比如在生物学中,对某种蛋白质的结构分析或者功能鉴定,可能会花上生物学家很多年的工作,而大量的未标记的数据却很容易得到。这就促使能同时利用标记样本和未标记样本的半监督学习技术迅速发展起来。半监督学习对于减少标注代价,提高学习机器性能具有非常大的实际意义。它的主要算法有五大类:基于概率的算法;在现有监督算法基础上作修改的算法;直接依赖于聚类假设的算法;基于多视图的算法;基于图的算法。
4.强化学习
强化学习(Reinforcement Learning),又称再励学习,评价学习。通过观察来学习如何完成动作,每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。在这种学习模式下,输入数据作为对模型的反馈,不像监督模型那样输入数据仅仅作为一个检查模型对错的方式。在强化学习下,输入数据直接反馈到模型,模型必须对此立刻做出调整。目前强化学习在很多领域已经成功获得应用,比如自动直升机,机器人控制,手机网络路由,市场决策,工业控制,高效网页索引等。常见的强化学习算法包括Q-Learning以及时间差学习(Temporal difference learning)。
最后我们总结一下各种学习方式目前的主要应用场景:在企业数据应用的场景中,人们最常用的可能就是监督式学习和非监督式学习的模型;在图像识别等领域,由于存在大量的非标识的数据和少量的可标识数据,目前半监督式学习是一个很热的话题;而强化学习更多的应用在机器人控制及其他需要进行系统控制的领域。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。