首页 理论教育 监督学习:算法及应用介绍

监督学习:算法及应用介绍

时间:2023-07-02 理论教育 版权反馈
【摘要】:监督学习的监督体现在提供给机器进行学习和训练的数据集上,数据集中的每个样本数据都有一个标签,就好比是给机器学习的数据既包括问题又包括问题的答案。等机器学习的模型建立好后,就可以用不带标签的数据测试它,看机器预测出来的鸢尾花品种和真实品种是否一致。监督学习有两个主要任务,即分类和回归。下面,将介绍常用的一些监督学习算法及其应用。

监督学习:算法及应用介绍

监督学习的监督体现在提供给机器进行学习和训练的数据集上,数据集中的每个样本数据都有一个标签,就好比是给机器学习的数据既包括问题又包括问题的答案。比如,鸢尾花数据集(iris dataset)是机器学习里被广泛使用的一个数据集,包含3个品种的鸢尾花4个属性的150条测量记录。4个属性分别是花萼的长、花萼的宽、花瓣的长和花瓣的宽。同时,该数据集中还记录了每条测量记录对应的是什么品种的鸢尾花。这样,在监督学习中,训练机器进行学习时,需要在提供给机器这些长和宽的测量数据的同时,告诉机器这些测量记录分别对应的是什么品种的鸢尾花。等机器学习的模型建立好后,就可以用不带标签的数据测试它,看机器预测出来的鸢尾花品种和真实品种是否一致。当你发现测试的结果还不错时,如果你看到一朵鸢尾花,只需要测量一下它的花萼和花瓣的长和宽,告诉机器,等机器输出了结果,你就知道这是哪个品种的鸢尾花了。

以上的例子还描述了监督学习的一个主要预测任务——分类(classification)。

监督学习有两个主要任务,即分类和回归(regression)。

分类是指机器能够指出输入是属于k个不同种类中的哪一类,用于离散型的预测。比如,预测某个股票是涨还是跌。有时,分类问题输出的是输入属于不同类别的概率分布。另外,像人脸识别之类的对象识别问题也可以归到分类问题。(www.xing528.com)

回归是指机器能够对给定的输入预测一个连续的、具体的数值。比如预测某个股票的价格、预测一个人的年龄、支付宝里为你给出芝麻信用分数等都属于回归问题。

下面,将介绍常用的一些监督学习算法及其应用。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈