【摘要】:分类学习是类监督学习的问题,训练数据会包含其分类结果,根据分类结果可以分为以下几种。多标签分类问题:不同于前两者,多标签分类问题中一个样本可能有多个预测结果,或者有多个标签。非线性分类模型中的经典算法包括决策树、支持向量机、朴素贝叶斯和K近邻。二维码4-1决策树分类方法
分类学习是类监督学习的问题,训练数据会包含其分类结果,根据分类结果可以分为以下几种。
(1)二分类问题:是与非的判断,分类结果为两类,从中选择一个作为预测结果。
(2)多分类问题:分类结果为多个类别,从中选择一个作为预测结果。
(3)多标签分类问题:不同于前两者,多标签分类问题中一个样本可能有多个预测结果,或者有多个标签。多标签分类问题很常见,比如一部电影可以同时被分为动作片和犯罪片,一则新闻可以同时属于政治新闻和法律新闻等。
分类问题作为一个经典问题,有很多经典模型产生并被广泛应用。就模型本质所能解决问题的角度来说,模型可以分为线性分类模型和非线性分类模型。
线性分类模型中,假设特征与分类结果存在线性关系,通常将样本特征进行线性组合,表达形式如下:(www.xing528.com)
表达成向量形式如下:
式中,w=(w1,w2,…,wd)。线性分类模型的算法是对w和b的学习,典型的算法包括逻辑回归(Logistic Regression)和线性判别分析(Linear Discriminant Analysis)。
当所给的样本线性不可分时,则需要非线性分类模型。非线性分类模型中的经典算法包括决策树(Decision Tree)、支持向量机(Spprp Veter Machine,SVM)、朴素贝叶斯(Naive Bayes)和K近邻(K-Neurest Neighbor,KNN)。
二维码4-1 决策树分类方法
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。