分类分析：基本概念探究

更新时间：2025-01-10 工作计划版权反馈

【摘要】：分类学习是类监督学习的问题，训练数据会包含其分类结果，根据分类结果可以分为以下几种。多标签分类问题:不同于前两者，多标签分类问题中一个样本可能有多个预测结果，或者有多个标签。非线性分类模型中的经典算法包括决策树、支持向量机、朴素贝叶斯和K近邻。二维码4－1决策树分类方法

分类学习是类监督学习的问题，训练数据会包含其分类结果，根据分类结果可以分为以下几种。

(1)二分类问题:是与非的判断，分类结果为两类，从中选择一个作为预测结果。

(2)多分类问题:分类结果为多个类别，从中选择一个作为预测结果。

(3)多标签分类问题:不同于前两者，多标签分类问题中一个样本可能有多个预测结果，或者有多个标签。多标签分类问题很常见，比如一部电影可以同时被分为动作片和犯罪片，一则新闻可以同时属于政治新闻和法律新闻等。

分类问题作为一个经典问题，有很多经典模型产生并被广泛应用。就模型本质所能解决问题的角度来说，模型可以分为线性分类模型和非线性分类模型。

线性分类模型中，假设特征与分类结果存在线性关系，通常将样本特征进行线性组合，表达形式如下:(www.xing528.com)

表达成向量形式如下:

式中，w＝(w1，w2，…，wd)。线性分类模型的算法是对w和b的学习，典型的算法包括逻辑回归(Logistic Regression)和线性判别分析(Linear Discriminant Analysis)。

当所给的样本线性不可分时，则需要非线性分类模型。非线性分类模型中的经典算法包括决策树(Decision Tree)、支持向量机(Spprp Veter Machine，SVM)、朴素贝叶斯(Naive Bayes)和K近邻(K－Neurest Neighbor，KNN)。

二维码4－1　决策树分类方法

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

工作思路