首页 理论教育 基于大数据挖掘的犯罪预测:5.6.2 聚类分析方法

基于大数据挖掘的犯罪预测:5.6.2 聚类分析方法

时间:2023-07-31 理论教育 版权反馈
【摘要】:常用的聚类分析算法主要包括层次聚类分析、划分聚类分析、密度聚类分析、模式聚类分析等。如果数据点的分布为任意形状,则应考虑到所获得数据的紧密程度,使用基于密度的聚类分析法,从而可以得到任意形状的聚类。在本节中,我们主要介绍划分聚类分析方法,代表性的算法主要有K-均值和K-中心点算法。

基于大数据挖掘的犯罪预测:5.6.2 聚类分析方法

常用的聚类分析算法主要包括层次聚类分析、划分聚类分析、密度聚类分析、模式聚类分析等。

1.层次聚类分析

层次聚类分析是对数据点进行层次的聚类,用树形图表示各个聚类中所包含的数据点,树形图的根节点仅包含单一聚类,代表所有数据点均落在同一聚类中,而树形图中的叶节点都各自为单一聚类,代表各数据点均为独立聚类。

层次聚类分群方式可以分为凝聚和分裂两种,前者是由下而上,先将各样本点视为单独的聚类,在后面的步骤中将相似的聚类合并,直到所有的数据点均合并到同一聚类中或达到所规定的停止条件为止;后者是由上而下,一开始先将所有数据点为一个大聚类,在后面的步骤中,从原有的聚类中依据相异度的差异分裂为两个较小的聚类,直到每个数据点各自成为一个独立的聚类或达到所规定的停止条件为止。

2.划分聚类分析

划分聚类是先选择数个不同的聚类中心点,每一个数据点只会被分到一个聚类。首先,所有样本数据点均计算与每个中心点的距离或相似度,然后依据最小距离或相似度的结果划分到某个聚类,通常以平方误差作为度量结果,具有最小平方误差的划分即为最终的分群。(www.xing528.com)

3.密度聚类分析

层次聚类分析和划分聚类分析大多以数据点或聚类间的距离作为分群依据,然而,这样的度量尺度只能得到球状的分群结果。如果数据点的分布为任意形状,则应考虑到所获得数据的紧密程度,使用基于密度的聚类分析法,从而可以得到任意形状的聚类。

4.模式聚类分析

以模式为基础的聚类分析是将数据点根据模型予以匹配而产生聚类。

在本节中,我们主要介绍划分聚类分析方法,代表性的算法主要有K-均值(K-means)和K-中心点(K-medoids)算法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈