首页 理论教育 高效热拌沥青混合料研究

高效热拌沥青混合料研究

时间:2026-01-26 理论教育 卡哇伊 版权反馈
【摘要】:2.类间距离测量类与类之间相似程度的测量使用类间距离,下面介绍3种常用类间距离,设两类样本点Gi和Gj,则:最短距离是将两类中距离最近的点之间的距离作为两类间距离。

系统聚类分析是一门多元统计分类法,根据多种地学要素对地理实体进行划分类别的方法。对不同的要素划分类别往往反映不同目标的等级序列,如土地分等定级、水土流失强度分级等。

系统聚类的步骤一般是首先根据一批数据或指标找出能度量这些数据或指标之间相似程度的统计量;然后以统计量作为划分类型的依据,把一些相似程度大的变量(或样品)首先聚合为一类,而把另一些相似程度较小的变量(或样品)聚合为另一类,直到所有的变量(或样品)都聚合完毕,最后根据各类之间的亲疏关系,逐步画成一张完整的分类系统图,又称谱系图。其相似程度由距离或者相似系数定义。进行类别合并的准则是使得类间差异最大,而类内差异最小。

特点:事先无须知道分类对象的分类结构,而只需要一批地理数据,然后选好分类统计量,并按一定的方法步骤进行计算,最后便能自然地、客观地得到一张完整的分类系统图。

1.样本点间距离的测量

在进行聚类分析时首先要求选择度量样本之间距离的方法,下面介绍一些常用度量样本点之间距离的方法。设有n个样本X1,X2,…,Xn,每个样本有p个指标Xi=(Xi1,Xi2,…,Xip),第i个样本的观测值为xi=(xi1,xi2,…,xip),Xi和Xj之间的距离记为dij,则常见的距离有:

在实际应用中,由于进行坐标轴正交旋转时欧式距离保持不变,所以常常选择欧式距离来测算样本间的相似程度。

注意:在用以上方法计算样本间距离时,由于样本的各指标可能具有不同性质的量纲(如长度、重量和体积等),或者虽然取相同性质的量纲,但数据相差悬殊,所以为了消除不同量级指标对距离的影响,常用的处理方法是:将每一指标的各样本值减去其均值后,再除以其标准差,即将所有的样本的各个指标的得分值变换为均值为0,标准差为1。

2.类间距离测量(https://www.xing528.com)

类与类之间相似程度的测量使用类间距离,下面介绍3种常用类间距离,设两类样本点Gi和Gj,则:

最短距离是将两类中距离最近的点之间的距离作为两类间距离。

最长距离是将两类中距离最远的点之间的距离作为两类间距离。

重心距离是将两类重心之间的距离作为两类间距离。设xi、xj为Gi与Gj的重心,则D3(i,j)=dij(xi,xj)。

3.系统聚类法的思想和计算过程

系统聚类法也称层次聚类,主要的方法有最短距离法、最长距离法和重心法等。这些方法的基本思想是一样,所不同的只是计算类间距时所选用的距离公式不一样,从而形成各种方法。下面介绍系统聚类法的基本思想和计算流程:①将n个样本分为n类,每类一个样本;②选择样本点间距离的计算方法,如绝对值距离或欧式距离;③选择类与类之间距离的计算方法,如最短距离、最长距离或重心距离;④选择距离最小的两类合并为一个新类,原来的n类减少到n-1类;⑤重复第四步,直到合并为一个大类为止;⑥划出分类图,并作出分析。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈