首页 理论教育 样品聚类分析(Q型聚类)实例应用

样品聚类分析(Q型聚类)实例应用

时间:2023-07-24 理论教育 版权反馈
【摘要】:例9.1现有青海省8 个地区牦牛成年体重、体长和体高数据见表9.1,试利用该牦牛的数据资料进行8 个地区间的牦牛的关系进行聚类分析。图9.4例9.1SAS 程序图例9.2现检测了6 个品系绵羊的4 个基因位点的基因型,并计算各位点等位基因A 的频率,数据见表9.2,试用类平均法对6 个品系绵羊品种间的关系进行聚类分析。

样品聚类分析(Q型聚类)实例应用

例9.1 现有青海省8 个地区牦牛成年体重(kg)、体长(cm)和体高(cm)数据见表9.1,试利用该牦牛的数据资料进行8 个地区间的牦牛的关系进行聚类分析

表9.1 青海省8 个地区牦牛体尺体重数据表

SAS 程序如图9.1 所示。

图9.1 例9.1SAS 程序图(1)

输出结果为:

输出结果主要包括:①协方差(相关)矩阵的特征值;②系统聚类过程;③系统聚类图。

1.协方差(相关)矩阵的特征值

本部分结果中给出的数据包括:特征值(Eigenvalue)、相邻两个特征值之差(Difference)、特征值占总方差的比例(Proportion)以及累计比例(Cumulative)。本例题中,第一特征值为14 390.305 6,占总方差的比例为0.994 3;第二特征值为64.484 4,占总方差的比例为0.004 5;第三特征值为185 448,占总方差的比例为0.001 3,3 个特征值占总方差的比例为1.000 0。

SAS 程序如图9.2 所示。

图9.2 例9.1SAS 程序图(2)

2.系统聚类过程

本部分给出了数据的聚类结果,从聚类过程可以看出,8 个地方牦牛聚为8 类,根据平均距离最短的原则首先将地区A 和地区F 聚类为CL7,其次将CL7 与地区H 聚类为CL6,在此将地区B 与地区D 聚类为CL5,以此类推,最后将CL3 与CL2 聚为一类。随着类别的合并,其平局距离逐渐增大。

SAS 程序如图9.3 所示。

图9.3 例9.1SAS 程序图(3)

3.系统聚类图

本部分根据上述聚类过程绘制出系统聚类图,从聚类结果可知,8 个地区牦牛被聚为3类,其中地区A、地区F 和地区H 聚为第一类,地区B、地区D 和地区C 聚为第二类,地区E 和地区G 聚为第三类,具体如图9.4 所示。

注:采用不同的聚类方法进行聚类分析时,聚类结果不完全一致,在实际分析中,需要结合专业知识和实际情况确定最终的聚类结果。

(www.xing528.com)

图9.4 例9.1SAS 程序图(4)

例9.2 现检测了6 个品系绵羊的4 个基因位点的基因型,并计算各位点等位基因A 的频率,数据见表9.2,试用类平均法对6 个品系绵羊品种间的关系进行聚类分析。

表9.2 6 个品系绵羊的4 个基因位点等位基因A 的频率数据表

SAS 程序如图9.5 所示。

图9.5 例9.2SAS 程序图(1)

输出结果为:

1.协方差(相关)矩阵的特征值

本部分结果:第一特征值为0.116 7,占总方差的比例为0.760 4;第二特征值为0.026 0,占总方差的比例为0.169 3;第三特征值为0.009 7,占总方差的比例为0.063 1;第四特征值为0.001 1,占总方差的比例为0.007 3,第一、二个特征值占总方差的累计比例为0.929 7。

SAS 程序如图9.6 所示。

图9.6 例9.2SAS 程序图(2)

2.系统聚类过程

本部分给出了数据的聚类结果,从聚类过程可以看出,6 个品系绵羊聚为5 类,根据平均距离最短的原则首先将品种D 和品种F 聚类为CL5,品种A 和品种E 聚类为CL4,品种B 和品种C 聚类为CL3,CL3 和CL5 聚为一类,CL4 和CL2 聚为一类,随着类别的合并,其平局距离逐渐增大。

SAS 程序如图9.7 所示。

图9.7 例9.2SAS 程序图(3)

3.系统聚类图

本部分根据上述聚类过程绘制出系统聚类图,从聚类结果可知,6 个品系绵羊被聚为3类,其中品系A 和品系E 聚为第一类,品系B 和品系C 聚为第二类,品系D 和品系F 聚为第三类,如图9.8 所示。

图9.8 例9.2SAS 程序图(4)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈