聚类分析是数据挖掘在实际应用中的主要方法之一。在聚类算法中,将数据或者对象的集合划分成不同的簇(或者成为聚类集合),每一个簇(聚类)中的数据或者对象拥有较高的相似性,而不同的簇(聚类)中数据或者对象具有较大的差异性。聚类的目标就是依照某种特定相似度量对数据或者对象进行划分。聚类分析不仅能够根据数据对象的属性变化发现数据对象间的相似性,而且也能发现数据对象之间的相异性,目前已应用至计算机科学、统计学、商务、生物学、经济学等多研究领域。本章采用聚类分析的意图在于,通过对各样本院校在不同指标体系所表现出的学生支持体系建设的相似性和相异性,分析异同产生的原因,为院校学生工作的完善提供更多的科学依据。
各种划分聚类的方法各有特点。本研究所采用的K-means聚类算法属于硬聚类,即任一样本只能属于某一类,非此即彼。K-Means聚类算法是在欧几里得空间里把n个数据对象组织分为K个划分(K≤n),每个划分分别代表一个簇。首先,由用户输入所要聚类的数目K,并通过某种初始中心策略初始选择K个对象作为聚类中心,对剩余的每个对象,根据其与各中心的距离将它置于最近的类中。然后,重新计算每个类中数据对象的平均值形成新的聚类中心。这个过程重复迭代进行,直到聚类结果收敛为止(黄震华,向阳,张波,等,2016)。目前这种方法被广泛应用于大量数据的快速聚类。
本研究设定聚类目标为4,采用迭代与分类的方法进行分析,得到四类院校分类。
院校类型1总计19所,约占样本院校总体的24%,是四类院校中学生支持体系建设较为完善的院校。其学生支持体系的特征在于,社团活动、硬件设施、制度建设三个维度的因子得分皆为正值,反映了该类院校在上述三方面的充足性。但该类院校也存在较为明显的缺陷,即在提供新生适应和职业发展规划方面,相应的课程建设与指导服务存在不足。(www.xing528.com)
相比于院校类型1,院校类型2的学生支持体系建设的完善程度略有降低。其特征表现在虽然在学生课程学习的灵活性和辅助性制度建设、学生的适应指导服务提供方面表现出一定的优势,但在社团活动平台和相关硬件设施建设方面存在明显欠缺。这类院校总计6所,仅占样本总体的7.5%。
院校类型3总计20所,占总体的25%。这类院校的学生支持体系建设的优势集中体现在学生社团活动平台方面,但在硬件设施和适应指导方面则存在明显不足,即便在制度建设方面,其因子得分均值接近0,并未体现出明显优势。
院校类型4目前最为普遍,总计35所,占总体的44%。这类院校的学生支持体系建设在四类院校中最为薄弱,特别是社团活动、硬件设施、制度建设方面存在明显差距。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。