首页 理论教育 多指标函数型数据的聚类分析方法

多指标函数型数据的聚类分析方法

时间:2023-06-09 理论教育 版权反馈
【摘要】:许多学者将主成分分析拓展至函数型数据领域并应用于函数型聚类分析,也有将传统的拉开档次法拓展至函数领域。熵权法是利用指标的变异性进行定权的一种指标综合方法。

多指标函数型数据的聚类分析方法

一、引言

依据多指标面板数据聚类的思想,多指标函数型数据聚类分析的核心也在于指标的综合。在对多指标函数型数据进行聚类分析时,一种简便的方法是首先对函数型数据的观测值进行离散形式的多指标综合处理,然后对处理后的数据进行函数型分析,这种多指标函数型数据的聚类分析方法在进行指标综合过程中,会流失部分数据的函数特性。另一种更加合理的方式是先对函数型数据进行拟合,提取函数特征曲线,然后将函数曲线视作整体进行多指标综合。与多指标面板数据不同的是,函数型数据在进行指标综合的过程中,数据是以函数曲线的形式存在的,不能像多指标面板数据一样将数据视作多个横截面的叠加,而且函数视角下连续时间的权重是难以衡量的,因此通常不考虑权重的时序性,求得综合指标值,即

基于这种思想,可以将多指标面板数据指标综合方法拓展至函数型数据。许多学者将主成分分析拓展至函数型数据领域并应用于函数型聚类分析,也有将传统的拉开档次法拓展至函数领域。课题组将熵权法拓展至函数领域。

熵权法是利用指标的变异性进行定权的一种指标综合方法。熵是一种对系统状态不确定性的度量方法,被评价指标的熵值越小,则说明该指标的变异水平越高,提供的信息量也越大,在综合评价时所起作用也越大,权重相应越大;反之,评价指标提供的信息量越少,则权重也相应越小。

二、函数型数据的熵权法

(一)基于横截面数据的熵权法

第一步:指标正向化处理。

第二步:计算第i项指标的第j个样本占该指标的比重。

第三步:计算第j项指标的熵值。

第四步:计算指标权重。

(二)基于多指标面板数据的熵权法 (www.xing528.com)

在多指标面板数据中,通常在计算第i项指标的第j个样本占该指标的比重时,样本不是一个单一的值,而是一个由多个时间点构成的一维向量,此时传统的熵权法无法直接使用,需要新的比重计算方式。

第一步:指标正向化处理。

第二步:计算第i项指标的第j个样本在观测点tk的值占该指标的比重。

第三步:计算第j项指标的熵值。

第四步:计算指标权重。

(三)基于函数型数据的熵权法

由于函数型数据多指标综合的对象是一个函数,因此在计算第i项指标的第j个样本占该指标的比重时,应当将所有的数据点视为一个整体,因此基于离散数据的熵权法中基于点值的计算方式不再适用于函数型数据。利用函数型熵值法求权重的具体过程如下。

第一步:数据预处理。对数据进行正向化处理,然后进行基函数拟合。第二步:计算第i项指标的第j个样本占该指标的比重函数。

第三步:计算第j项指标的熵值和变异程度。

第四步:计算指标权重。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈