【摘要】:从课题组第二章第一节中多指标数据的结构形式中能够看出,采集到的多指标函数型数据实则是离散的多指标面板数据的形式。本节将从多指标面板数据的聚类分析方法出发,研究多指标函数型数据的聚类分析。在传统的多指标面板数据聚类分析中,对于多指标的聚类,核心的思想就是将多个指标通过一定的方式综合为一个指标,然后利用单指标聚类的方法进行聚类。
与单指标聚类分析相比,多指标聚类分析能够更加全面地反映数据信息,更加充分地体现数据特征。在实际应用中,人们往往会从多方面来考虑一个问题。同样以金融股票市场为例,投资者对股票进行分类时通常以收盘价作为最核心的指标,但是此外股票的开盘价、最高价、最低价、成交量、标的公司的业绩等一系列因素也会影响投资者决策。使用单个指标进行分析相对简单,而多指标的数据结构相对较为复杂,聚类过程会涉及指标重要性不同、指标相关性等一系列问题。
从课题组第二章第一节中多指标数据的结构形式中能够看出,采集到的多指标函数型数据实则是离散的多指标面板数据的形式。假设共有n个样本,p个指标,xij(t)表示指标j下样本i的拟合曲线,xij(tk)表示指标j下样本i在tk时间点上的观测值。本节将从多指标面板数据的聚类分析方法出发,研究多指标函数型数据的聚类分析。
在传统的多指标面板数据聚类分析中,对于多指标的聚类,核心的思想就是将多个指标通过一定的方式综合为一个指标,然后利用单指标聚类的方法进行聚类。对于多指标的综合是将面板数据按照时间维度分离出一个个的由样本和指标构成的横截面,然后利用主成分分析法对横截面数据进行传统的多指标综合,从而求得每个时间点上各样本的综合指标值,即(www.xing528.com)
这种方式相当于认定权数具有时序性,在不同的时间节点,各指标权数不同。另一种方式是认为权数仅反映指标重要性的差别,认为一段时间内这种重要性的差别不会发生很大的变化,从而对每个指标在时间维度上进行预处理,采用均值法或其他方法将整个时间区间退化为某一个抽象时间节点ts的数据,再求得综合指标值,即
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。