首页 理论教育 上证50样本股量价双指标曲线的聚类分析方法实例

上证50样本股量价双指标曲线的聚类分析方法实例

时间:2023-06-09 理论教育 版权反馈
【摘要】:函数型数据的进一步分析可以分为:探索性分析和实证性分析。函数型聚类分析用来挖掘函数型数据集中潜在的类结构,将分析对象组成由类似对象组成的多个类过程,使类内的对象具有相似的某种曲线变化模式,类间的对象具有相异的某种曲线变化模式。

上证50样本股量价双指标曲线的聚类分析方法实例

Robert等(2010)指出股市技术分析中最为重要的两个因素就是价格和成交量。因此课题组选择价格和成交量两个指标进行聚类分析

一、数据拟合

首先利用多指标面板数据的熵权法计算离散情形下两个指标的权重,然后选取基函数个数为K=10,15,20,25,30的情形,分别依据不同的K

值利用函数型熵权法计算出拟合后两条函数曲线之间的指标权重,具体权重如表5-2所示。

表5-2 不同K值下指标权重

从表5-2中能够看出,同样利用函数型熵权法,函数拟合时选用K值的不同会对指标权重产生微小的差异,而利用函数型熵权法计算的指标权重与利用传统离散情形的熵权法计算的指标权重有着较大的差异。具体使用哪种方式更加具有优势,需要进一步的分析。

为了进一步地体现函数型数据分析方法,课题组展现了所有股票的价格指标、成交量指标以及量价综合指标的离散折线以及K=10拟合的函数曲线,如图5-12所示。

二、聚类模型参数选择

聚类分析的相似性度量分别选择了第一节中实证效果较好的度量方式,具体包括基于采集的离散数据本身的距离度量D1,基于基函数本身的距离度量D2以及基于曲线极值点偏移补偿的相似性度量DX。其他参数选择不做变化。

三、聚类方法性能对比

从表5-2中能够看出,无论使用基于基函数本身距离度量的D2模型还是基于曲线极值点补偿的相似性度量DX模型,最终的聚类效果都比直接使用离散数据距离度量的D1模型要好,说明多指标函数型聚类同样延续了单指标函数型聚类的优点,在聚类的性能上都比离散的情形有所提高。

图5-12 所有股票离散情形和K=10拟合情形下价格、成交量以及综合指标图

表5-3 不同参数下不同模型的多指标聚类性能表

续 表(www.xing528.com)

四、一点说明

作为综合评价的最终目的——对被评价对象或系统进行排序或分类,函数型综合评价的任务远没有完成。作为函数型的评价结果在实际中往往有它特殊的含义。例如义乌小商品指数,消费者物价指数(CPI)等就是函数型综合评价结果,对于这些综合排序指数的函数型数据分析(FDA),为职能部门制订政策提供相应的理论依据显得尤为重要。

函数型数据分析的主要思想是将观测到的函数型数据看成一个整体而非个体观测值的一个集合,从而与多元数据分析大不相同。函数型数据的进一步分析可以分为:探索性分析和实证性分析。探索性分析包括主成分分析、聚类分析、典型相关分析等;实证分析包括函数线性模型等。其中,函数型主成分分析可以研究多个函数之间的联动性变动,探索数据集中少数几种最具影响或重要的变化模式,找出代表每个曲线的典型变化模式。函数型聚类分析用来挖掘函数型数据集中潜在的类结构,将分析对象组成由类似对象组成的多个类过程,使类内的对象具有相似的某种曲线变化模式,类间的对象具有相异的某种曲线变化模式。函数型典型相关分析用来探索两组相关曲线之间变化的关联形式,并可将这种思想用于最优得分和分类问题的研究。函数型线性模型是用一个或多个变量的变化去解释另一个函数的变化模式。

本书对评价函数做进一步的聚类分析方法研究提供了一个方向,希望能够给函数型综合评价方法研究提供自己的微薄之力。

【注释】

[1]图5-1用于比较不同K值的基函数拟合曲线的情形,并与离散的折线图对比。

[2]图中加粗的线代表该类别的中心曲线,其他线代表各样本曲线,第六类中只有一条线代表该类别中仅有一个样本,所以样本曲线与中心曲线重合。

[3]图5-9中绿色线代表样本曲线,蓝色线代表第二类中心曲线,黄色线代表第四类中心曲线,绿色线与黄色线在每张子图中都一条为实线一条为虚线,实线代表该线是子图中样本曲线最终被归属的类别中心曲线。

[4]图5-10中虚线代表子图中类别的中心曲线,实线代表子图中样本的曲线。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈