首页 理论教育 如何优化密度窗宽参数?

如何优化密度窗宽参数?

时间:2023-07-02 理论教育 版权反馈
【摘要】:研究表明,密度窗宽是求解局部密度的窗口半径,是由样本数据本身特性确定的局部宽度参数,也是数据分类的尺度,当点间距离小于或等于密度窗宽时则按类内计算,否则按另类计算,从而达到分类的目的。下面将从模型的数学构造来深入研究密度窗宽的特性及合理取值。图7-8投影特征值随密度窗宽变化关系(m=4)综上所述,可进一步缩小密度窗宽的取值范围,在实际运算中可取图7-9投影特征值随密度窗宽变化关系(m=8)

如何优化密度窗宽参数?

研究表明,密度窗宽是求解局部密度的窗口半径,是由样本数据本身特性确定的局部宽度参数,也是数据分类的尺度,当点间距离小于或等于密度窗宽时则按类内计算,否则按另类计算,从而达到分类的目的。它的取值既要使包含在窗口内的样本点平均个数不太少,以避免滑动平均偏差太大,又不能使它随样本个数的增大而增加太高[1]。对于某一样本群体,要得到合理的分类结果就必须选择合理的密度窗宽。从另一角度分析,在一定范围内不同的密度窗宽取值必然得到不同的投影方向向量,也就是从不同方向观测数据样本所暴露的特性,就有可能得到不同的结果,我们希望找出最能反应样本重要特征的最优投影方向。因此,密度窗宽的取值在投影寻踪聚类模型中非常关键,它的取值合理与否直接关系到样本分类结果的合理与否。

同时,对于不同的问题密度窗宽的取值也不相同,关于这方面的研究较少,目前大多是通过试算来确定,或通过样本投影值标准差的10%进行取值计算[1],但都缺乏理论依据,不便于模型在实际工程中推广应用。下面将从模型的数学构造来深入研究密度窗宽的特性及合理取值。

表7-5和表7-6给出了两组关于投影特征值随密度窗宽取值不同的变化情况,从表中投影特征值的变化特性可以看出,当密度窗宽较小时,投影特征值随密度窗宽的增大变化幅度较大,但当密度窗宽取值增大到一定程度时,投影特征值却趋于稳定,投影特征值再不随密度窗宽的增大而变化。这一现象说明密度窗宽的取值是有一定的下限,只要其取值大于某一数值时,投影特征值的大小将不再受密度窗宽取值不同的影响,评价结果自然也就再不会随密度窗宽的不同而发生变化。

表7-5 投影特征值及投影分量值随密度窗宽的变化

表7-6 投影特征值及投影分量值随密度窗宽的变化

由于R>0,且当i=k时有(R-rik)f(R-rik)=R,同时rik=rki,于是可将式(7-49)整理如下

图7-8 投影特征值随密度窗宽变化关系(m=4)

综上所述,可进一步缩小密度窗宽的取值范围,在实际运算中可取

图7-9 投影特征值随密度窗宽变化关系(m=8)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈