首页 理论教育 混合属性相异度的表征方法

混合属性相异度的表征方法

时间:2023-06-13 理论教育 版权反馈
【摘要】:数值型数据的相异度表示数值型数据的相异度使用如下加权闵可夫斯基距离表示当p=1时,为加权Manhattan距离;当p=2时,为加权Euclid距离。2)分类属性数据的相异度表示Euclid距离只能测算数值属性的数据,不能测算分类属性的数据,Ralambondramy提出可以用0或者1来表示分类属性的数据,下面对分类属性数据的相异度采用这种方法计算。若电压等级相同,则它们赋值的差为零,相异度记为0;若电压等级不同,则它们赋值后的差不为零,相异度记为1。

混合属性相异度的表征方法

1)数值型数据的相异度表示

数值型数据的相异度使用如下加权闵可夫斯基距离表示

当p=1时,为加权Manhattan距离;当p=2时,为加权Euclid距离。

2)分类属性数据的相异度表示

Euclid距离只能测算数值属性的数据,不能测算分类属性的数据,Ralambondramy提出可以用0或者1来表示分类属性的数据,下面对分类属性数据的相异度采用这种方法计算。 (www.xing528.com)

对于分类属性值相同的对其赋予相同的值,即对同为ui的值赋值为相同的ui*。例如电压等级有10kV、110kV、220kV、500kV4个属性值,则可以对10kV赋值为1,110kV赋值为2,220kV赋值为3,500kV赋值为4。若电压等级相同,则它们赋值的差为零,相异度记为0;若电压等级不同,则它们赋值后的差不为零,相异度记为1。记d*(ui*,uj*)=|ui*-uj*|,则

因此结合公式(9.1)和(9.2),混合类型的Xi和Pk之间的相异度定义为

其中,d1(Xi,Pk)属于数值型数据之间的距离;d2(Xi,Pk)属于分类属性数据之间的距离;ωp为各个标段划分影响属性的权值,权重越大,该属性对标段划分的影响越大。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈