【摘要】:与欧氏距离相比,马氏距离不仅能够结合数据的统计特性,还能兼顾样本间的相关性,且满足尺度无关性质。可见,基于马氏距离的度量学习的目的就是对于给定的训练样本集X,求取一个半正定对称矩阵M,用来建立起样本的特征向量之间的联系,使得训练样本之间的相似关系得到保留。
Xing等人(2002)提出一种典型的基于Mahalanobis的距离度量学习方法。马氏距离(Mahalanobis distance)是印度统计学家马哈拉诺比斯在1936年引入的距离度量,表示数据的协方差距离,是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离相比,马氏距离不仅能够结合数据的统计特性,还能兼顾样本间的相关性,且满足尺度无关性质。基于马氏距离的度量学习的基本思想是:根据特定的问题,通过样本训练寻找一个合适的度量矩阵M,使得样本之间的距离函数可以表示为下式:
它使用成对约束集合作为训练样本的约束条件,将优化目标选为最小化所有在等价约束集合中的样本对的距离,并保证在不等价约束集合中的样本对保持一定的距离,由此构造了如下凸优化问题:(www.xing528.com)
式中,M为半正定矩阵;S表示同类别样本构成的成对约束集,S={(xi,xj):xi和xj是相似的};D表示不同类别样本构成的成对约束集,D={(xi,xj):xi和xj是不相似的}。该算法应用于聚类问题取得了明显的效果[8]。可见,基于马氏距离的度量学习的目的就是对于给定的训练样本集X,求取一个半正定对称矩阵M,用来建立起样本的特征向量之间的联系,使得训练样本之间的相似关系得到保留。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。