高维数据流形学习的目标函数及约束条件

时间：2026-01-27 理论教育眠眠版权反馈

【摘要】：在这样的约束条件下，需要怎样一个目标函数才能更好地“伸展”流形数据呢?图7-4欧氏距离与曲率关系图图7-4中，弧线AB1和弧线AB2的弧长是相等的，分别表示在两个不同流形上的测地距离。所以可以将最大化流形展开后点对之间的距离和作为目标函数。通过以上分析我们可以发现，目标函数有三个约束条件:中心化约束、局部等距离约束和对称半正定约束。

在前面的约束条件下，要求处于近邻关系的数据点在投影前后是等距的，并且消除了数据点的平移自由度。在这样的约束条件下，需要怎样一个目标函数才能更好地“伸展”流形数据呢?一般来说，在流形上任意两个数据点之间的折叠都能使这两个数据点之间的欧氏距离变小。也就是说，沿着流形这两个点之间的曲线的曲率越大，它们的欧氏距离就越小。图7-4是欧氏距离与曲率关系图。

图7-4　欧氏距离与曲率关系图

图7-4中，弧线AB1和弧线AB2的弧长是相等的，分别表示在两个不同流形上的测地距离。弧线AB1的曲率小于弧线AB2的曲率，从图中可以看出，曲率大对应的欧氏距离就小，曲率小对应的欧氏距离就大。欧氏距离与曲率的关系隐含着一种优化准则:如果一个流形展开后的点与点之间的欧氏距离越大，就意味着流形曲面的曲率越小，即这个流形越趋近于平坦，特别是当这些距离和趋近一个极限时，流形在低维空间对应的就是一个超平面，这时投影的效果最理想。所以可以将最大化流形展开后点对之间的距离和作为目标函数。也就是需要找到一个投影变换使得输出点对之间的距离平方和最大，即: