【摘要】:度量学习是一种数据依赖的度量,学习到的度量能够鉴别样本不同属性的重要性,从而更精确地描述样本之间的相似程度。但是,距离度量学习依然存在以下几个方面的难点:如何定义类内距离和类间距离。如何处理度量的半正定约束。为了满足度量的完备性,一个合适的度量应该具备半正定特性约束,而约束会导致优化问题的高计算复杂度和难以解决。
度量学习是一种数据依赖的度量,学习到的度量能够鉴别样本不同属性的重要性,从而更精确地描述样本之间的相似程度。如图5-1所示,使用不同的度量可以使用同样的数据样本完成不同的分类任务,度量学习的目标就是减小类内距离的同时,尽可能增大类间距离。与传统的距离度量函数相比,度量学习在解决计算机视觉任务时,具有不需要归一化处理、实现维度降低、泛化能力强等优点,可以显著提高学习器的性能。
图5-1 距离度量学习的本质
度量学习提供了一种基于数据分析的距离度量方法,与人工设计的距离度量方式相比,这种通过学习得到的度量模型能够克服人工设计度量函数的问题,具有更强的适应性,在解决计算机视觉任务时具有重要的实际意义。但是,距离度量学习依然存在以下几个方面的难点:(www.xing528.com)
(1)如何定义类内距离和类间距离。一个理想的度量是在类内距离最小化和类间距离最大化的约束下学习的,因此类内距离和类间距离的定义对于度量学习至关重要。
(2)如何处理度量的半正定约束。为了满足度量的完备性,一个合适的度量应该具备半正定特性约束,而约束会导致优化问题的高计算复杂度和难以解决。
(3)如何最大限度降低计算复杂度。在距离相关方法中,成对距离运算带来高额计算代价,无疑会影响到算法的实时性。
(4)如何将度量学习引入特定应用,比如针对多实例学习、多视角学习、多标签学习等,以解决更复杂的任务。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。