由式(9.1)可以得出,落入区域Sh 的采样点,有的距离x 较近,有的距离x 较远,但它们对最终的函数Mh(x)计算做出的贡献是一样的。距离x 越近的采样点,它对估计点x 周围的统计特性就越有效果,因此引进了核函数的概念。
令X 表示d 维空间中的向量,此空间中的一个点可以用向量x 表示,x 向量的模为:
用R 代表实数域,当X →R,k:0,[ ]∞→R 时存在一个剖面函数,可以表示为:
并且满足:
(1)k 是非负的,即k ≥0 。
(2)k 是分段连续的,并且
(3)当a <b 时,有k( a )≥k( b )。
(4)那么,函数K( x )就是Mean Shift 的核函数,k( x )是K( x )的轮廓函数。
(5)在计算Mh(x)时,如果考虑距离的影响,可以认为这些样本点xi 的重要性并不一样,对每个样本都引入一个权重系数,基本的Mean Shift 形式可以扩展为:
其中:(www.xing528.com)
G(x)是一个单位核函数,H 是一个带宽矩阵,w(xi)≥0 是赋给采样点xi 的权重。
均值漂移算法实质上是一种核密度估计算法,它将每一个点移动到密度函数为0 的点处,也就是局部极大值点处,这个点可以称为模式点。在式(9.8)和式(9.9)中,带宽矩阵H 一般定义为一个对角矩阵,正比于单位矩阵,用H = h2I 表示,因此式(9.8)又可以写成:
将x 提出,可得:
将式(9.11)的右边第一项记为mh( )x ,得:
如果给定一个核函数G( x )和初始点x,Mean Shift 算法循环一下三个步骤:(1)计算mh( x )的值。
(2)把mh( x )值赋给x。
(3)如果满足‖mh( x )- x‖ <ε,则结束循环;不满足,则执行(1)。
其中ε 为容许误差,Mean Shift 向量总是指向概率密度增大的方向。在特征点区域,向量的步长小;在非特征点区域,步长大。因此,Mean Shift 是一个自适应梯度上升算法。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。