在离散HMM参数学习过程中,所需的训练参数为一有限集,而通过RTCP获得的网络的丢包率p为一采样间隔极小的变量,近似为一连续变量。为适合离散HMM建模,获得能表示较大时间间隔内的丢包率,首先将p进行量化,即将p划分为离散区间,与HMM的每一个观测值相对应。事实上,这个过程是一个聚类操作。模糊C均值聚类(Fuzzy C-Means clustering,FCM)作为一种基于目标函数最优的聚类算法,采用最大隶属度原则进行分类,可使不同类之间的相似度最大,同一类之间的相似度最小[8-9]。由于其算法复杂度较低,收敛速度快,故采用模糊C均值聚类算法对p进行量化。
设有n 个p的样本集X={x1,x2,x3…xn},划分为C类,μij为隶属函数,表示第j个样本隶属于第i类的隶属度,对任意j∈(1,n)有
则FCM的目标函数为
其中,V=(V1,V2,…,VC)为聚类中心,U为隶属矩阵,
为参数p的样本到聚类中心的欧氏距离。m为权重指数,且m>=1。考虑到对p的分类的模糊程度不宜过高,取m的值为2。为计算E(U,V)的极小值,采用拉格朗日乘数法构造目标函数:
从而可得
根据p的样本集X,类别数C及式(3.24)~(3.28),对丢包率p进行模糊C均值聚类,可得U及V。算法实现步骤如下:(https://www.xing528.com)
(1)对隶属函数μij⊂[0,1]进行初始化并满足式(3.24),ω赋初值为10-4;
(2)根据式(3.25)计算出C个聚类中心;
(3)计算E(U,V),其值如果小于ω或与上次计算的E(U,V)值之差小于ω,则终止;
(4)根据式(3.28)计算出新的μij,并转到(2)。
考虑到在视频传输过程中对预测算法的实时性要求较高,聚类的类数C不宜过大,否则会增加算法复杂度。但过小的C也会降低量化精度,对此,文献[10]对量化精度及算法复杂度进行了分析和实验,按照该文献给出的结论,本书将C初始化为15,以在保证实时性的同时获得较高的量化精度。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
