1.基本概念
HMM是在马尔可夫链的基础之上发展起来的。由于实际问题比马尔可夫链模型所描述的更为复杂,观察到的事件并不是与状态一一对应的,而是通过一组概率分布相联系的,这样的模型就称为HMM。它是一个双重随机过程,其中之一是马尔可夫链,这是基本随机过程,它描述状态的转移。另一个随机过程描述状态和观察值,不像与马尔可夫链模型中的观察值和状态一一对应,因此不能直接看到状态,而是通过一个随机过程去感知状态的存在及特性。因而称之为“隐”马尔可夫模型(HMM)。
现在来看一个著名的说明HMM概念的例子——球和缸(Ball and Urn)实验。设有N个缸,每个缸中装有很多颜色的球,球的颜色由一组概率分布描述。实验是这样进行的,根据某个初始概率分布,随机地选择N个缸中的一个,例如第i个缸,再根据这个缸中彩色球颜色的概率分布,随机地选择一个球,记下球的颜色,记为O1,再把球放回缸中,又根据描述缸的转移的概率分布,随机选择下一个缸,例如,第j个缸,再从缸中随机选一个球,记下球的颜色,记为O2,一直进行下去。可以得到一个描述球的颜色的序列O1,O2,…,由于这是观察到的事件,因而称之为观察值序列。但缸之间的转移以及每次选取球的缸被隐藏起来了,并不能直接观察到。而且,从每个缸中选取球的颜色并不是与缸一一对应的,而是由该缸中彩球颜色概率分布随机决定的。此外,每次选取哪个缸,则由一组转移概率所决定。球与缸试验如图7-12所示。
图7-12 球和缸试验
2.定义
有了前面讨论的马尔可夫链以及球和缸的实验,就可以给出HMM的定义,或者说一个HMM可以由下列参数描述:
1)N:模型中马尔可夫链状态数目。记N个状态为θ1,…,θN,记t时刻马尔可夫链所处状态为qt,显然qt属于(θ1,θ2,…,θN)。在球与缸的实验中,缸就相当于状态。
2)M:每个状态对应的可能的观察值数目。记M个观察值为V1,…,VM,记t时刻观察到的观察值为Ot,其中Ot属于(V1,…,VM)。在球与缸的实验中,所选彩球的颜色,就是观察值。
3)π:初始状态概率向量,π=(π1,…,πN),其中
πi=P(q1=θi) 1≤i≤N (7-92)
在球与缸的实验中,指开始时选取某个缸的概率。(www.xing528.com)
4)A:状态转移概率矩阵,A=(aij)N×N,其中
aij=P(qt+1=θj|qt=θi) 1≤i;j≤N (7-93)
在球与缸的实验中,是指描述每次在当前选取的缸的条件下选取下一个缸的概率。
5)B:观察值概率矩阵,B=(bjk)N×M,其中
bjk=P(Ot=VK|qt=θj) 1≤j≤N;1≤k≤M (7-94)
在球与缸的实验中,bjk就是第j个缸中,球的颜色k出现的概率。
图7-13 HMM组成示意图
这样,可以记一个HMM为:λ=(N,M,π,A,B),或简写为λ=(π,A,B)。
更形象地说,HMM可分为两部分:一个是马尔可夫链,由π、A描述,产生的输出为状态序列;另一个是一个随机过程,由B描述,产生的输出为观察值序列,如图7-13所示。T为观察值时间长度。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。