近似熵和样本熵都是衡量时间序列的复杂性的方法,但是二者的定义中两个向量的相似性都是基于单位阶跃函数而定义的,单位阶跃函数具备二态分类器的性质,若输入样本满足一定特性,则被判定属于一给定类,否则属于另一类。而在现实世界中,各个类之间的边缘往往较模糊,很难确定输入样本是否完全属于其中一类。陈伟婷等对样本熵进行了改进,提出了模糊熵(fuzzy entropy,FuzzyEn)的概念[173,186]。模糊熵的定义中采用模糊函数,并选择指数函数e-(d/r)n作为模糊函数来测度两个向量的相似性。指数函数具有特性:①连续性保证其值不会产生突变;②凸性保证了向量自身的自相似性值最大。
FuzzyEn的计算过程如下:
(1)对N点时间序列{u(i):1≤i≤N},按顺序建立m维向量:
(www.xing528.com)
模糊熵和样本熵物理意义相似,都是衡量时间序列在维数变化时产生新模式的概率的大小。序列产生新模式的概率越大,序列的复杂性程度越高,因此,熵值越大。模糊熵不仅具备了样本熵的特点:独立于数据长度(即计算所需数据短)和保持相对一致性,而且还具有比样本熵更优越之处:首先,样本熵使用单位阶跃函数,突变性较大,熵值缺乏连续性,对阈值的取值非常敏感,阈值的微弱变化就可能导致样本熵值的突变。而模糊熵用指数函数模糊化相似性度量公式,指数函数的连续性使得模糊熵值随参数变化而连续平滑变化。其次,在样本熵的定义中,向量的相似性由数据的绝对值差决定。当采用数据存在轻微波动或基线漂移时则得不到正确的分析结果。模糊熵则通过均值运算,除去了基线漂移的影响,且向量的相似性不再由绝对幅值差确定,而由指数函数确定的模糊函数形状决定,从而将相似性度量模糊化[173,187]。
为了比较样本熵和模糊熵,定义一个确定信号和一个随机信号的按不同概率组成的混合信号mix(N,p)。
其中,是)上的随机信号,N为数据长度,p∈[0,1]。考虑信号mix(200,0.1)与mix(200,0.3)二者的样本熵和模糊熵,为方便,分别记为:Samp En1,SampEn2,Fuzzy En1和FuzzyEn2,它们随相似容限r的变化关系如图6.6所示。
由图6.6可以看出,随着r的变化,样本熵波动较大,说明样本熵取值对r较敏感,而模糊熵随r变化而变化平稳,具有很好的稳定性和光滑性。同时,图6.6也说明了模糊熵具有相对一致性,即对于两个不同的过程A和B,若在任一参数p 1下成立:算法(p1)(A)≤算法(p1)(B),则对于所有参数p 2都应成立:算法(p2)(A)≤算法(p2)(B)。相对一致性是一个好的算法应具备的重要的性质。由于mix(200,0.3)噪声比率比mix(200,0.1)大,因此理论上前者的熵值应比后者大,而图6.5中FuzzyEn2>FuzzyEn1(对于相同r)正验证了这一点,这说明模糊熵具有很好的相对一致性[173]。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。