首页 理论教育 特征数量提取、选择和识别

特征数量提取、选择和识别

时间:2023-06-28 理论教育 版权反馈
【摘要】:7.4.2.2基于拉普拉斯分值的特征选择以上提取的故障特征虽然能够从不同的角度来反映故障程度和类型,但是它们对于不同的故障具有不同的敏感程度,一部分特征与故障密切相关,另一部分则是无关或者冗余的特征;如果将上述提取的全部特征值作为特征值,则特征向量维数过高,易造成信息的冗余和分类耗时。

特征数量提取、选择和识别

7.4.2.1 特征量的提取

由于不同故障的振动信号的特征不同,并非分解得到的所有分量都对故障诊断有贡献,故障特征分量只集中在某一个或特定的几个分量,而其他的分量对故障的诊断贡献不大,将其作为特征参数势必会造成信息的冗余;不仅如此,由于滚动轴承振动信号特征的复杂性,基于单一时域或频域特征提取方法有一定的局限性,需要同时提取振动信号的时域和频域特征。雷亚国等在文献[244]中同时提取IMF分量的时域和频域特征:标准差,峭度,波形指标,冲击指标和频率标准差等,具有很好的诊断效果。然而,提取特征因子过多会导致特征向量维数较高,影响故障诊断的速度和效率。因此,本节选择如下特征值,时域:峭度(kurtosis,KS),波形指标(shape factor,SF),冲击指标(impact factor,IF),模糊熵(fuzzy entropy,FE);频域:重心频率(frequency gravity,FG),频率标准差(FSTD),频率均方根(FRMS),时频域:时频熵(time frequency entropy,TFE)。对上述特征值的物理意义作如下说明:时域特征(峭度,波形指标,冲击指标)和频域特征(重心频率,频率标准差,频率均方根等)是基于统计学的特征物理量,反映了振动信号时域和频域的幅值和能量以及波动情况的变化,当振动信号发生变化时,这些特征能够从时域和频域同时准确地监测到,因此它们能够有效地表征机械振动信号的故障特征[217,220,249,250]。模糊熵与样本熵类似,是一种衡量时间序列复杂性程度的非线性动力学参数,时间序列越复杂,自相似性越低,熵值越大,序列越规则,自相似性越高,熵值越小。但模糊熵中相似性度量函数采用模糊函数取代样本熵中的阶跃函数,使得熵值随参数的不同而平缓变化。此外,当机械设备出现故障时,不仅振动信号的时域和频域特征会发生变化,而且时频联合分布和能量特征往往也会发生变化,不同故障类型振动信号在时频分布上的差异也不相同,主要表现为时频平面上不同的时频块的能量分布的差异,各时频块能量分布的均匀性则反映了机器运行状态的差别。信息熵是概率分布均匀程度的度量,若将时频平面等分为N个面积相等的时频块,每块内的能量为Ei(i=1,2,…,N),整个时频平面的能量为对每块进行能量归一化,得pi=Ei/E,于是有,符合信息熵的初始归一化条件,依据信息熵的计算公式,时频熵可定义为:

综上,本节提取振动信号分解分量具有物理意义的时域和频域统计特征和复杂度,以及振动信号的时频熵,从时域和频域以及时频联合域共同监测振动信号的能量、幅值和复杂度的变化,及时和准确地从多个角度反映振动信号故障变化特征。

7.4.2.2 基于拉普拉斯分值的特征选择

以上提取的故障特征虽然能够从不同的角度来反映故障程度和类型,但是它们对于不同的故障具有不同的敏感程度,一部分特征与故障密切相关,另一部分则是无关或者冗余的特征;如果将上述提取的全部特征值作为特征值,则特征向量维数过高,易造成信息的冗余和分类耗时。因此,在特征向量集输入分类器之前,如果能够将上述特征量,按照与故障密切相关程度从高到低进行排序,再采用与故障特征相关程度较高的特征量进行训练和测试,不但可以提高分类的性能,避免维数灾难,而且更能够提高故障诊断的速度和效率。

特征选择与降维方法有很多,特征提取的方法总体分为两大类:过滤式和嵌入式[251]。过滤式是指特征提取的算法与分类器的训练算法无关,而嵌入式是指特征提取的算法与分类器的训练算法直接相关。一般而言,过滤式的方法容易执行且运行效率高,而嵌入式的方法选出的特征向量虽然可靠,但是计算量非常大[251]

费舍尔分值(fisher score,FS)是一种特征向量定长转换的过滤式特征选择方法[252,253],核心思想是将一个可变长度的向量映射到一个固定维空间,在这个空间向量的长度是相等的。FS的原理是通过估计每个特征向量对不同类属性的区分能力,从而得出所有特征的排序。但是FS中每个特征向量的重要性只是由均值和方差的比值来衡量,对于一些高维的数据集,FS特征选取的效果并不可靠[251]

拉普拉斯特征映射(Laplacian eigenmaps,LE)是用一个无向有权图来描述一个流形[254,255],然后通过用图的嵌入把这个图从高维空间中重新画在一个低维空间中,LE通过直接对原始高维特征进行学习,提取数据内在的流形特征,将复杂的模式空间转化为低维的特征空间,在特征空间中进行模式分类,LE很好地反映出了数据内在的流形结构和保留了数据内含的整体几何结构信息。但是其适用性依赖于具体的问题,而且还存在算法控制参数的有效确定,样本流形特征的物理意义难以解释等问题。

拉普拉斯分值(Laplacian score,LS)以拉普拉斯特征值映射和局部保持投影为基础[248],是一种将复杂的高维特征空间转化为简单的低维特征空间的方法,其基本思想是通过局部保持能力来评估特征值,通过直接对特征集进行学习,提取数据内在的信息结构,在特征空间中选取分值较小的特征。LS可以极大地保留故障信号特征集合中内含的整体几何结构信息,从而更有利于故障判别与诊断。

基于LS的特征选择步骤如下[247,248]

令Lr为第r个特征值的拉普拉斯分值,fri为第i个样本的第r个特征值(i=1,2,…,m)。(www.xing528.com)

(1)用m个样本点构建一个近邻图G,第i个节点对应xi。若xi与xj足够“近”,比如,xi是xj的k近邻节点或者xj是xi的k近邻节点(本节中k=5),则有边连接,否则没有边连接。当节点的标号已知时,可以在同一标号的两节点之间连接一条边。

(2)如果节点i与节点j是连通的,则令

其中t是一个合适的常数;否则,令Sij=0。

加权矩阵S称为图G的相似矩阵,用来衡量近邻样本点之间的相似性,描述了数据空间的固有局部几何结构。

(3)对于第r个特征,定义

矩阵L称为图的拉普拉斯矩阵。为了避免由于某些维度数据差异很大而主导近邻图的构造,对各个特征进行去均值化处理得到:

(4)计算第r个特征值的拉普拉斯分值Lr

其中,Var(fr)为第r个特征值的方差。对于一个较好的特征值,Sij越大,(fri-frj2越小,LS也越小,表明样本在该特征上的差异越小,即该特征的局部信息保持能力越强。计算每一个特征值的得分,并对这些特征值的得分从低到高进行排序,排在越前的特征越重要。特征得分与特征重要性成反比,特征得分越低,该特征越具有特征选择的重要性。拉普拉斯分值选取Lr值最小的前若干个特征值作为最优的特征选择结果。因此,本节LS选择与故障特征信息最相关的特征值。

接下来,需要采用合适的模式识别的方法对故障类型和故障程度进行分类,以减少人为经验的影响和实现故障类别的智能诊断。VPMCD基于假设特征值之间存在内在关系建立数学模型,针对不同的类别获得不同的数学模型,采用数学模型对特征值进行预测,把预测结果作为分类的依据,进一步进行分类识别。VPMCD无需事先选择参数,避免了神经网络的迭代和SVM的寻优过程,减少了计算量,是一种有效的分类方法。基于此,本节提出了一种基于PELCD,LS和VPMCD的滚动轴承故障诊断方法,并通过实验数据验证了方法的有效性。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈