首页 理论教育 频域特征分析:声音中的重要指标

频域特征分析:声音中的重要指标

时间:2023-07-02 理论教育 版权反馈
【摘要】:声音是由不同频率、不同能量幅度的声波构成的。频域特征是声音的重要特征之一。音频的时域特征分析是以某个时刻信号能量大小为依据的,而频域特征分析主要考虑某个频率上的信号能量大小,对其进行统计分析。梅尔倒谱系数[1]是一种常用的频域特征,并且是针对音频窗口计算得到的,即:音频在短时间内反映出来的静态的、平稳的特征。更进一步地,将静态和动态特征结合成音频特征向量,则更有利于提高模式识别和检索等应用的性能。

频域特征分析:声音中的重要指标

声音是由不同频率、不同能量幅度的声波构成的。人的耳朵能够听到的音频频率范围是20~20000Hz。频域特征是声音的重要特征之一。音频的时域特征分析是以某个时刻信号能量大小为依据的,而频域特征分析主要考虑某个频率上的信号能量大小,对其进行统计分析。因此,在进行频域特征分析之前,首先要进行傅里叶变换,将采样值从时域转换到频域。

假设(x1,…,xn)表示对音频片段x采样后得到的n个采样点,将其划分为m个音频窗口,则对每个窗口中的n/m个采样点进行傅立叶变换,得到的系数值就是当前音频窗口在不同频率上的能量值。

梅尔倒谱系数(Mel-frequency Cepstrum Coefficients,MFCC)[1]是一种常用的频域特征,并且是针对音频窗口计算得到的,即:音频在短时间内反映出来的静态的、平稳的特征。如果要分析整个音频片段在所有持续时间内的动态特征,可以在静态特征的基础上进行差分计算等操作。更进一步地,将静态和动态特征结合成音频特征向量,则更有利于提高模式识别和检索等应用的性能。(www.xing528.com)

MFCC的计算是建立在傅立叶变换和倒谱分析的基础上,主要包括如下几个步骤:首先对音频窗口中的采样点进行傅立叶变换,得到音频窗口在不同频率上的能量值;将其输入Mel频率滤波器组进行卷积计算;最后把各个滤波器的输出结构组成向量,进行离散余弦变换,得到Mel刻度谱上的Mel频率倒谱。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈