行车噪声环境下基于人耳频率选择特性的声学特征提取方法

行车噪声环境下基于人耳频率选择特性的声学特征提取方法

ID:25923957

大小:53.00 KB

页数:6页

时间:2018-11-23

行车噪声环境下基于人耳频率选择特性的声学特征提取方法_第1页
行车噪声环境下基于人耳频率选择特性的声学特征提取方法_第2页
行车噪声环境下基于人耳频率选择特性的声学特征提取方法_第3页
行车噪声环境下基于人耳频率选择特性的声学特征提取方法_第4页
行车噪声环境下基于人耳频率选择特性的声学特征提取方法_第5页
资源描述:

《行车噪声环境下基于人耳频率选择特性的声学特征提取方法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、行车噪声环境下基于人耳频率选择特性的声学特征提取方法行车噪声环境下基于人耳频率选择特性的声学特征提取方法引言  声学事件检测(AcousticEventDetection,AED)就是检测当前环境中发生的特定目标声学事件,然后把检测出的声学事件转换为人类或者智能设备可以理解的信号,为人类或者智能设备的决策提供信息。在声学事件检测研究中,研究者们做出了大量的贡献。目前研究主要聚焦在提取适合检测任务要求的声学特征表示和声学事件的分类算法方面。在声学特征方面,研究者们尝试了各种声学特征,如:梅尔倒谱系数(Mel-frequenc

2、ycepstralcoefficients,MFCC)[1]、线性预测倒谱系数(Linearpredictioncepstralcoefficients,LPCC)[2]、基频(Pitch)[3]、频谱质心(Spectralcentroid)[4]等。在声学事件的分类方法中,研究者们也尝试了各种不同的方法,包括基于支持向量机(SupportVectorMachine,SVM)方法、隐马尔科夫模型(HiddenMarkovModel,HMM)方法、人工神经网络(ArtificialNeuralNet.收集整理的主动选择性增益

3、功能等[10]。其中,基底膜的主要功能是将接收到的声音信号分解为各个频率上的振动峰值,并将相应的振动传递给外毛细胞和内毛细胞;外毛细胞/覆膜则主要依据接收到的振动对特定频率处的能量进行选择性增益,影响相应位置处的内毛细胞发放强度。针对传统声学事件检测方法存在的问题以及人耳中耳蜗的听觉感知特性,本文提出了一种模拟人耳听觉感知的基于共振峰的Mel滤波器组的加权算法,通过模拟人耳的听觉感知特性,加强了Mel滤波器组对中高频的分辨能力,并采用加权后的Mel滤波器组提取FMFCC(Formant-MFCC,FMFCC)系数。实验证明

4、,FMFCC对噪声有更好的鲁棒性,并且在目标声学事件信号较弱时,也不会增加误识率。  1共振峰的提取  声音信号的倒谱可以通过先对信号做傅里叶变换、取模,得到信号的频谱密度,然后求频谱密度的对数,最后求反傅里叶变换得到。根据参数模型功率谱估计的思想,可以将声音信号看作一个输入序列激励一个全极点的系统而产生的输出,系统的传递函数为:  (1)  其中,为常数,为实数,为模型的阶数。  由于频率响应反映了被分析信号的频谱包络,因此用来代替频谱密度,对求对数后,做傅里叶反变换求出的LPC倒谱系数,也被认为包含了信号频谱的包络信息

5、,因此将其看作是对原始信号短时倒谱的一种近似。  的冲击响应为。欲求的倒谱,根据同态分析法,因为是最小相位的,所以一定可以展开成级数的形式,即的逆变换是存在的,可得:  ...(2)  因此,只要计算出线性预测系数,就可以求出倒谱,通过对倒谱进行搜索,找到每一个共振峰所在的频率,记为,其中表示共振峰的个数。  2Mel滤波器组的加权  2.1模拟频率选择性增益功能  人耳的选择性增益功能对人耳耳蜗的听觉感知至关重要,人耳的选择性增益机制主要包括:频率相关的增益区间和增益函数。考虑到人耳覆膜的行波振动范围有限,因此其频率增益

6、区间仅局限于中心频率附近[11];增益函数在频域的对数尺度上近似于高斯函数,在共振峰频率处的增益幅度最大,而在共振峰频率两侧的增益幅度迅速衰减。这即导致共振处的频率振幅能量在急剧增加的同时,两侧的频率振幅能量急剧降低,表现出人耳的频率选择性增益功能。  下面给出一种方法把LPC谱估计法提取出的共振峰的信息应用到Mel滤波器组中,从而弥补Mel滤波器组在中高频分辨率不足的问题。考虑到在频率的对数尺度上,耳蜗的频率增益曲线类似于高斯密度函数,在共振峰处,耳蜗的频率增益最大,而在共振峰所在频率的两侧,耳蜗的增益幅度迅速衰减,根据

7、以上分析,设计了如下函数来模拟耳蜗基底膜与覆膜之间的频率选择增益函数:  (3)  其中,表示第个子带的频率中心,表示第个子带的宽度,表示Mel滤波器组中包含的Mel子带的个数;表示检测到的第个共振峰的频率,表示第个共振峰的振幅在个共振峰的振幅总和中所占的振幅能量的比例,该比例用来表示第个共振峰的强弱;是一个指示性函数,如果共振峰的频率在以为中心,以为宽度的第个Mel子带中,则返回1,否则返回0。  2.2Mel滤波器组的加权  通过对每一帧中共振峰所处的Mel子带对应的Mel滤波器系数进行加权,突出共振峰所在的Mel子带

8、的频率,从而模仿人耳覆膜的频率选择映射,由此即弥补了Mel滤波器组在中高频分辨率较低的不足,同时也增强了传统MFCC对噪声的鲁棒性。这符合人耳的听觉感知机理,如在众多嘈杂的背景环境噪声中,要想别人听清楚自己说话,必须提高声音的分贝,掩盖其他背景声音。  根据Mel滤波器组中每一个Mel子带在对数频率中的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。