欢迎来到天天文库
浏览记录
ID:5349819
大小:462.16 KB
页数:4页
时间:2017-12-08
《基于分数阶域的语音活动性检测算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第31卷第6期兰州交通大学学报Vol.31No.62012年12月JournalofLanzhouJiaotongUniversityDec.2012文章编号:1001-4373(2012)06-0083-04基于分数阶域的语音活动性检测算法研究*徐岩,李洋洋(兰州交通大学电子与信息工程学院,甘肃兰州730070)摘要:针对传统的语音活动性检测准确度较低的情况,本文提出了一种基于分数阶域的稳健语音信号活动性检测算法.该算法利用时域的短时能量与分数阶域的谱熵作为特征值输入到滑动滤波器,并对多帧能量进行滤波,使用一种三状态机对各个状态进行检测达到吸收高能量、平稳噪声和突发噪声的目的,算法仿真
2、证明本文所提出的算法其性能明显优于传统算法.关键词:分数阶域傅里叶变换,语音活动性检测,语音增强中图分类号:TN912文献标志码:A分数阶傅里叶变换(FractionalFourierTrans-响,采用具有过渡吸收状态的三态状态机进行帧状form,FRFT)是一种时频域分析方法,融合了信号态的判定,改进端点检测算法的结构框图如图1所在时域和频域的信息.现有的传统时域端点检测方示.[1]法主要是信号的基本短时参数如短时能量、过零率等,但是这些方法在噪声环境中判别性能下降,低信噪比时准确度较低,不够稳健,而分数阶域端点检[2]测算法都是根据固定分辨率得到全局谱特征,而在实际应用中,往往只需
3、要得到信号的某段局部谱特征.在本文中,通过利用时域的短时能量和分数阶图1端点检测算法结构框图域的谱熵两个特征参数,结合分数阶傅立叶变换的Fig.1Thediagramofvoiceactivedetectalgorithm高分辨率计算方法,对帧信号进行局部谱特征分析,1.1特征参数利用带有吸收状态的三状态机去除突发干扰噪声对基于时域的短时能量和分数阶域的谱熵能较全端点检测准确度的影响,从而提高端点检测的准确面的表述信号特征,本文选用其作为滑动滤波器的度.特征参数.1)时域短时能量可表达为式(1),式中Ei是第i1算法描述帧短时能量,N为一帧的采样点数.本文基于分数阶域的活动性检测基本思路
4、是首N2(n)(1)先计算帧能量,对输入的语音信号进行预加重,分Ei=∑xi=1帧、加窗,得到其中特征参数之一即时域短时能量并2)谱熵H的表达如式(2),先对信号进行分数保存相邻的M帧能量,然后对该语音信号做FRFT阶傅里叶变换,得到X(fi),则其概率密度函数为式[3](3),式中X(f)即表示为f变换后得到另一分数阶域特征参数谱熵,以M帧ii的能量谱.[4]M能量和分数阶域的谱熵作为滑动滤波器的输入,Hi=-∑qilogqi(2)为了提高系统对信号的辨别率,通过滑动滤波器时i=1[5]X(f利用一阶差分值来表示,这样得到的特征向量更i)qi=MU(i=1,2,…,M)(3)加稳健,因
5、为差分特性能够更好地反映序列的变化∑k=1X(fk)趋势.最后判定帧状态,这里考虑到突发噪声的影由于谱熵主要体现谱的变化,当谱熵越小,表示*收稿日期:2012-09-15作者简介:徐岩(1963-),男,江苏南通人,教授.84兰州交通大学学报第31卷谱越集中,谱熵越大,谱在整个频率成份上分布的越参数决定滤波器频率响应的形状,S参数决定滤波均匀,这时信号越复杂,不确定性程度也就越大.因器频率响应的初始条件.此可以用谱熵与能量的乘积作为特征来判断语音起为了更好地反应滤波器滤波输出的变化,引入止点,这里利用前10帧帧能量作为判断标准,可定反映滤波器输出动态变化的一阶差分特性,求解当义为式(4)
6、.前滤波器加权能量输出与前一帧滤波器输出的差EFi=|(Ei-CE)·(Hi-CH)|(4)值.假设N为帧数,ai为i时刻的滤波器输出Fout,则式中:CE为前10帧噪声信号的能量均值;CH为前滤波器在各个时刻的输出向量可用式(6)表示.T(6)10帧加噪信号熵的均值.A=[a0a1a2…aN]1.2滑动滤波器经过差分运算之后的输出向量可表示为式(7).选择滑动滤波器是由于若在一段时间内该信号T(7)B=[b0b1b2…bN]在检测到的帧能量彼此之间的大小较相似,说明检其中:b0=a0,bi=ai-ai-1(i=1,2,…,N).测到的这段信号很有可能是噪声,因为噪声的能量1.3三态状态
7、机一般较集中,且动态范围比较小,而语音信号的动态对于帧状态的判定,考虑到平稳高能噪声与突范围往往比较大,而且一般在30dB左右,也就是说发噪声的影响,又结合分数阶域谱减时对信号的影当检测到的信号在检测到的帧能量各帧之间能量差响,采用对帧状态判定的三态状态机来判定.三态状[6]距比较大,则很有可能检测到的是语音信号.因此态机将语音信号的每帧分为三个状态即信号帧、无可利用其最佳滑动平均滤波器,该滤波器对于一段信号帧和临时帧.临时帧是将信
此文档下载收益归作者所有