欢迎来到天天文库
浏览记录
ID:28674485
大小:188.60 KB
页数:5页
时间:2018-12-12
《一种快速的基于短时能量和过零率的语音端点检测方法——毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、一种快速的基于短时能量和过零率的语音端点检测方法摘要:本文提出了一种快速的语音端点检测方法,它结合短时能量和过零率在时域信号中。由于它通过设置两个门限电平综合使用来得到语音信号的端点,并且原理上也不复杂,实时性和精度比较高,因此具有广泛的应用。本文首先从原理出发阐述,其次利用MATLAB工具进行仿真,然后对实现结果进行评价和比较,实验结果表明,检测的效果好于分别使用其中任意一种的情况。最后,文章中还对现阶段的语音端点检测的研究予以展望。关键词:端点检测;短时能量;过零率;门限AFastSpeechSignalEndpointsDetectionMethodBas
2、edonShort-timeEnergyandZero-crossingCountsAbstract:Thispaperpresentsafastspeechendpointdetectionmethod,whichcombinesshort-timeenergyandzero-crossingcountsinthetimedomainsignal.Itiswidelyusedbecauseitiscombinedwithtwothresholdlevelstogettheendpointofspeechsignal,andit
3、isnotcomplicatedintheoryandhashighreal-timeperformanceandaccuracy.Inthispaper,theprincipleofthefirstsetout,followedbyMATLABtoolsforsimulation,andthentoevaluateandcomparetheresults,theexperimentalresultsshowthatthedetectioneffectisbetterthantheuseofanyoneofthecases.Atlast,theresearcho
4、fspeechendpointdetectionisalsodiscussedinthispaper.Keywords:endpointdetection;short-timeenergy;zero-crossing;threshold0引言近年来随着语音信号处理的发展,语音信号中的端点检测以及判断方法的研究越来越重要。语音端点检测是语音分析、合成和识别中的一个重要的环节,目的是从语音信号中找到语音的起始点和结束点,从而能够准确的提取语音信号的特征值,在语音编码阶段还可以降低噪声和静音段的比特率,提高编码效率。一个准确并且算法不复杂的端点检测方法显得更加突出,这
5、不仅可以减少数据的存储量和处理运行的时间,而且可以排除无声段噪音的干扰。目前的研究工作中,比较流行的语音信号端点检测方法也是比较多,有短时能量,自相关函数,基于能量熵[1],基于倒谱率[2]的方法,通常情况下这些方法也能够达到一定的效果,但是由于其计算量大精度不高,或者是只能针对某一类群体,不具有很好的代表性。通常由于噪声环境的引入,将使有效的语音的起始点和终止点的虚检或是漏检情况[3]。本文的就是结合两种检测方法:短时能量和过零率相结合,在判断清浊音和静音段可以起到优势互补的作用,并且具有很好的效果。1语音信号的短时能量和过零率的特征1.1短时能量语音信号的能
6、量随时间变化比较明显,语音和噪声、语音和非语音的区别可以体现在它们的能量上,语音段的能量比噪声段能量大,一般情况下清音的能量比浊音小。但是语音信号不是一个平稳的过程,不能用平均幅度来描述其特征,也不能使用像平稳信号的处理技术对其进行分析,但可以通过一个加窗的分帧得到某一帧的信号的能量,可以将其视为短时平稳信号处理。5信号的短时能量定义如下:设语音波形的时域信号为xl,加窗分帧处理后得到的第n帧语音信号为xn(m),则xn(m)满足下式[4]:其中的n=0,1T,2T,⋅⋅⋅,并且N为帧长,T为帧移长度。设第n帧语音信号xn(m)的短时能量用En表示,其计算公式如
7、下[5]:En是一个度量语音信号幅度值变化的函数,它使用的是信号的幅度的平方,因此它对大信号比较敏感。语音和静音段的噪声的区分可以体现在它的能量上,语音段的能量比噪声段的能量大,如果环境噪声和系统输入的噪声比较小,信噪比比较高时,只要利用短时能量就可以把语音段和噪声段区分开。另外利用短时能量也可以很好的区分浊音,这是因为浊音发声的声带振动,携带比较高的能量。但是在判断轻音时效果就不是很好了,轻音发声时声带不震动,携带的能量比较少,这就需要借助于短时过零率来判断了。1.2短时过零率短时过零率表示一帧语音信号波形穿过横轴(零电平)的次数。过零分析是语音分析中一种很常
8、用的方法。对于连续的信号
此文档下载收益归作者所有