一种语音信号端点检测的改进方法

一种语音信号端点检测的改进方法

ID:34514307

大小:283.94 KB

页数:4页

时间:2019-03-07

一种语音信号端点检测的改进方法_第1页
一种语音信号端点检测的改进方法_第2页
一种语音信号端点检测的改进方法_第3页
一种语音信号端点检测的改进方法_第4页
资源描述:

《一种语音信号端点检测的改进方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第27卷第5期计算机仿真2010年5月文章编号:1006—9348(2010)05~0340—04一种语音信号端点检测的改进方法顾亚强,赵晖,吴波(国防科学技术大学电子科学与工程学院二系,湖南长沙410073)摘要:在研究传统的语音端点检测方法的基础上,为提高语言识别率和准确性,提出了一种新的利用对短时能零和过零率的进行差分的方法来求取语音的起始点,达到了语音端点检测的目的。利用语音段和无声段的边界差异性,运用差分的方法找到语音段的起点和末点,避免了对语音段本身的判定过程,增强了抗噪性能也降低了计算复杂度。通过仿真实验结果可

2、以证明,上述方法优于传统语音端点检测方法。关键词:语音端点检测;短时能零;过零率中图分类号:TP391文献标识码:BAnImprovedMethodoftheVoiceEndpointDetectionGUYa—qiang,ZHAOHui,WUBo(CollegeofElectronicScienceandEngineer,NationalUniversityofDefenceTechnology,ChangshaHunan410073,China)ABSTRACT:Anewmethodofvoiceendpointdete

3、ctionusingthedifferenceofthevocieshortenergyandcrosszeroratioisproposedonthebasicoftheresearchofthetraditionalmethod.Sincethedifferencebetweenthespeechseg—mentandsilencesegment.thestartpointandendpointcanbef0undtllthismethodbyusingdiference.It‘doesnothavetodealwith

4、thevoicesegmentitself.Itimprovestheperformanceinthenoiseenvironmentsandcanreducethecomputation.Itisprovedthatthisnewmethodisbetterthanthetraditionalmethodthroughtheexperiment.KEYWORDS:Vocieendpointdetection;Shortenergy;Crosszeroratiol引言否准确将很大程度决定语音识别的后续工作是否能有效进语音作为

5、人类最自然、最直观的信息载体,它必将成为行。迄今为止,语音端点检测仍是一个有待更深层研究的课未来人机交互界面的主要控制方式。而语音端点检测就是题。从一段原始语音信号中通过一定的技术手段检测出有用的语音成分1进而进行其他语音信号处理。它是语音分析、语2传统的语音信号端点检测方法音合成和语音识别等语音信号处理中的最初始最基本的环一直以来,传统的语音端点检测算法主要是依据语音信节也是最重要的环节。号的时频特性,它采用的主要参数是短时能量和短时平均过在实际应用中,通常首先要对真正含有语音成分信号的零率等。主要是:短时能量法、短时平均

6、过零率法、短时能零起始点进行判定,如此收集到的真正语音数据可以大大减少积法。它们的基本思想就是对输入的语音信号进行相应数后期处理的运算量和存储空问,并能更减少处理时间。特别学计算,然后将它们与初始设定的门限阀值进行比较来判定是在噪声环境下,端点检测的准确性直接将影响语音识别的有声段和无声段。识别率。2.1短时能量法或短时平均幅度法在语音识别中,一般先是根据一定的端点检测算法,对语音信号和噪声信号的主要区别在于它们的能量,语音语音信号中的有声片段和无声片段进行切分,再对有声语音段的能量比噪声段的大,语音段的能量是噪声段的能量与

7、语信号部分提取出的语音特征进行语音识别。大量研究和实音声波能量的和。所以如果环境噪声和系统输入的噪声比验也证明,语音识别在安静的良好环境中的错识率有一半以较小并保证系统一定信噪比的情况下,那么只要计算输入信上归因于端点检测的不准,因此语音端点检测作为语音识号的短时能量(短时平均幅度)就能通过设定门限把语音段别中关键的一部分,尤其是在噪音环境下的语音端点检测是和背景噪声段分开。我们可以定义短时能量:+∞E=[(m)W(n—m)]基金项目:“十一五”武器装备预研项目(51329060101)m一∞收稿日期:2009—0l一01修

8、回日期:2009—03—34短时平均幅度:·——340·--——率和短时能量的差分就可以容易的找到语音段和非语音段=[(m)(,z—m)]的边界点从而判断语音端点。一般来说,输入语音的前5帧其中(m)的为原始语音信号的取样序列,(n一//'t)为都为非语音段,检测时,先求前5帧短时能量和过

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。