会议语音的混响消除及其大词汇量连续语音识别的研究

会议语音的混响消除及其大词汇量连续语音识别的研究

ID:32238299

大小:3.11 MB

页数:60页

时间:2019-02-02

会议语音的混响消除及其大词汇量连续语音识别的研究_第1页
会议语音的混响消除及其大词汇量连续语音识别的研究_第2页
会议语音的混响消除及其大词汇量连续语音识别的研究_第3页
会议语音的混响消除及其大词汇量连续语音识别的研究_第4页
会议语音的混响消除及其大词汇量连续语音识别的研究_第5页
资源描述:

《会议语音的混响消除及其大词汇量连续语音识别的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要语音识别技术的应用前景是无限的。应用语音的自动理解和翻译,可以消除人类相互交往的语言障碍。随着Internet网的爆炸性扩张,电子商务的迅速发展,语音识别技术将为网上会议、商业管理、医药卫生、教育培训等各领域带来极大的便利。随着近代计算机技术的飞速发展,大词汇量连续语音识别系统已经取得了较高的识别准确率,语料库的选择也由干净、单一的实验室环境下语料转为混杂着噪音、混响复杂环境下的语料。真实环境下的语音识别成为研究的热点。论文围绕美国加州伯克利大学ICSI研究所提供的会议语料库,分析了影响识别率的三个原因:噪音、混响、说话

2、人重叠。通过研究,旨在应用各种算法提高ICSI会议语料库的基线识别率。论文首先对语音识别系统的结构、语音模型、语言模型进行描述,然后分析了混响信号和混响模型,陈述了消除混响的基本方法,接着描述了ICSI语料库的构造和特点,最后分别提出了三种算法来消除噪音、混响和说话人重叠并且进行了实验。对ICSI数字语料库进行识别时通过减谱法和长时减谱增强语音后,识别率由64%上升到91%。在对ICSI会议语料库进行识别时,根据上述的两种方法加上说话人检测消除说话人重叠技术,识别率提高了30%。本文结合了信号处理和语音识别两项技术,其创新性

3、在于:通过混响模型定义,提出后混响方差估计与减谱法结合的算法以达到消除混响和噪音的双重目的;并且根据互相关系数,检测重叠说话人的主导说话人,从而对语料库进行修改,以达到消除重叠说话人语音对语音模型训练的影响。关键词:语音识别;混响消除;说话人检测AbstractSpeechrecognitiontechnologyhasmanypromisingapplications.Theapplicationofautomaticspeechunderstandingandtranslationwouldeliminatelangua

4、gebarrierofinteraction.Withtheexplosiveextensionandtherapiddevelopmentofe-business,speechrecognitiontechnologywillprovidemoreconvenienceinmanyfields,includingnetworkmeeting,businessmanagement,hospital,eduction,ctc.Withtherapiddevelopmentofcomputertechnology,largevo

5、cabularyspeechrecognitionsystemhasbeenimplementedwithhi曲accuracy.Thecorpusselectionhasbeenchangedfromacleanenvironmenttoanoisyorreverberantenvironment.TheresearchonSpeechrecognitionundertherealenvironmenthasbecomeahottopic.Thispaperanalyzedtheimpactoftherecognition

6、accuracyofthreefactors:noise,reverberationandspeakeroverlap,basedonICSIcourpus.Firstofall,thepaperdescribedthestructureofspeechrecognitionsystems,acousticsmodelsandlanguagemodels'thenanalyzesdthereverberantsignalandreverberantmodels,presentsabasicmethodtoeliminater

7、everberation.ThendescribesthestructureandcharacteristicsofICSICorpus.Finally,Paperproposedthreealgorithmstoeliminatenoise,reverberationandspeakeroverlapandcarriesouttheexperiment.Whenpassingbyspectrumsubtractionandlongtermspectrumsubtraction,theaccuracyofTIDIGITcor

8、pusrecognitionhasimprovedfrom64%to91%.Whenpassingbydominantspeakerdetection,theaccuracyofICSIcorpusrecognitionratehasimproved30%.Thisarticlecombi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。