欢迎来到天天文库
浏览记录
ID:35128469
大小:3.15 MB
页数:62页
时间:2019-03-19
《浅议会议语音的混响消除及其大词汇量连续语音识别的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、厦门大学硕士学位论文会议语音的混响消除及其大词汇量连续语音识别的研究姓名:崔文迪申请学位级别:硕士专业:计算机应用技术指导教师:蔡骏20080501摘要语音识别技术的应用前景是无限的。应用语音的自动理解和翻译,可以消除人类相互交往的语言障碍。随着Internet网的爆炸性扩张,电子商务的迅速发展,语音识别技术将为网上会议、商业管理、医药卫生、教育培训等各领域带来极大的便利。随着近代计算机技术的飞速发展,大词汇量连续语音识别系统已经取得了较高的识别准确率,语料库的选择也由干净、单一的实验室环境下语料转
2、为混杂着噪音、混响复杂环境下的语料。真实环境下的语音识别成为研究的热点。论文围绕美国加州伯克利大学ICSI研究所提供的会议语料库,分析了影响识别率的三个原因:噪音、混响、说话人重叠。通过研究,旨在应用各种算法提高ICSI会议语料库的基线识别率。论文首先对语音识别系统的结构、语音模型、语言模型进行描述,然后分析了混响信号和混响模型,陈述了消除混响的基本方法,接着描述了ICSI语料库的构造和特点,最后分别提出了三种算法来消除噪音、混响和说话人重叠并且进行了实验。对ICSI数字语料库进行识别时通过减谱法和
3、长时减谱增强语音后,识别率由64%上升到91%。在对ICSI会议语料库进行识别时,根据上述的两种方法加上说话人检测消除说话人重叠技术,识别率提高了30%。本文结合了信号处理和语音识别两项技术,其创新性在于:通过混响模型定义,提出后混响方差估计与减谱法结合的算法以达到消除混响和噪音的双重目的;并且根据互相关系数,检测重叠说话人的主导说话人,从而对语料库进行修改,以达到消除重叠说话人语音对语音模型训练的影响。关键词:语音识别;混响消除;说话人检测AbstractSpeechrecognitiontech
4、nologyhasmanypromisingapplications.Theapplicationofautomaticspeechunderstandingandtranslationwouldeliminatelanguagebarrierofinteraction.Withtheexplosiveextensionandtherapiddevelopmentofe-business,speechrecognitiontechnologywillprovidemoreconvenienceinm
5、anyfields,includingnetworkmeeting,businessmanagement,hospital,eduction,ctc.Withtherapiddevelopmentofcomputertechnology,largevocabularyspeechrecognitionsystemhasbeenimplementedwithhi曲accuracy.Thecorpusselectionhasbeenchangedfromacleanenvironmenttoanoisy
6、orreverberantenvironment.TheresearchonSpeechrecognitionundertherealenvironmenthasbecomeahottopic.Thispaperanalyzedtheimpactoftherecognitionaccuracyofthreefactors:noise,reverberationandspeakeroverlap,basedonICSIcourpus.Firstofall,thepaperdescribedthestr
7、uctureofspeechrecognitionsystems,acousticsmodelsandlanguagemodels'thenanalyzesdthereverberantsignalandreverberantmodels,presentsabasicmethodtoeliminatereverberation.ThendescribesthestructureandcharacteristicsofICSICorpus.Finally,Paperproposedthreealgor
8、ithmstoeliminatenoise,reverberationandspeakeroverlapandcarriesouttheexperiment.Whenpassingbyspectrumsubtractionandlongtermspectrumsubtraction,theaccuracyofTIDIGITcorpusrecognitionhasimprovedfrom64%to91%.Whenpassingbydominantspeakerdetec
此文档下载收益归作者所有