资源描述:
《汉语大词汇量连续语音识别系统研究进展new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第23卷第1期中文信息学报Vol.23,No.12009年1月JOURNALOFCHINESEINFORMATIONPROCESSINGJan.,2009文章编号:100320077(2007)0620112212汉语大词汇量连续语音识别系统研究进展1,211倪崇嘉,刘文举,徐波(1.中国科学院自动化研究所模式识别国家重点实验室,北京100190;2.山东财政学院统计与数理学院,山东济南250014)摘要:大词汇量连续语音识别(LVCSR)技术近年来发展迅速,并在许多领域得到了广泛的应用,国内外许多大公司加大了对语音识别技术的研究,不少商业化的语音识别系统已经面
2、世,并得到较为广泛的使用。该文综述了近年来大词汇量连续语音识别技术的研究进展,描述了汉语大词汇量连续语音识别系统,主要是基于统计方法的语音识别系统的框架与设计方法,对语音识别系统的一些关键技术和原理进行了分析,并对近年来国内外对语音识别研究发展动向进行了讨论。关键词:计算机应用;中文信息处理;综述;语音识别;模型自适应;搜索技术中图分类号:TP391文献标识码:AResearchonLargeVocabularyContinuousSpeechRecognitionSystemforMandarinChinese1,211NIChong2jia,LIUWen2j
3、u,XUBo(1.NationalLaboratoryofPatternRecognition,InstituteofAutomation,ChineseAcademyofSciences,Beijing100190,China;2.SchoolofStatisticsandMathematics,ShandongUniversityofFinance,Jinan,Shandong250014,China)Abstract:Thetechnologyoflargevocabularycontinuousspeechrecognition(LVCSR)hasdev
4、elopedquicklyanda2chievedbroadapplicationinrecentyears.Manybigcompanieshasreinforcedthespeechrecognitionresearchandva2riouscommercialsystemshaveappearedinthemarket.ThispaperreviewstherecentresearchprogressesofLVCSRanddescribesthemainframesanddesignsofcurrentmandarinChineseLVCSRsystem
5、s.Thekeyissuesandprinci2plesinLCVSRareanalyzedindetail.TheprospectsandresearchtrendsforLVCSRathomeandabroadarealsodis2cussed.Keywords:computerapplication;Chineseinformationprocessing;overview;speechrecognition;modeladaptation;searchtechnology息存取平台,有可能取而代之的是各种各样的手提式1引言设备(如PDA、MobilePh
6、one等)以及人们生活中的智能设备。人们迫切需要一种便捷的方式实现人与机直到今天,语音是人与人之间最自然、最重要的器的自然交互,语音识别技术因此应运而生。从语音交流方式。随着科学技术的发展以及无线通讯网络识别技术诞生的那天开始,人们就致力于赋予计算的创新普及,传统的桌面上电脑不再是人们唯一的信机类似于人耳一样的听觉能力,通过对语音数据的收稿日期:2008202210定稿日期:2008211227基金项目:国家重点基础研究发展计划(973)资助项目(2004CB318105);国家高技术研究发展计划(863)资助项目(2006AA01Z194,20060101Z4
7、073);国家自然科学基金资助项目(60675026,60121302,90820011)作者简介:倪崇嘉(1979—),男,博士生,讲师,主要研究领域为语音识别、机器学习;刘文举(1960—),男,博士,副研究员,主要研究领域为语音识别、语音合成等;徐波(1966—),男,博士,研究员,主要研究领域为语音识别、口语翻译等。©1994-2009ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http://www.cnki.net1期倪崇嘉等:汉语大词汇量连续语音识别系统研究进展113
8、分析与处理来获取蕴含其中