欢迎来到天天文库
浏览记录
ID:15089257
大小:645.02 KB
页数:59页
时间:2018-08-01
《面向连续语音识别的半监督学习方法的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、工学硕士学位论文面向连续语音识别的半监督学习方法的研究刘巧红哈尔滨工业大学2008年6月国内图书分类号:TP391.2国际图书分类号:681.37工学硕士学位论文面向连续语音识别的半监督学习方法的研究硕士研究生:刘巧红导师:李海峰教授申请学位级别:工学硕士学科、专业:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2008年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.2U.D.C.:681.37ADissertationfortheDegreeofM.Eng.RESEARCHOFSEMI-SUPERVISEDLEARNINGMETHODONCO
2、NTINUOUSSPEECHRECOGNITIONCandidate:Supervisor:AcademicDegreeAppliedfor:Specialty:DateofOralExamination:University:LiuQiaohongProf.LiHaifengMasterofEngineeringComputerScienceandTechnologyJune,2008HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要语音识别技术日趋成熟,但仍存在一系列难题亟待解决。其中较为突出的是:对数据的标注成本高、耗时长,想获得大量的标注数
3、据十分困难,而另一方面,却很容易获得大量的未标注数据。这种情况下,半监督学习是一种有效的学习方法,能够充分利用所有这些数据来得到较好的训练结果。本文主要研究连续语音识别中的半监督学习方法,着眼于对声学模型的性能的改进。针对经典的F.Wessel与H.Ney方法中的句子内滤除法会带来系统性能下降这个问题,本文提出一种自学习与确认相结合的策略,可以有效地提高声学模型的性能,在仅使用100句语料(约合20分钟)作为初始训练集的情况下,系统对测试集的识别率相对平均提高了4.9%。考虑到高置信度数据分布的集中性,文中同时使用高低置信度数据来训练系统,相比于仅应用高置信度数据的方法,系统对测试集的识
4、别率平均提高了1.4%左右。另外,文中还尝试使用信息熵来进行数据筛选。根据最大熵原理,每次选择熵最大的数据加入到训练集中,实验表明依据信息熵进行数据筛选的半监督学习方法是有效、可行的。在当今很容易获得海量未标注数据的情况下,想要充分利用未标注数据,半监督学习的确是一个很明智的选择。关键词连续语音识别;半监督学习;置信度选择策略;自学习与确认相结合-IV-哈尔滨工业大学工学硕士学位论文AbstractSpeechrecognitiontechnologyhasmatured,buttherearestillanumberofproblemstoberesolved.Oneofthemor
5、eprominentare:becauseofthehighcostandlongtime-consumingoftaggingdata,togetalotoflabeleddatahasbeenverydifficult,andontheotherhand,itisrelativelyeasytogetalotofunlabeleddata.Undersuchcircumstances,semi-supervisedlearningisaneffectivemethodoflearning.Ittriestotakefulladvantageofallthesedatatoreceiv
6、ebettertrainingresults.Thetargetofthispaperistostudythesemi-supervisedlearningmethodinthefieldofcontinuousspeechrecognition,focusingontheperformanceoftheacousticmodelimprovements.ConsideringtheproblemofsystemperformancedegradationcausedbywordfilteringwithinthesentencesinthemethodproposedbyF.Wesse
7、landH.Ney,themethodinthispapercombinesself-learningwithverification,whichcaneffectivelyimprovetheperformanceofacousticmodel.Inthesituationofonlyusing100corpus(about20minutes)astheinitialtrainingset,therecognitionrateon
此文档下载收益归作者所有