面向连续语音识别的半监督学习方法的研究

ID：15089257

大小：645.02 KB

页数：59页

时间：2018-08-01

资源描述：

《面向连续语音识别的半监督学习方法的研究》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、工学硕士学位论文面向连续语音识别的半监督学习方法的研究刘巧红哈尔滨工业大学2008年6月国内图书分类号：TP391.2国际图书分类号：681.37工学硕士学位论文面向连续语音识别的半监督学习方法的研究硕士研究生：刘巧红导师：李海峰教授申请学位级别：工学硕士学科、专业：计算机科学与技术所在单位：计算机科学与技术学院答辩日期：2008年6月授予学位单位：哈尔滨工业大学ClassifiedIndex：TP391.2U.D.C.:681.37ADissertationfortheDegreeofM.Eng.RESEARCHOFSEMI-SUPERVISEDLEARNINGMETHODONCO

2、NTINUOUSSPEECHRECOGNITIONCandidate：Supervisor：AcademicDegreeAppliedfor：Specialty：DateofOralExamination：University：LiuQiaohongProf.LiHaifengMasterofEngineeringComputerScienceandTechnologyJune,2008HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要语音识别技术日趋成熟，但仍存在一系列难题亟待解决。其中较为突出的是：对数据的标注成本高、耗时长，想获得大量的标注数

3、据十分困难，而另一方面，却很容易获得大量的未标注数据。这种情况下，半监督学习是一种有效的学习方法，能够充分利用所有这些数据来得到较好的训练结果。本文主要研究连续语音识别中的半监督学习方法，着眼于对声学模型的性能的改进。针对经典的F.Wessel与H.Ney方法中的句子内滤除法会带来系统性能下降这个问题，本文提出一种自学习与确认相结合的策略，可以有效地提高声学模型的性能，在仅使用100句语料（约合20分钟）作为初始训练集的情况下，系统对测试集的识别率相对平均提高了4.9%。考虑到高置信度数据分布的集中性，文中同时使用高低置信度数据来训练系统，相比于仅应用高置信度数据的方法，系统对测试集的识

4、别率平均提高了1.4%左右。另外，文中还尝试使用信息熵来进行数据筛选。根据最大熵原理，每次选择熵最大的数据加入到训练集中，实验表明依据信息熵进行数据筛选的半监督学习方法是有效、可行的。在当今很容易获得海量未标注数据的情况下，想要充分利用未标注数据，半监督学习的确是一个很明智的选择。关键词连续语音识别；半监督学习；置信度选择策略；自学习与确认相结合-IV-哈尔滨工业大学工学硕士学位论文AbstractSpeechrecognitiontechnologyhasmatured,buttherearestillanumberofproblemstoberesolved.Oneofthemor

5、eprominentare:becauseofthehighcostandlongtime-consumingoftaggingdata,togetalotoflabeleddatahasbeenverydifficult,andontheotherhand,itisrelativelyeasytogetalotofunlabeleddata.Undersuchcircumstances,semi-supervisedlearningisaneffectivemethodoflearning.Ittriestotakefulladvantageofallthesedatatoreceiv

6、ebettertrainingresults.Thetargetofthispaperistostudythesemi-supervisedlearningmethodinthefieldofcontinuousspeechrecognition,focusingontheperformanceoftheacousticmodelimprovements.ConsideringtheproblemofsystemperformancedegradationcausedbywordfilteringwithinthesentencesinthemethodproposedbyF.Wesse

7、landH.Ney,themethodinthispapercombinesself-learningwithverification,whichcaneffectivelyimprovetheperformanceofacousticmodel.Inthesituationofonlyusing100corpus(about20minutes)astheinitialtrainingset,therecognitionrateon

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 59



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

面向连续语音识别的半监督学习方法的研究

面向连续语音识别的半监督学习方法的研究

相关文章

相关标签