基于最大似然线性回归的随机段模型说话人自适应研究.pdf

基于最大似然线性回归的随机段模型说话人自适应研究.pdf

ID:56061324

大小:359.54 KB

页数:5页

时间:2020-06-20

基于最大似然线性回归的随机段模型说话人自适应研究.pdf_第1页
基于最大似然线性回归的随机段模型说话人自适应研究.pdf_第2页
基于最大似然线性回归的随机段模型说话人自适应研究.pdf_第3页
基于最大似然线性回归的随机段模型说话人自适应研究.pdf_第4页
基于最大似然线性回归的随机段模型说话人自适应研究.pdf_第5页
资源描述:

《基于最大似然线性回归的随机段模型说话人自适应研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、CN43—1258/TP计算机工程与科学第36卷第8期2014年8月ISSN1007—13OXComputerEngineering&ScienceV01.36.No.8,Aug.2014文章编号:1007—130X(2014)08—1604—05基于最大似然线性回归的随机段模型说话人自适应研究晁浩,杨占磊,刘文举(1.河南理工大学计算机科学与技术学院,河南焦作454000;2.中国科学院自动化研究所模式识别国家重点实验室,北京100190)摘要:提出了一种随机段模型系统的说话人自适应方法。根据随机段模型的模型特性,将最3v4a然线性回归方法引入到随机

2、段模型系统中。在“863一test”测试集上进行的汉语连续语音识别实验显示,在不同的解码速度下,说话人自适应后汉字错误率均有明显的下降。实验结果表明,最大似然线性回归方法在随机段模型系统中同样能取得较好的效果。关键词:语音识别;说话人自适应;最大似然线性回归;随机段模型中图分类号:TP391.4文献标志码:Adoi:10.3969/j.issn.1007—130X.2O14.08.032Researchofspeakeradaptationofstochasticsegmentmodelsusingmaximumlikelihoodlinearregr

3、essionCHAOHao,YANGZhan—lei。,LIUWen-ju。(1.SchoolofComputerScienceandTechnology,HenanPolytechnicUniversity,Jiaozuo454000;2.NationalLaboratoryofPatternRecognition,InstituteofAutomation,ChineseAcademyofSciences,Beijing100190,China)Abstract:AspeakeradaptationmethodofStochasticSegment

4、Model(SSM)isproposed.AccordingtotheSSM’Scharacteristics,thetheoryofMaximumLikelihoodLinearRegression(MLLR)methodisintroducedintotheSSM—basedsystems.ContinuousChinesespeechrecognitionexperimenton”863一test”testsuiteshowsthattheproposedmethodmakestheerrorrateofChinesecharactersdecr

5、easeobvi—ouslyunderdifferentdecodingspeeds.ExperimentresultsindicatethattheproposalcanalsoimprovetherecognitionperformanceontheSSM—basedsystems.Keywords:speechrecognition;speakeradaptation;maximumlikelihoodlinearregression;stochasticsegmentmodel性的一个重要因素。尽管说话人无关识别系统已引言经取得了长足的进步,但

6、是这类系统的性能与针对特定说话人的识别系统间仍存在巨大的差异。大语音识别经过几十年的发展己经取得了很大部分说话人无关SI(SpeakerIndependent)系统不的进展,在纯净语音条件下已经达到了很高的识别能对所有的说话人表现如一,说话人年龄、性别、情率,但是当训练环境和识别环境不匹配时,现有的绪、语言习惯的差异都可能带来识别性能的严重下识别系统的性能通常会严重下降,这是语音识别技降,说话人相关SD(SpeakerDependent)系统可以术实用化的一个严重障碍。语音识别系统能在不达到更高的识别率,但是为得到说话人相关的码本同的条件下保持较高识别

7、率的性质被称为稳健性,需要大量说话人的数据,这在实际中往往很难得影响稳健性的因素很多,说话人的变化是影响稳健到。说话人自适应技术SA(SpeakerAdaptation)收稿日期:2012—1219;修回日期:2013-04—03基金项目:国家自然科学基金资助项目(91120303,90820303,90820011);国家973计划资助项目(2004CB318105);国家863计划资助项目(20060101Z4073,2006AA01Z194)通信地址:454000河南省焦作市河南理工大学计算机科学与技术学院Address.SchoolofComp

8、uterScienceandTechnology,HenanPolytechnicUniver

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。