针对发音质量评测的声学模型优化算法(严可等).doc

针对发音质量评测的声学模型优化算法(严可等).doc

ID:51942038

大小:458.47 KB

页数:13页

时间:2020-03-20

针对发音质量评测的声学模型优化算法(严可等).doc_第1页
针对发音质量评测的声学模型优化算法(严可等).doc_第2页
针对发音质量评测的声学模型优化算法(严可等).doc_第3页
针对发音质量评测的声学模型优化算法(严可等).doc_第4页
针对发音质量评测的声学模型优化算法(严可等).doc_第5页
资源描述:

《针对发音质量评测的声学模型优化算法(严可等).doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、991期严可等针对发音质量评测的声学模型优化算法文章编号:1003-0077(2013)01-0098-10针对发音质量评测的声学模型优化算法严可1,魏思2,戴礼荣1(1.中国科学技术大学,安徽合肥230027;2.科大讯飞股份有限公司,安徽台肥230088)摘要:在发音质量评测研究中,传统仅用发音标准的数据进行声学建模,难以描述实际测试面临的非标准发音,使得训练与测试的失配在所难免。针对上进问题,该文提出一种利用覆盖各种发音的数据,根据最小化机器分与人工分均方误差准则进行声学模型优化的算法。实验在普通话水平考试现场3685份数据(其中49

2、8测试,3187份训练)上进行。实验表明采用优化算法得到的针对发音质量的评测声学模型相比传统建模方式得到的声学模型有显著的优势。关键词:计算机辅助学习;区分性训练;普通话水平测试;发音质量评测中图分类号:TP391文献标识码:AAcousticModelRefiningAlgorithmforPronunciationQualityEvaluationYANKel,WEISi2,DAILirongl(l.UniversityofScienceandTechnologyofChina,Hefei,Anhui230027,Chlna;2.UST

3、CiFlytekCo.Ltd,Hefei,Anhui230088,China)Abstract:Traditionalapproachusesonlythestandard-pronouncedspeechdatatobuildacousticmodels,whichmakesautomaticpronunciationsystemspoorshowforaccentedspeechdatasincethetrainingandtestaremismatch.Todealwiththeproblem,thispaperpresentsano

4、velalgorithmthatutilizesbothstandardandaccentedspeechdatatooptimizeacousticmodelbyminimizingtherootmeansquareerrorbetweenthemanualandthemachinescores.Experimentson3685livePutonghuadatabase(498Fortestand3187fortraining)showsthattheevaluationacousticmodelsgeneratedbythepropo

5、sedmethodaresignificantlybetterthanthosebytraditionalapproaches.Keywords:computerassistedlanguagelearning;discriminativetraining;PSC;pronunciationqualityevaluation1引言随着计算机科学与信息科学的发展,计算机辅助学习系统(ComputerAssistedLanguageLearning,CALL)走进千家万户,发挥着日益重要的作用。发音质量评测是计算机辅助学习的重要内容,它不仅能显

6、著提升口语学习效率,还可代替教师进行口语考试部分题型的评分,极大缓解了大规模机考实践中教师评分任务繁重及费用居高不下的问题。目前,在文本相关的发音质量评测任务上,如朗读、跟读等,计算机已经接近人工评分水平[1],并在普通话水平测试、英语学习等任务上得到广泛应用,但性能仍需改进。本文研究属于文本相关的评测,即考生按照指定文本发音,计算机根据发音质量反馈出分数。一般采用自动语音识别(AutomaticSpeechRecognition,ASR)技术,根据给定文本将语音切分到音素,在此基础上计算能反映发音标准度和流畅度的评分特征,进而给出机器分。

7、在常用的评分特征中,帧规整后验概率[2,3]是目前公认的最能反映发音标准度的度量。另外,人们常用的GOP(GoodnessofPronunciation)算法[4,5]也是在帧规整后验概率理论框架下的简化。991期严可等针对发音质量评测的声学模型优化算法声学模型是帧规整后验概率计算的重要依据。由于白动发音质量评测的研究源于语音识别,至今人们仍普遍采用语音识别技术进行声学建模。但语音识别与发音质量评测有着显著不同:语音识别需要包容非标准发音,因此采用标准发音和非标准发音混合训练声学模型,能使训练与测试更加匹配,从而有效提升识别性能;而发音质量

8、评测任务需严格鉴别标准发音与非标准发音,因此人们仅使用标准发音进行声学建模。起初,人们自然想到使用公认的最为标准的发音——第一语言学习者(Ll)的标准发音进行声学建模[2]。但随

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。