欢迎来到天天文库
浏览记录
ID:32743120
大小:1.53 MB
页数:59页
时间:2019-02-15
《藏语拉萨方言统计参数语音合成地地研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文M.D.Thesis藏语拉萨方言的统计参数语音合成的研究ResearchonStatisticalParametricSpeechSynthesisofTibetanLhasaDialect刘博LIUBo西北师范大学硕士学位论文摘要随着人机语音交互技术的快速发展,目前的文-语转换(Text-to-Speech,TTS)系统可以合成出高可懂度和高自然度的合成语音,获得了广泛的应用。在我国,汉语普通话、粤语等语言的TTS技术已经越来越成熟,被应用到教育、通讯等多个领域。但尚缺少面向少数民族语言和方言的TTS系统。中国是一个多民族的国家,有多种少数民族语言和方言。藏族作为中国古老的少数民
2、族之一,有自己的语言文化。本文以藏语拉萨方言为研究对象,设计了藏语拉萨方言的文本语料,录制了语音语料,提出了一种藏语拼音的机读音标的设计方案SAMPA-T(Tibetan),实现了藏语文本到SAMPA-T的转换,在此基础上,实现了藏语拉萨方言的统计参数语音合成。论文的主要工作和创新如下:1.设计了一个藏语拉萨方言的语料库。通过分析藏语拉萨方言在声、韵、调上的特点,结合《藏语方言调查字表》,设计了藏语拉萨方言的文本语料,包含600个单音节词、400个双音节词和1000句语句。录制了藏语拉萨方言语音语料。语料库既能用于藏语方言的实验语音学研究,也能用于藏语方言的言语工程研究。2.设计了一种藏语拉萨
3、方言的SAMPA-T(Tibetan)标注方案,提出了一种面向藏语机读音标SAMPA-T的字音转换算法,实现了藏语文本语料的SAMPA-T的自动标注。3.实现了藏语拉萨方言的说话人相关的统计参数语音合成。根据藏语拉萨方言的发音特点,设计了上下文相关的语料标注格式和用于决策树聚类的问题集,标注了语料的上下文相关信息,计算了语音数据的广义mel倒谱系数。以声韵母为基元,利用基于隐马尔可夫模型(HiddenMarkovModel,HMM)的统计参数语音合成技术,训练获得了说话人相关的声学模型,实现了说话人相关的统计参数语音合成,并对合成语音进行了自然度的评测。实验结果表明,合成语音的平均MOS得分为
4、3.7。关键词:藏语拼音机读音标SAMPA-T字音转换参数语音合成I藏语拉萨方言的统计参数语音合成的研究AbstractWiththerapiddevelopmentofhuman-computerspeechinteractiontechnology,state-of-the-artText-to-Speech(TTS)synthesissystemcanachievehighintelligibleandnaturalsynthesizedspeechtofittheactualneedsofpeople.InChina,MandarinandCantoneseTTSareappliedt
5、oeducation,communicationandotherfields.Chinaisamulti-ethniccountrysothattherearedifferentminoritylanguagesanddialects.TibetansisoneoftheancientChineseminoritiesandhastheirownlanguageandculture.However,thereislackofresearchesonspeechsynthesisforsynthesizingChineseminoritylanguagessuchasTibetanandChin
6、esedialectsduetothedifferencesbetweendifferentlanguages.Inordertodealwiththeabovedificience,thisthesisfocusesonTibetanLhasadialectspeechsynthesis.WedesignasetofmachinepronunciationforTibetanphoneticsnamedSAMPA-TtolabelthepronunciationofLhasadialectofTibetan.AwordtoSAMPA-Tconversionalgorithmisrealize
7、dtotransformtextofTibetanintoSAMPA-T.AlargespeechcorpusofLhasadialectiscollectedandfullcontextdependentlabelisobtained.AquestionsetisbuiltbasedonthefeaturesofphoneticsforLhasadialect.WerealizeaHiddenM
此文档下载收益归作者所有