欢迎来到天天文库
浏览记录
ID:50150772
大小:11.94 MB
页数:121页
时间:2020-03-07
《融合发音机理的统计参数语音合成方法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、令在本大彥溥士学位论义论文题目誠合发音机理的纟先计参教语音合成方法研免作者姓名学科专业信号与息处多里导师姓名凌料完成时间二—五年?0衅在本大彥博士学位论文融合发音机理的统计参数语音合成方法研究作者姓名:蔡明琦学科专业:信号与信息处理导师姓名:凌震华副教授完成时间:二〇一五年五月UniversityofScienceandTechnologyofChinaAdissertationfordoctor'sdegreeResearchonStatisticalParametricSpeechSynthesisIntegratingSpeechProduc
2、tionMechanismsAuthor:MingqiCaiSpeciality:SignalandInformationProcessingSupervisor:AssociateProfessorZhenhuaLingFinishedTime:May,2015中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文是本人在导师指导下进行研宄工作所取得的成果。除己特别加以标注和致谢的地方外,论文中不包含任何他人己经发表或撰写过的研宄成果。与我一同工作的同志对本研宂所做的贡献均已在论文中作了明确的说明。作者签名:寒!巧签字日期:中国科学技术大学学
3、位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可以釆用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。公开□保密年作者签名蒸碗导师签名签字日期:辦科“⑷签字日期:拜咖摘要摘要近二十年来,统计参数语音合成方法发展迅速,逐步成为与单元挑选与波形拼接方法相并列
4、的一种主流语音合成方法,隐马尔可夫模型(是统计参数语音合成中最为常用的声学模型形式。相比于单元挑选与波形拼接方法,基于的参数合成方法具有系统构建自动化程度高、可快速自适应、合成语音平滑流畅、系统尺寸小等优点,但是该方法在合成语音的音质与自然度上和单元挑选与波形拼接方法相比仍有差距。此外,现阶段该方法在实现多样化及个性化语音合成时的性能仍不够理想。一方面,语音学知识难以融入声学特征预测过程,对于合成语音特征的控制存在较强的数据依赖性;另一方面,在利用少量目标发音人数据与模型自适应算法实现合成系统话者转换时,合成语音的自然度以及与目标发音人的相似度仍有
5、待提升。现阶段统计参数语音合成方法所使用的声学模型结构缺乏对于语音产生机理的描述,是产生上述不足的原因之一。因此,本文围绕统计参数语音合成中融合发音机理的声学建模方法开展研宄工作,将发音动作特征和共振峰特征作为中间层表征,构建了“语言学特征中间层表征声学特征”的声学模型结构,实现了对于实际语音产生中的层次化信息处理过程的模拟。首先,本文研宄结合发音动作特征的声学建模方法,构建了中文多发音人连续语流发音动作特征数据库,验证了双流模型对于实现发音动作特征与声学特征联合建模的有效性,提出了结合目标逼近模型与多元回归隐马尔科夫模型(的声学建模方法,实现了基
6、于语音学规则的合成语音特征控制;其次,本文将共振峰特征作为音素序列与可观测声学特征之间的中间表达,提出了基于隐藏式轨迹模型(,的语音合成频谱建模方法,提高了频谱特征的预测精度与合成语音的自然度实现了对于合成语音共振峰频率与带宽等特征的灵活控制,并且进一步研究了模型自适应方法,提高了话者转换合成语音的自然度与相似度。整篇文章的安排如下:第一章是绪论,介绍语音产生机理,并简要回顾几种常见的语音合成方法。第二章具体介绍基于的统计参数语音合成方法,包括的基本概念、基于的语音合成系统框架以及其中的关键技术点,最后通过分析当前方法的优缺点,阐述本文研究工作的动
7、机与出发点。第三章着重介绍基于双流的发音动作特征与声学特征的联合建模方法。首先,完成了多发音人中文连续语流发音动作特征数据库的录制,包括录音环境的搭建以及对于釆集的发音动作特征的预处理等;然后,实现了基于双流的中文连续语流发音动作特征与声学特征的联合建模;最后,研宄了不同的上下文属性、模型聚类方式及流间相关性假设对于发音动作特征与声学摘要特征的联合建模性能的影响。第四章具体介绍结合目标逼近模型与模型的可控语音合成方法。首先,提出了基于目标逼近模型的发音动作特征预测方法,该模型相比模型具有参数数目较少且物理意义明确南优点;其次,在第三章研宄工作基础上
8、,设计实现了结合目标逼近模型和模型的可控语音合成方法,并通过主客观测试验证了其结合语音学知识实现合成语音特征控制的有效性;
此文档下载收益归作者所有