汉语语音合成韵律控制方法与实现的研究

汉语语音合成韵律控制方法与实现的研究

ID:32471881

大小:2.14 MB

页数:78页

时间:2019-02-06

汉语语音合成韵律控制方法与实现的研究_第1页
汉语语音合成韵律控制方法与实现的研究_第2页
汉语语音合成韵律控制方法与实现的研究_第3页
汉语语音合成韵律控制方法与实现的研究_第4页
汉语语音合成韵律控制方法与实现的研究_第5页
资源描述:

《汉语语音合成韵律控制方法与实现的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、哈尔滨工程大学硕士学位论文摘要随着科学与技术的发展,语音合成和语音识别已经开始广泛应用于社会的各个方面,并且成为人工智能、语音信号处理以及人机多媒体交互研究领域的热点之一。然而对于语音合成来说,汉语不同于西方语系,表现在语法结构、语法规则、声学特性、韵律特征等多个方面。首先,汉语是声调语言,声调具有辨意作用。其次,字与字之间的音调前后彼此互相影响会发生变异,即出现协同发音现象。同时,连续语流中的发音中间还会有短暂的停顿,这体现了人说话的节奏感。在汉语的文语转换(TTs)中,对语音基频、时长、幅度等韵律信息的

2、预测、分析和控制称作韵律控制。目前在汉语语音合成的韵律控制方法上还存在很多无法解决的问题,致使合成语音的音质在自然度和可懂度方面相对较低,还不能达到用户可以广泛接受的程度,从而制约了该项技术大规模地进入市场。针对上述问题,本文在广泛汲取汉语韵律知识和现代语音信号处理技术的基础上,对汉语语音合成技术及其实现方法进行了深入的研究,主要研究工作如下:l、本文从汉语的声学特点和韵律特征出发,诸如汉语的声调及特点、汉语的语调及模式,分析和研究汉语的韵律特征(基频、时长、幅度)、重音、停顿以及韵律边界之间的相互关系,提

3、出了适用于汉语语音合成的韵律控制规则。2、通过对汉语的韵律及其层次结构的分析与对比,进行了韵律特征与韵律边界的声学分析,提出了韵律分层建模、韵律边界预测和韵律分层控制的思想。3、确定了以音节作为拼接的语音基元,采用基于数据驱动的统计模型和规则相结合的方法,实现韵律建模及其韵律控制。4、采用PSOLA算法,在有限范围内实现对合成基元的时长和基频的调整,以及它对合成语音音质的影响;研究了语调曲线的合成及其控制方法。利用上述方法,进行了汉语文语转换实验。实验结果表明,本文提出的语音合成与韵律控制方法是行之有效的。

4、关键词:文语转换;语音合成;语音自然度;韵律模型;韵律边界;韵律控制;PSOLA算法哈尔滨工程大学硕士学位论文AbstractWiththedevelopmentofscienceandtechnology,speechsynthesisandspeechrecognitionhavebeenalreadyusedinallthefieldsofsociety,andhavebecomeoneofhot-researchingfieldsinhuman-intelligence,speechsignalpr

5、ocessingandhuman-machinemulti.mediuminteraction.Intermofspeechsynthesis,however,Chineseisdifferentfromwestlanguagefamilysuchasongrammarstructure,gl'alBmarrules,acousticcharacteristicsandprosodicfeaturesoOILAtfirst,Chineseislanguagewithfivetonesanddifferent

6、tonesareusedtoexpressdifferentmeanings.Moreover,thetonesbetweenbothwordsareinfluencedeachotherSOastochangetheiroriginaltones.namelyco—articulation.Meanwhilethereal'gshort-timebreaksincontinuousspeech,whichshowsSeIL∞ofrhythmforspokenperson.Predietion,analys

7、isandcontrolonprosodicinformationsuch船pitchfrequency,timelengthandmagnitudeofspeechsignalarenamed嬲prosodiceontrolforChineseTTS.Atpresent,therearemanyproblemsnottosolveonprosodiccontrolalgorithmforChinesespeechsynthesis,SOthatthesyntheticspeechqualityisrela

8、tivelylowinnaturalnessandintelligibility.Becausethesyntheticspeechqualityhasbeennotreachedtothelevelacceptedbyuser,ItisrestrictedthatthistechnologyCanbewidelyappliedinthemarket.Asarcsult,thispaperisdeept0rese

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。