欢迎来到天天文库
浏览记录
ID:9418217
大小:132.07 KB
页数:13页
时间:2018-04-30
《基于语块的英语文语转换系统的韵律生成方法》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、基于语块的英语文语转换系统的韵律生成方法为预测英语文语转换(Text-to-Speech,TTS)系统中韵律生成模块的韵律边界,通过在中间短语、语调短语和语句后分别插入不同长度的停顿,产生使合成语音具有与真人语音类似的韵律结构.通过采用基于语块的中间短语切分,以中间短语为基本单位,生成一个语调短语边界预测的学习语料库,然后采用转换式学习法进行标注学习,从而实现韵律边界的切分.在对真人语料库进行测试的实验中,标注正确率达到81.32%,通过在学习中增加语调短语音节数和标点符号的约束规则,可进一步提高标注正确率.关键词:文语转换;韵律生成;自然语言处
2、理11014;TP391.1AChunk-basedprosodygenerationapproachinEnglishTTSWANGLia,WANGYongshengb(a.CADresearchcenter;b.GermanCollege,TongjiUniv.,Shanghai200092,China)Abstract:TopredicttheprosodicboundaryforprosodygenerationmoduleinEnglishText-to~Speech(TTS)system,theprosodicstructureofs
3、peechsynthesisisgeneratedbytaggingindifferentlengthsbehindintermediatephrasetagging,intonationphraseandpartofspeech,whichissimilartooneofthehumanvoice.Aftersegmentingtheintermediatephrasebychunkparsing,acorpusforintonationphrasepredictioniscreated,andthenprosodicboundariesare
4、predicatedbyusingtransformation-basedlearningtolearnrulesofintonationphraseprediction.Thetaggingaccuracyforintonationphraseis81.32%accordingtotheexperiment,whichcanbefurtherimprovedbyaddingtheconstraintrulesofintonationphrasesyllablecountandpunctuationintothelearning.Keywords
5、:text-to-speech;prosodygeneration;naturallanguageprocessing0引言就基于大语料库的英语文语转换(Text-to-Speech,TTS)系统而言,语音合成的拼接单元都来源于原始的真人朗读的连续语音流,包括短语、单词、音节、双音及单音等,语音合成时通过单元选择算法从语料库中选出最符合目标单元语境的样本进行拼接,其中语境就包含目标单元的韵律约束.为了使合成的语音更加自然,在可能的条件下,总是尽量选取长度最大的语音单元,以避免对合成语音进行过多的韵律调整.因而对于TTS系统中的韵律生成模块,短语之
6、间的停顿或韵律边界预测(ProsodicBoundaryPrediction)成为重要的研宄内容.韵律停顿的分级和描述系统有多种,如ToBI将韵律停顿分成5级(0到4),0用于表示一些闪音和塞擦音间的停顿;1用于表示中间短语内单词之间的停顿;3用于表示中间短语之间的停顿;4用于表示语调短语之间的停顿.此外ToBI还专门增加一个停顿等级2表示停顿强度和语调单位划分不匹配的情况,而0STEND0RF等人将之进一步压缩到4级(1至4级)[1,2],该标注系统的例子见图1.图10STEND0RF韵律停顿的分级示例观察以上标注系统,可将韵律结构看作由语句(
7、Utterance,UTT)、语调短语(IntonationPhrase,IP)和中间短语(IntermediatePhrase,??)组成.这样语音合成时,在中间短语、语调短语和语句后分别插入不同长度的停顿,就可以使合成语音具有与真人说话类似的韵律结构.下面分别研究中间短语的切分和语调短语的边界预测方法.1基于语块的中间短语切分分析图2句法结构和韵律结构的比较,可看出韵律结构(ProsodicStructure)和句法结构(SyntacticStructure)存在一定联系,从句法结构中可推出韵律结构,并通过结构分析生成韵律解析.但由于句法结构
8、是非线性的,存在嵌套,句法解析器的空间复杂度和时间复杂度均较高,并且对于任意文本效果并不理想,因此许多研宄人员希望直接从文本中获得韵律结
此文档下载收益归作者所有