基于统计分类的汉语词组的拼接规律研究,普通话语音合成中自然度的提高

基于统计分类的汉语词组的拼接规律研究,普通话语音合成中自然度的提高

ID:5388643

大小:145.93 KB

页数:4页

时间:2017-12-08

基于统计分类的汉语词组的拼接规律研究,普通话语音合成中自然度的提高_第1页
基于统计分类的汉语词组的拼接规律研究,普通话语音合成中自然度的提高_第2页
基于统计分类的汉语词组的拼接规律研究,普通话语音合成中自然度的提高_第3页
基于统计分类的汉语词组的拼接规律研究,普通话语音合成中自然度的提高_第4页
资源描述:

《基于统计分类的汉语词组的拼接规律研究,普通话语音合成中自然度的提高》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、嫩娜考2oo0年第14卷jI2j时基,于统计分类的汉语词组的拼接规律研究普通话语音合成中自然度的提高△柴佩琪△’rf2.HfDz孙逊摘要汉语词组的拼接,按照统计规律分成三类:字与简盲之,词组拼接是研究当两十字组合成诃时.两字之间字之间存在明显的间隙、两字紧密相连但协同音变不明显、两的间隙和过渡规律,特别是后字与前字衔接紧密程度、静音长字发生突出协同音变。本文通过统计分类的措施解决两芋拼度。拼接的研究有利于解决一字一顿、一诃一顿和过于急促、接对其间隙的控制规律.产生回音现象等问题。关键词词组拼接协同盅音问隔静音

2、韵尾组合根据统计分析证明,前后宇之间的组合关系不外乎以下调素论三类:1.间隔明显.静音长度从toms到lOOms不等,两字意和一、问题的提出但形离.可认为此种情况下两字相互作用弱.协同发音不显著.合成时主要在于间隙长度。这一类构成了本文的主要研究我们在昔通话语音合成系统中,采取了一系列的基本措对象.例如本国(ben3guo2):施,采取的合成基本单元为音节和词组,建立了大词汇量语音库。专业发音、良好维护的语音库,保证了可懂度和清晰度,以分词作基础的合成主要应解决连续性和自然度,而难点在于以句子为单位的韵律结构

3、问题。主观上说,合民语流的连贯、语调的起伏自然性,衡量标准是对比听辩专业人士的原发短文。客观上说,由于语音信号数字化后完全对应于一串数字数据,波形数据是我们的主要研究对象,分析波形与听辩相结合是我们的主要方法。受连续音变的影响,字和词组在句中短波数据必然作出一定程度的调整。这种变化大体上可把它分成两类:2.两宇不存在明显间隔,紧密相连,但是经实验发现,后(1)类——字/词内部声母、韵母、声调的相关调整。例如,字只是简单连在前字后面,协同关系甚小,在实践中可以拼在A、非首部字的声调长度可能变短:B、后一十字的声

4、母为(1/一起即可.这类词包括:后字首部为Sh、s、e、o的词;o的同隙m/n/y/v/w)时,该声母要和前一字的韵尾发生协同同音变;稍大,可固定取lOres。c、根据边缘谓紊脱落理论[1],在同一音部中,一十边缘调紊例如慈善(d2shah4)若不属于音部尾部,且声调亦不在音部边缘,那么该调紊即消失。连续语流中的中间字同样存在“调紊脱落”。(2)类——字/词之间的拼接羞薹的变化规律。第一种调整相对复杂,由于我们采取的合成措施,对第一种变化已作了简单有效的处理。而后一类变化.本文使用统计分类的分析办法,得出了可

5、行结果,为整十合成打下了基础.本文的目标在于,总结普通话语音的基本元素(声母、韵母、声调)对词组内字/字之间的拼接规律。二、问题的定义3.两字不仅紧密相连,难以切割,而且前字尾部含有后字黎佩鐾儡藩奎差襻辊黍000。9;·27·MicrocomputerApplicationsVo1.16,No.2.2000研究与设计般型电脑应用2000年第16卷第2期首部成分,后字首部又有前宇成分,协同发音特别明显,不能首先.对于一些声调韵完全相同的词.理论上间隔静音应茼单拼接,必须做过渡处理此类包括后字首部为1、m、IX、

6、Y、当相同,但是,实际波形中.有一些相同<1>.另一些并不相W、1-的词。不难发现,这类声母垒为半元音.鼻音等周期性明同<2>,例如,显、振幅大,协同音变近似于元音之间的相互影响处理方法词音标间隔集中于:调整前字和后字的音长、音高和音强.改善听辩效果。<1媾发aheng1fal90ms例词:愚昧(yu2mei4):征发zheng1fal90ms<2j呋半da4ban480ms大办.da4ban463ms由于<2>类现象很普遍,所以,除了在听觉上对前后字强调程度稍有不同外,可认为发音是很大弹性的,间隔统计不应当

7、过于精确化、固定化,作为一种范围,应当以听辩效果为参照,把过细的类合并。第二.对于静音本身的确定也存在两个取舍选择:一个是音量很小的噪音与辅音的区别:一些声母振幅很小,在听辩上上述分类表明,在声韵调三大要素中,影响拼接的质的是难以分辨,在波形上近似于噪音。在统计中,我们采取了如下后字声母,拼接规律就是针对(1)类词(声母为:z、zh.j、C、b、措施:把单音节库的维护和合成统一起来,对于声母前部带有d,g、p,t、k、a)<本文中以下简称间隔声母表>,研究其量和静音和微小的音节噪音.通过取域值的办法,去掉噪音

8、t重新度的规律。维护库}而对于静音统计,同把域值以内的噪音按静音统一统计。另一个是前字尾部与后字空白的区分问题:前字的尾部往三、研究方法往还存在噪音的延伸,加上一段静音,再出现后字,例如:换气huan4qi4总间隔:1950bytes,前字韵尾的实际统计分析表明,后字声母对拼接起到本质作用。为了延续}220bytes波形:彻底弄清声韵调所起的作用,主要工作分为两步:】.声调的作用。两字调形组合达2o

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。