资源描述:
《一种汉语语音变换技术》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、语音技术VoicetechnologY文章编号:1002-8684(2007)06-0037-04一种汉语语音变换技术·论文·孙卓1,岳振军2(1.总参谋部通信工程设计研究院,辽宁沈阳110005;2.解放军理工大学理学院基础电子学系,江苏南京211101)【摘要】汉语语音变换技术的目的是将汉语语音中源说话人的语音特征转换为目标说话人语音特征。提出的适用于汉语说话人的变换算法分为3个部分:前两部分用高斯混合模型实现了语音的谱包络(线性预测编码)及其激励(残差)的转换;第三部分采用支持向量回归算法实现语音的韵律变
2、换规则建模,结合汉语语音特点利用基音同步叠加算法实现语音的超音段特征调整。与现有的语音变换算法进行比较,算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音变换并得到高自然度合成语音,是一种有效的汉语语音变换算法。【关键词】汉语语音变换;线性预测编码;残差;高斯混合模型;超音段特征;支持向量回归【中图分类号】TN912.3【文献标识码】AChineseSpeechConversionTechnologyBasedonLPCandResidualModelSUNZhuo1,YUEZhen-jun2(1.
3、GCEDRI,Shenyang110005,China;2.DepartmentofBasicElectronicIS,PLAUST,Nanjing211101,China)【Abstract】Speechconversionisanewtechnologytochangethesourcespeaker′sfeaturestothetargetspeaker′sfeaturesinthespeech.Inthispaper,theChinesespeechconversionsystemisdividedin
4、tothreeparts.Inthefirstandsecondpart,GMM(GaussianMixedModel)isusedtotransformthespectralenvelope[LPC(LinearPredictionCoding)]andtheimpulse(residual).Inthethirdpart,theChinesespeech′ssuper-segmentalfeaturesisregulatedwiththeSVR(SupportVectorRegression)andtheT
5、D-PSOLA(Time-DomainPitchSynchronousOverLap-Add).ThisalgorithmiscapitaloftransformingChinesespeechandproducingspontaneousvoice.【Keywords】Chinesespeechconversion;LPC;residual;GMM;super-segmentalfeature;SVR1引言音,其是目前较为成功的语音变换算法之一[2],然而由于算法本身以及汉语语音独特的发音特点,使得此算语音变
6、换(voiceconversion或voicetransformation)法并不适用于汉语语音变换,而专门针对汉语语音发是一种新兴的信号处理技术,其目的是在保留源语音特点的语音变换算法还没有出现。音文本信息不变前提下,将语音中源说话人(source笔者提出的适用于汉语语音说话人语音变换的算speaker)特征转化为目标说话人(targetspeaker)特征,法是对基于LPC语音变换算法上的改进。算法根据使变换后的语音听起来更倾向于目标说话人[1]。通常语汉语语音的发音特点,对语音的超音段特征进行了韵音中说话
7、人特征分为音段特征(如谱包络、谱激励)与律调整,提高了合成语音的自然度与可懂度。算法主超音段特征(如基频、时长、幅度)。研究表明,语音的音要分为3个部分:第一部分实现谱包络[线性预测编码段特征与超音段特征中均包含说话人信息。目前语音(LinearPredictionCoding,LPC)]转换;第二部分实现变换技术还处于发展阶段,大多数语音转换算法主要谱激励(LPC残差)转换;第三部分实现语音的超音段是对语音的音段特征进行变换,而语音的超音段特征特征转换。在谱包络和谱激励转换部分,算法采用GMM转换由于技术难度
8、较大,并没有较多涉及。模型,相对于其他的映射方法,这是一种“软”分类方利用高斯混合模型(GaussianMixtureModel,GMM)法,可以在变换阶段得到连续的转换参数。在谱激励转实现语音的谱包络转换,利用残差预测实现谱激励转换部分,算法中使用的是残差预测变换方法,完全保留换的语音变换算法,可以得到合成效果较好的变换语电声技术2007年第31卷第6期!"#语音技术Voicetec