说话人声音转换方法研究

说话人声音转换方法研究

ID:36821559

大小:2.23 MB

页数:51页

时间:2019-05-16

说话人声音转换方法研究_第1页
说话人声音转换方法研究_第2页
说话人声音转换方法研究_第3页
说话人声音转换方法研究_第4页
说话人声音转换方法研究_第5页
资源描述:

《说话人声音转换方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要说话入声音转换技术是指将原说话人的语音模式转换成其他说话人的语音模式,保持原有的语义信息不变,使转换后的语音听不出是本人所说。声音转换是语音信号处理领域一个较新的分支,该技术可用于文语转换系统、保密通信和网络娱乐等领域,具有重要的实际价值。声音转换按照目不同可分为两类:一类为非特定人声音转换,只要将原话者的声音变掉即可;另一类为源一目标说话人声音转换,是要将原话者的声音变成特定目标话者的声音。针对不同目的的声音转换,本文在语音线性预测分析及LPC合成器的基础上,着重研究了基于基频的非特定人声音转换以及源一目标晚话人声音转换中的声道参数转换。对说话人的非特定人声音转换,可以通过控制LP

2、C合成器中的基频参数来实现。对基频的适当改变可以引起说话人声音模式的改变,但其改变也会引起原语音谱包络的变化,从而可能引起语义失真。本文通过主观听辨和客观谱失真相结合的办法,在基频平移或缩放两种改变方法下,由实验按经验获得适合大多数人的、既引起转换后语音的声音模式改变、同时语义不失真的基频改变范围,以此范围指导基于基频的非特定人声音转换。源一目标说话人声道参数转换是实现源一目标说话人声音转换的关键。通常采取分类获取转换规则的策略,即同一类的参数共享一个规则。显然,分类数越多,转换规则越多,转换效果越好。为了在一定的分类数下能获取尽可能多的转换规则,本文采用基于径向基函数网络(RBFNN)的分

3、类线性加权转换方法,以输入特征矢量对各个类别(隐层节点)的“贡献”作为各子类转换规则的权值,转换后的特征矢量为各子类输出的加权,可以获得远大于分类数的转换规则。针对通常采用FCM算法训练网络隐层节点中心欠准确、影响最终声道转换效果的问题,本文给出改进的差分进化FCM算法来获得更优化的隐层节点中心,并通过对比实验表明使用改进的算法训练中心,最终可在较大程度上提高源一目标话者声道参数转换性能。本文还对转换规则和训练集大小的关系展开相应的实验研究。关键词:声音转换源一目标径向基函数网络分类线性加权转换囊冀霎霎董茎霎薹毫=i雾篁喜;薹萋i季;j霎

4、薹.i耋霎霎,i雾霪薹!墼!!萋萎警垂塞l奏=萋专三

5、!i孽;!蓁!囊霎塞霎娄i霪薹霪妻薹霉琴囊雾囊——篓妻薹薹薹羹;冀霎j萋薹;i篓耋耋妻:萎茎至蓁i雾i主喜i萋荔鍪=霉墓冀j薹羹羹譬j喜囊冀薹蒌羹雾霎i耄至j囊雾;i雾耄霎鬟j;堇摹龟i萋蓉i薹耋妻摹蕊三薹蔓薹堇ii薹;嚣;毫毛≤曼芝萎i茎霎i≤趸i璧i霎i_嘎i籍j蓄,垦

6、

7、曩i肇;圣芝;薹蕉耋三;季薹喜事蓁喜霎霎:薹萋薹=墓{奏i;霪摹二萋耄。卖i蠹冀l;;;主三薹i专妻:量塞;。兰萋塞i耋主i薹÷薹

8、}!i;_囊。;;善

9、霎

10、霎茎;;≤量孝专毫堇乏一章;毫譬。≥壬ii萋善l萋三三;j耋i尹;i垂萼差摹搴;}i;;奏耋耋置!枣至葶i蓦i塞}謇iii董鋈囊雾;?;薹:宝毒÷霎。蠹警l氢雪霉

11、主要§;蠹主j藿羹羹;萋篓;霎羹薹;雾霎至薹霪羹;薹鬟冀薹妻:翼耋耋三i蕈霎i囊薹琴爹蘩蠹霪囊i篓囊耋囊薹霪薹鎏蓁妻羹j篓姜囊差雾雾

12、J。霞垦垦主l薹耄;爹;爹蓦§i善茎薹孽薹霪翼二耄,主耋薹薹要:耋;;;妻萋砉囊垂妻耋i薹l奏薹摹壶唯一毳馨i;;冀茎囊霎耄誊i量≥;i孽萎垂圣.霎;第1章绪论第l章绪论1.1声音转换研究的背景和分类语音在}二{常通讯中占有非常重要的地位,它携带着大量有用信息,一般认为它至少包含语义信息、说话环境信息和说话人特征信息。其中,说话人特征信息描述了与说话人身份相关的声音方面特征,而与具体内容信息和说话环境无关。因此凭借语音信号中的说话入的个性特征,我们仅从电话、网

13、络通讯、广播等中传播的声音就可辨别和确认出说话人的具体身份。这些现象就成为诸多学者研究声音转换的最初出发点。声音转换(VoiceConversionorV0iceTransfo咖ation)是一种改变说话人声音特征的技术,将某个说话人的语音模式转换成与其特性不同的另一种语音模式,而保持语音中原有的具体内容信息(语义信息)和说话时的环境信息不变。声音转换根据转换目的可以分为两类:l、非特定入声音转换:将某个说话人的语音模式转换成与其特性不同的另一种语音模式,使之听不出来是原话者所说,同时保持语音中原有的具体内容信息(语义信息)和说话时的环境信息不变。2、特定人声音转换(源一目标说话人声音转换)

14、:将源说话人的语音模式转换成某个指定的特定目标说话人的语音模式,即保持源说话人原有的语音信息内容不变,使转换后的语音具有目标说话人的声音特点(EMouIinesetaI,1995)。这两类声音转换在本质上是相同的,都要实现语音特征参数的转换,但两种转换的要求程度又是不同的。非特定人声音转换只是使语音的说话人个人性特征发生改变,丽不象源~目标说话人声音转换确定为由源语音转换为目标语音;应该既自,J‘者较后者的要

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。