说话人识别情感合成问题的概率模型研究

说话人识别情感合成问题的概率模型研究

ID:35107353

大小:7.29 MB

页数:86页

时间:2019-03-18

说话人识别情感合成问题的概率模型研究_第1页
说话人识别情感合成问题的概率模型研究_第2页
说话人识别情感合成问题的概率模型研究_第3页
说话人识别情感合成问题的概率模型研究_第4页
说话人识别情感合成问题的概率模型研究_第5页
资源描述:

《说话人识别情感合成问题的概率模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、?A':,4术X-再’V分类号:TM3Q1单位代码:10335密级:公开学号:21321156硕女学位论文戀论文题目说话人识别情感合成问题的概率模型研究.-点:_作者姓名墜皇、^成-又.指导教师杨董春、扭.;学科巧业)计算机科学与技术二V-...C所在学院计算机科学与技术学院?二—一二心;?提交日期〇六年月十五日一、.心'...-、V‘f—-八*、:乂?分类号:TM巧1单位代码:10巧5

2、;公开学号密级:21321156硕±学位论文论文题目说话人识别情感合成问题的概率模型研究作者姓名^指导教师杨董春学科(专业)计算机科学与技术所在学院计算机科学与技术学院二〇—六年一月二十五提交日期日ADissertationSubmittedtoZheianjgUniversityfortheDereeofgMasterofEnineeringg戀TITLE:ProbabilisticModelingofEmoti

3、onReconstructionforSpeakerReconitiongAuthor:ChenHaoSuervisor:YanYinchunpggSubect:ComuterScienceandTechnolojpgyCollege:CollegeofComputerScienceandTechnologySubm--ittedDate20160125:独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。媚我

4、所知,驗了文中特窥加W标注巧致靖的地方外,论文中不包含其?他人已经发表或摸葛过的研究成果,也不包含为获得渐江欠學或其他教窗轨.构的学位或证书而使用过的材斜…同工作的同志对本研究所緻的任何贾献。与我均已在论文中作T明确的巧巧并表示谢意。学位论文作者签名:签字目期:么0.年3巧日!^学位论文版权使用授枚书本学位论文作者完全了解浙泣欠学有关保留,、使用学位论文的规定有权保留并向國家有关部口或沉构送交论文的复印件和潑盘,允许论文被查阅和借阅。本人授权浙江大学可助将学位论文的全部或部分巧容编入有关

5、数据库i进巧检索l采用影印、缩巧或巧描等复制手段保存、汇编学位论文。,可U(保密的学泣论文在解密后适用本巧权哥)’-学位论文作著签名:辱邮签絮;柄違^巧是〇签字日期:么巧6年5月10日签字日期:方年/月/日?浙江大学硕女学位论文?摘要说话人识别技术对智能通信和信息处理具有重要的推进作用。同时,语音数据具有高维时间序列的典型特征,是信号处理和模式识别领域各种算法验证的珍贵数据资源。因一直火热地进行着此,这个领域的研究工作。语音识别系统的效率容易受到会话差异的影响。即测

6、试语音和训练语音不匹配的情况下,算法准确率会相对下降。其中由于录音者情感变化导致的测试和训练语音不匹配被称为情感失配一一直没有,这至今是个开放问题,很好地被解决。本论文针对说话人识别倩感失配问题,进行了原理的分析和现象的总结。证明说话人情感变换与常见的信道失配问题的不同,解释了现有當法难W解决这个问题的原因。并针对情感噪音的特质提出了基于概率模型的统计推断方法。完善了已有情感合成算法的理论基础,获得了在MASC数据库上个人可重现的最佳效果。针对当前主流的因子分析模型过度拟合的问题,将原模型改进

7、为更符合语音数据特征的完全贝叶斯模型和非参数阻P模型,并给出求解的迭代算法和MCMC采样算法。成功地在不降低推断效果的基础上,将因子分析的模型参数缩减到原问题的30%。本论文的主要贡献如下:1.针对说话人识别情感失配问题,进行了原理的分析和现象的总结。针对不同的说话人W及不同的情感,目前仍然没有通用的模型可W描述情感变化的原因。针对不同)的语音元素(音素、说话人身份、情绪特性等等对说话人特征引起的变化具有很强一的非线性特性。与般的信道失配不同,情感失配没有办法用分隔开的空间分别表征说话人身

8、份和信道的恃征。由于数据量的不足,也没有办法通过LDA等技术进巧无关信息的降维处理。值得法意的是,情感变化具有邻居相似的特性。即中性语音一特征相似的说话人,般在其他情感下也具有类似的特征。2.对说话人识别问题的概率推断模型进行抽象,将测试样本和模型参数数量引入分布提出了基于统计距离的分类模型。现阶段常

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。