基于高层信息融合的短语音说话人识别方法研究

基于高层信息融合的短语音说话人识别方法研究

ID:35071537

大小:3.96 MB

页数:79页

时间:2019-03-17

基于高层信息融合的短语音说话人识别方法研究_第1页
基于高层信息融合的短语音说话人识别方法研究_第2页
基于高层信息融合的短语音说话人识别方法研究_第3页
基于高层信息融合的短语音说话人识别方法研究_第4页
基于高层信息融合的短语音说话人识别方法研究_第5页
资源描述:

《基于高层信息融合的短语音说话人识别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文题目:基于高层信息融合的短语音说话人识别方法研究研究生何建超专业电子与通信工程指导教师章坚武教授完成日期2016年3月杭州电子科技大学硕士学位论文基于高层信息融合的短语音说话人识别方法研究研究生:何建超指导教师:章坚武教授2016年3月DissertationSubmittedtoHangzhouDianziUniversityfortheDegreeofMasterTheResearchofHigh-levelInformationFusionBasedSpeakerRecognitionAlgorithmUsingShortUtteranceCandidate:He

2、JianchaoSupervisor:Prof.ZhangJianwuMarch,2016杭州电子科技大学学位论文原创性声明和使用授权说明虑创性声巧本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行硏巧工作所取得的成果。除文中己经注明引用的内容外,本论文不含任何其他个人或集体己经发表或撰写过的作品或成果。对本文的研巧做出重要贡献的个人和集体,均已在文中W明确方式标明。一。申请学位论文与资料若有不实之处,本人承担切相关贵任论文作者签名曰期:年月^^学化论文使用授权说明;本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即研巧生在

3、校攻读学位期间论文工作的知识产杖单位属杭抽电子科技大学。本人保证毕业离校后,发表论文或。学校有权保留送交论文的复印件使用论文工作成果时署名单位仍然为杭州电子科技大学,允许查阅和借阅论文;学校可1^公布论文的全部或部分内容,可1^允许采用影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定><<;论文作者签名<;了曰期=^4拥巧也也指导教师签名^^/曰期:〇2^月'5^;_1佑^^^|戸^杭州电子科技大学硕士学位论文摘要语音信号是人类情感交流和认知分享的重要载体,也是人类最基本和最自然的交流方式。说话人识别是研究如何从语音波纹中提取能表征

4、语者个性化特征的信息,进而利用该个性化信息通过建模方式对语者的身份做出判决的技术。高斯混合模型凭借其出色的性能而被广泛地应用于说话人识别领域。为了解决测试环境与训练环境失配的问题,主流模型通常会引入一个非目标人模型,非目标说话人模型包括通用背景模型和竞争模型,引入通用背景模型后构成GMM-UBM系统。针对个人GMM与UBM音素空间不匹配的问题,Reynolds提出基于最大后验概率升级的UBM-MAP-GMM系统。与此同时,随着基于声道信息的浅层特征参数的提取逐渐进入了瓶颈期,学者们将注意力转向了高层信息融合的新特征,如基于声门信息的韵律特征。除此之外,针对通道失配等补偿技术被不断地

5、提出,其中JFA和i-vector凭借其夯实的理论基础而备受青睐,其将低维语音信号映射至高维超矢量空间后进行分析。基于上述分析,本论文主要研究以下内容:1、针对UBM-MAP-GMM系统中部分高斯分量具有低区分性甚至拉低系统得分,提出了一种基于筛选高斯分量的确认方法。通常认为GMM中各高斯分量代表空间音素类,而UBM代表普遍的声学信息类。通过UBM自适应得到的个人GMM中不仅具有语者个性化的信息,也包含了在训练阶段完全不存在的非说话人信息。另外值得考虑的是,用于训练个人GMM的语音受限于时长和文本内容等,导致部分音素类信息不足,进而导致对部分音素类信息的建模出现偏差。体现在自适应后

6、的个人GMM中就是有些高斯分量无法准确地描述语者信息,即具有低区分性。实验结果表明,改进后的系统识别性能得到改善。2、针对基于浅层声道特性的特征参数对识别性能的提升乏力,提出了一种基于高层信息融合的确认方法,该方法巧妙地将浅层短时特征参数和高层信息通过二次判决机制融合在了同一框架中。理论上,反映声道特性的短时特征参数与反映声门信息的韵律特征参数从不同角度刻画了语者,故具有互补进而提升系统性能的能力。实验结果表明,结合基频和共振峰等高层信息的文本依赖的确认系统能有效地降低等错误率。3、针对降维后特定主成分中蕴含说话人个性化信息,提出一种基于降维超矢量的说话人确认算法。由最大后验概率算

7、法得到的个人GMM的高斯超矢量,经过特征降维处理后发现前两维主成分中蕴含的性别信息明显,而前特定维主成分中则蕴含的语者个性化信息明显。基于前者,首先提出一种性别选择策略和GMM-SUBM架构。基于后者,本文通过实验确定用于表征测试者身份的最佳维度。实验结果表明,该方法能通过低复杂度算法提取得到一个身份矢量来表征语者,同时在短语音时系统识别效果得到改善。关键词:筛选高斯分量,韵律特征,二次判决,特征降维,身份矢量I杭州电子科技大学硕士学位论文ABSTRACTSpeech

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。