基于因子分析的说话人分离技术研究

基于因子分析的说话人分离技术研究

ID:35062891

大小:5.97 MB

页数:70页

时间:2019-03-17

基于因子分析的说话人分离技术研究_第1页
基于因子分析的说话人分离技术研究_第2页
基于因子分析的说话人分离技术研究_第3页
基于因子分析的说话人分离技术研究_第4页
基于因子分析的说话人分离技术研究_第5页
资源描述:

《基于因子分析的说话人分离技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、w-叫馈减;夺因若来大赛UniversityofScienceandTechnoloofChinagy硕±学位论文美-纖X^ceand/咬供占'论文题目基子因子分折的化巧人分壽技术研堯作者姓名^电路与余统学科专业李辉苗j教援导以巧姓名二〇…六■年六?月完成时间牛逸种《我术夫緣硕±学位论文卷基于因子分析的说话人分离技术研究作者姓名;李锐学科专业:电路与系统导师姓名:李辉副教授—完成时间:二〇六年五月八日Univer

2、sityofScienceandTechnologyofChina一A’dissertationformastersdereeg?TheStudofSpeakerDiarizationyBasedonFactoranalsisy’Au化orsName:RuiLiSpecialit:CircuitsandSystemsySuervisorAssociateProf.HuiLip:化Finishedtime:Ma8,2016y中国科学技术大

3、学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除己特别加W标注和致谢的地方外,论文中不包含任何他人己经发表或一撰写过的研究成果。与我同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。>'备作者签名:冰签字日期:中国科学技术大学学位论文授权使用声明一作为申请学位的条件之,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,目P;学校有权按有关规定向国家有关部口或机构送交论文的复印件和电子版,,允许论文被查阅和借阅可W将学位论文编入《中

4、国学位论文全文数据库》等有关数据库进行检索,可W采用影印、缩印或扫描等复制手段保存。本人提交的电子文档的内容和纸质论文的内、汇编学位论文容相一致。保密的学位论文在解密后也遵守此规定。5□保密(年)1^__^y2:作者签名:导师签名勺签字日期:Ly心、。三签字日期:.以7!摘要巧要高速发展的计算机水平和音频处理技术,使得人们对于从海量数据中获取一到感兴趣的人声,,越来越有需求。另方面如何对获取到的各类音频进行合一大挑战,,理有效的管理,也是目前存在的。在此背景下为了满足上述需要一

5、过程说话人分离这:说话人分割和说话关键技术应运而生,其主要涉及两个人聚类。说话人分离系统几乎无任何可供参考的先验信息使用,容易受环境或者建模方法的影响,使得分割和聚类时说话人片段的类纯度得不到保证,基。另外一一直的向上传递于距离准则的层次聚类方式旦出现聚类误差,会。因此本文主要在说话人分割和聚类的建模方法W及类别提纯上展开了探索和研究,主要工作和创新点如下:一第,说话人分离前端语音端点检测VoiceActivi巧Detection,VAD)和(类别提纯方面的研究。针对基线系统中存在的低能量语音难W召回

6、及噪声难W去除的情形,引入了深度学习的方法,在分离前端进行改进。针对层次聚类时出现聚类误差向上传递的情况,提出了基于贝叶斯信息准则(BayesianInformation知terionBIC)的短时类别提纯方法差,,削弱由层次聚类带来的误向上传递的影响。实验结果表明,基于深度学习的语音端点检测,能有效的降,,且基于短时B低说话人分离时的虚警和漏警并且降低说话人分离错误率IC类别提纯的方法,能更新部分聚类错误的说话人片段,提高后续说话人聚类的类纯度。第I::,说话人转折点检测建模方法的研究。探索了基于深度

7、神经网络(DeepNeuralNetwork,DNN)的建模方法在说话人转折点检测中的应用,利用其强大的模型表达能力,提高说话人分割的准确性,这。实验结果表明种基于深度学习的转折点检测建模方法相比于传统的BIC建模方法,无论是在转折点检测,iarizationErrorRate,D化)的准确率和召回率还是对整个系统的分离错误率(D来说一,都获得了定的效果提升。第H,说话人聚类时的因子分析建模方法研究。传统的W贝叶斯信息准则作为相似性度量的说话人分离技术,在短时对话的分离任务中能取得较好的效果,但

8、是随着对话时长的增加,BIC的单高斯模型不足W描化不同说话人数据的分布,且层次聚类时区分相同说话人和不同说话人的口限值难划定。针对此问题,本文尝试基于短时BIC和长时概率线性判别分析(Probabi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。