基于深度学习的与文本无关话者确认研究

基于深度学习的与文本无关话者确认研究

ID:35106325

大小:7.74 MB

页数:91页

时间:2019-03-18

基于深度学习的与文本无关话者确认研究_第1页
基于深度学习的与文本无关话者确认研究_第2页
基于深度学习的与文本无关话者确认研究_第3页
基于深度学习的与文本无关话者确认研究_第4页
基于深度学习的与文本无关话者确认研究_第5页
资源描述:

《基于深度学习的与文本无关话者确认研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、來';!*¥岳卢夺留钟參名来大赛UniversitofScienceandTechnoloofChinaygy硕±学位论文'—-'V#t.、:试?:取成坪:V^^s::;;吁气'.、!纖:典,畔,论义题目基于深度学习的与文木无关巧者确认巧堯作者姓名吴明辉学科专业化洛与条统导师姓名專辞到教投完成时间二〇—六年五月木担#《若乂大赛硕±学位论文嚷基于本无!醫誠霜作者姓名:吴明辉学科专业:电路与系统专业导师姓名:李辉

2、副教授一、miiUnive巧ityofScenceandTechnologyofChna’AdissertationIbrmastersdegree#Researchontex-tindependentspeakerverificationbasedondeeplearningAuthor:MinhuiWugSecialit:Circuitsandss化mpyySuervisorAitPr.HuiLip:ssocaeofFini

3、shedTime;Ma2016y,一、中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研巧工作所取得的成果。除己恃别加W标注和致谢的地方外,论文中不包含任何他人己经发表或撰写过的研巧成果-。与我同工作的同志对本研巧所做的贡献均己在论文中作了明确的说明。作者签名:签字日期:居.中国科学技术大学学位论文授权使用声明一作为申请学位的条件之,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部口或机构,

4、允许论文被査阅和借阅^送交论文的复印件和电子版,可文将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可W采用影印、縮印或扫描等复制手段保存、汇编学位论文。本人提交的电子文培的内容和纸质论文的内容相一致。保密的学位论文在解密后也进守此规定。白4开□保密年作者篇名:灰^鸣导师签名:^丈;i签字日期:签字日期7/oLL摘要摘要一随着科学技术的不断进步,电话己经成为人们日常生活中不可或缺的部分。在身份认证技术研巧领域,越来越多的研究人员开始关注如何使用电话语音进行身份认

5、证,因为相对于其它身份认证技术来说,使用电话语音进斤身份认证所需的设备简单、成本低、易获取,更重要的是在使用电话语音进行身份一认证的过程中,用户不需要接触设备,只需要简单的说句话,,便可完成认证大大提商了用户的接受率。另外,说话人确认技术还是语音识别技术研巧领域的一个重要研巧方向,所W说话人确认技术的研巧不仅具有重要的理论研究意义而且还具有广泛的应用前景。目前在说话人确认研巧领域中,主流的说话人建模方法都是基于概率统计模型的,其中最具代表性的概率统计说话人模型当属离斯混合模型(GaussianMi

6、xtureModel,GMM)。髙斯混合模型采用非常多的高斯概率密度函数分量,对说话人的语音特征分布进行了较好的描述,从而取得了不错的效果;但说话人确认是一个二元分类问题一,而商斯海合模型只是种概率生成性模型,其区分能力非常有限,所W需要寻找同时具有强大表征能力和很强区分能力的模型进行说话人建模。近年来,深度学习(DeeLearnin,DL)理论在模式识别领pg域掀起了一股非常大的研究热潮一个复杂的神经网络横型,其出发点是想构建来模拟人脑的思维方式,然后对数据进行分析和处理。目前深度学习理论所依

7、托的实现载体是深度神经网络(DeepNeuralNetwork,DNN)。深度神经网络凭借多隐层的结构特点,使得其具有很好的表征能力和区分能力,目前在摸式识别的诸多研巧方向都取得了成功应用。本文主要研巧内容就是将具有强大表征能力及区分能力的深度神经网络应用于说话人确认系统中进行说话人建模,构建基于深度神经网络的话者确认系统,针对建模过程中深度神经网络输入特征的选择、网络结构W及网络训练方法等关键问趙进行了深入的研巧,并对多种基于深度神经网络的说话人确认系统的结构及性能进行对比。首先—,介绍了

8、目前说话人确认技术研巧领域最为经典的概率统计模型高斯混合模型,并对其原理进行了详细阐述。针对其应用于说话人确认系统--中使用的GMMUBM结构进行了深入的讨论,并对GMMUBM说话人模型训练过程中使用的MAP算法进行介绍,然后通过实验分析了混合度的选取对

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。