短时语音说话人识别方法及应用.pdf

短时语音说话人识别方法及应用.pdf

ID:51200643

大小:13.11 MB

页数:54页

时间:2020-03-21

短时语音说话人识别方法及应用.pdf_第1页
短时语音说话人识别方法及应用.pdf_第2页
短时语音说话人识别方法及应用.pdf_第3页
短时语音说话人识别方法及应用.pdf_第4页
短时语音说话人识别方法及应用.pdf_第5页
资源描述:

《短时语音说话人识别方法及应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、学校代码:10246v:09210240084短吋语音说话人识别方法及应用院系:计算机科学技术学院专业:计算机应用技术姓名:肖星星士匕B去十曰寸?女师:冯瑞副教授完成曰期:2012年5月20日短时语音说话人识别方法及应用院ˈ系:计算机科学技术学院专ˈ业:ˈ计算机应用技术作ˈ者:肖星星ˈ攻读学位:ˈ理学硕士ˈ指导教师:ˈ冯瑞副教授指导小组成员:金城副教授目录■ˈAbstractˈ第一章引言ˈl.i说话人识别的应用领域........1.2说话人识别的分类ˈ1.3影响说话人识别性能的因素1.4说话人识别的研究现状........1.5论文工作与组织安排ˈ2.

2、1系统框架ˈ-13-2.2前端处理ˈ-14-2.3特征参数的选择ˈ-16-2.4特征提取ˈ-19-2.5训练过程和识别过程ˈ-25-2.6ˈ/J、gˈ-27-第三章短时语音说话人识别方法ˈ-28-3.1短时语音问题的研究ˈ-29-3.2短时语音说话人识别算法的提出ˈ-33-3.3基于共性特征选择的GMM模型ˈ-34-3.4基于共性特征选择的GMM模型的训练过程ˈ-35-3.5基于共性特征选择的GMM模型的识别过程ˈ-37-3.6算法优缺点ˈ-38-3.7ˈ料ˈ-39-第四章短时语音说话人识别的应用ˈ-40-4.1机器人系统ˈ-41-4.2语音技术在机器人

3、系统中的应用ˈ-41-4.3智能玩具机器人中的说话人识别ˈ-42-4.4实验结果ˈ-43-4.5小结ˈ-44-第五章总结与展望ˈ-45-攻读硕士学位期间的科研成果ˈ-46-参考文献ˈ-47-Siltˈ-50-摘要摘要经过几十年的发展,语音处理技术取得了许多破性的进展,很多语音技术像语音识别技术、语音合成技术等已经达到了大规模应用的水平。作为一种自然的交互方式,语音技术的普及将为每个人的円常生活提供便利。说话人识别技术是语音处理技术的一个重要分枝。上世纪90年代中期,特别是高斯混合模型应用于该领域之后,说话人识别技术获得极大的发展和完善。说话人识别技术在安

4、静理想环境中和在说话人语音充足的条件下,可以达到很高的识别率,甚至超越普通人类的识别水平,基本满足实际应用的要求。但是在现实的应用场景中,由于开放环境的特殊性和复杂性,存在着噪声、信道、训练与识别语音时长等干扰因素,系统的识别性能往往会出现大幅度的下降,无法达到在实验室环境中的识别水平,这也直接影响了说话人识别技术的大规模普及应用。短时测试语音是影响说话人识别性能的一个因素,由于实际应用场景的条件限制、复杂性或应用需求,会使原始语音信号中包含说话人个性信息的特征数量过少,因此会导致识别性能的急剧下降。针对短时语音的影响,本文提出了一种基于共性特征选择的说

5、话人识别算法,在说话人训练和识别的过程中采用特征选择的方法,通过筛选特征,减少可能导致错误决策的特征向量,降低分险,提高识别率。本文首先详细研究了一个完整的基于高斯混合模型说话人识别系统。然后分析了短时语音的问题和短时语音说话人识别的相关算法,提出了存在的问题。通过对算法缺点的分析,作者被启发出一个更简单更有效的短语音识别算法,对当前的短语音说话人识别算法进行改进。本文将该识别算法应用于一款玩具机器人系统中,试验结果表明,系统识别性能得到了明显的提升,新算法能有效识别0.25秒左右的短时语音,比现有传统算法有明显提升,提高了玩具机器人的智能性和娱乐性。关

6、键词:说话人识别混合高斯模型短时语音特征选择玩具机器人中图分类号:TP391.4复曰.大学硕丨:学位论文AbstractAbstractAfterdecadesofdevelopmentaudioprocessingtechnologyhasmadealotofbreakthrough,manyaudiotechnologieslikespeechrecognitiontechnologyandspeechsynthesistechnologyhasreachedtheleveloflarge-scaleapplications.Asanaturalwa

7、yofinteraction,thepopularityofaudiotechnologywillfacilitateeachperson'sdailylife.Speakerrecognitionisanimportantbranchofspeechprocessing.Inthemiddleof1990s,especiallyaftertheapplicationofGaussianmixturemodelinthespeechfield,thespeakerrecognitiontechnologyachievedgreatdevelopmenta

8、ndimprovement.Undertheconditionofadequat

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。