基于关键词_垃圾语音模型优化的关键词识别

基于关键词_垃圾语音模型优化的关键词识别

ID:37062437

大小:3.50 MB

页数:81页

时间:2019-05-16

基于关键词_垃圾语音模型优化的关键词识别_第1页
基于关键词_垃圾语音模型优化的关键词识别_第2页
基于关键词_垃圾语音模型优化的关键词识别_第3页
基于关键词_垃圾语音模型优化的关键词识别_第4页
基于关键词_垃圾语音模型优化的关键词识别_第5页
资源描述:

《基于关键词_垃圾语音模型优化的关键词识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工程硕士学位论文基于关键词/垃圾语音模型优化的关键词识别作者姓名陈祈宇工程领域电子与通信工程校内指导教师晋建秀副教授张伟彬副教授校外指导教师张晓波高级工程师所在学院电子与信息学院论文提交日期2018年4月ImprovedKeywordSpottingbasedonKeyword/GarbageModelsADissertationSubmittedfortheDegreeofMasterCandidate:ChenQiyuSupervisor:AssociateProfessorJinJianxiuA

2、ssociateProfessorZhangWeibinZhangXiaoboSouthChinaUniversityofTechnologyGuangzhou,China摘要随着计算机软硬件技术的发展,当今社会已经逐渐走入了人工智能时代。在移动互联网和物联网的背景下万物开始互通,人机的交互也成为了新技术发展的焦点所在,语音交互正是人机智能交互的一种重要形式。语音是人类最自然也最便捷的沟通方式,这一特点赋予了人机语音智能交互在当下科学技术发展中的重要地位。语音交互的终极目标是实现人与机器的无障碍沟通,

3、随着几十年来语音领域的技术积累,这一目标不再是遥不可及的,大量有效的算法为语音交互奠定了良好的发展前景。本文基于隐马尔科夫模型、高斯混合模型和令牌传递算法,开发了基于Windows平台和Android平台的语音关键词识别系统,并根据解码算法的原理提出了相关的优化方法,在保持系统对预定义的关键词高效、准确的识别的同时,大幅度降低误触发的概率。使得系统能够应用在实际家居环境中,用于电视或者其他智能设备的全语音控制。相关工作和创新点如下:在研究现有基于隐马尔科夫模型语音声学建模的基础上,开发了Windows

4、平台的关键词识别系统,对令牌传递解码算法的缺陷进行深入研究,引入关键词/垃圾语音模型从而使系统对一般的语音具有拒识别能力。并且,通过对实验结果的详细分析,本文提出了利用相符度和稳定度两种置信度评估方法对系统误警率过高的缺陷进一步进行优化,相关的实验验证了该方法的有效性。在系统误拒率变化不大的情况下,将误警率由75.05%降低到了5.71%。最后,在完善系统性能之后,为了增加系统的应用场景,本文利用JNI接口将Windows平台的语音解码系统移植到Android并开发了用户交互界面。关键词:语音关键词识

5、别,隐马尔科夫模型,高斯混合模型,垃圾语音模型,令牌传递算法IAbstractWiththedevelopmentofcomputerhardwareandsoftwaretechnologies,wehavegraduallyenteredtheeraofartificialintelligence.ThankstomobileInternetandtheInternetofThings,allbeingsstarttointeroperate.Human-computerinteractionha

6、sbecomethefocustechnologicaldevelopments.Voiceinteractionisanimportantformforhuman-computerintelligentinteraction.Voiceisthemostnaturalandconvenientcommunicationmethodforhumanbeings.Thusvoice-basedhuman-machineintelligentinteractionplaysanimportantrolei

7、nthecurrentdevelopmentofscienceandtechnology.Theultimategoalofvoiceinteractionistoachievebarrier-freecommunicationbetweenpeopleandmachines.Withdecadesoftechnologydevelopmentinthefieldofspeechrecognition,thisgoalisbeingrealized.Alargenumberofeffectivealg

8、orithmshavelaidagoodfoundationforvoiceinteraction.BasedonhiddenMarkovmodel,Gaussianmixturemodelandtokenpassingalgorithm,thisthesisdevelopsaspeechkeywordspottingsystemforbothWindowsandAndroidplatforms.Basedontheuncertaintyofthedec

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。