基于时序深度学习模型的语音情感识别方法研究.pdf

基于时序深度学习模型的语音情感识别方法研究.pdf

ID:35008047

大小:3.74 MB

页数:69页

时间:2019-03-16

基于时序深度学习模型的语音情感识别方法研究.pdf_第1页
基于时序深度学习模型的语音情感识别方法研究.pdf_第2页
基于时序深度学习模型的语音情感识别方法研究.pdf_第3页
基于时序深度学习模型的语音情感识别方法研究.pdf_第4页
基于时序深度学习模型的语音情感识别方法研究.pdf_第5页
资源描述:

《基于时序深度学习模型的语音情感识别方法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、嗨!thesis硕士学位论文基于时序深度学习模型的语音情感识别方法研究RESEARCHONSPEECHEMOTIONRECOGNITIONMETHODBASEDONTIMESERIESDEEPLEARNINGMODEL陈晓敏哈尔滨工业大学2018年6月国内图书分类号:TP39学校代码:10213国际图书分类号:681.3密级:公开工学硕士学位论文基于时序深度学习模型的语音情感识别方法研究硕士研究生:陈晓敏导师:李海峰教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2018年6月授予学位单位:哈尔滨工业大学Cla

2、ssifiedIndex:TP39U.D.C:681.3DissertationfortheMaster’sDegreeinEngineeringRESEARCHONSPEECHEMOTIONRECOGNITIONMETHODBASEDONTIMESERIESDEEPLEARNINGMODELCandidate:ChenXiaominSupervisor:Prof.LiHaifengAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyAffi

3、liation:SchoolofConputerScienceandTechnologyDateofDefence:June,2018Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要随着语音识别技术的成熟,人们对语音情感识别技术的呼声越来也高,因为语音情感识别技术的发展将使机器步入更加人性化的时代,同时在很多领域都有不可估量的作用,如汽车驾驶、医疗服务、远程教育、疾病诊断等。但目前语音情感识别技术还未达到实用的程度,一方面因为情感活动本身是一种复杂

4、的生理过程,另一方面用于语音情感识别的数据库、模型等还需要进一步的开发。本文从语音情感识别模型出发,针对传统长短时记忆模型(Long-ShortTermMemory,LSTM)对所有语音帧信息都要学习的问题,认为情感语音的帧序列中分为情感帧和非情感帧,并提出面向情感语音识别的LSTM-CTC时序深度学习模型,通过联结主义时间分类(Connectionisttemporalclassification,CTC)方法自动对齐能力将情感标签对齐到语音中的情感帧上。在IEMOCAP情感数据库使用4类情感进行话者独立实验(高兴、悲伤、中性、生气)取得了65.

5、7%(UAR)和64.2%(WAR)的识别性能,比目前性能最好的LSTM-ELM模型提高了2.3%(UAR)和1.8%(WAR)。接着,针对LSTM-CTC模型中对语音情感帧一视同仁的问题,分析认为语音情感中每一个情感帧的情感信息含量不同,所以本文从注意力机制角度出发提出AttRNN-RNN时序深度学习模型,将语音情感识别过程看作是一个编解码问题,考虑到人类的注意力具有从整体到局部的变化特性,使用LSTM作为解码器在每个时间步中计算注意力进行情感识别推断,模拟人类的注意力转变过程。在IEMOCAP数据库的四类情感识别上,获得了67.6%(UAR)

6、和67.5%(WAR)的性能,优于LSTM-CTC模型。但是考虑到CTC方法具有将情感标签与语音帧自动对齐的特性,为了充分利用这一优势,在AttRNN-RNN模型基础上引入CTC方法,提出Attention-CTC融合模型,通过共用一个情感语义编码器,将CTC方法和Attention机制联系起来,CTC负责对齐语音中的情感关键帧,Attention机制负责在不同情感帧中抽取不同程度的信息进行学习。此模型在IEMOCAP库上取得了70.3%(UAR)和65.1%(WAR)的识别性能。最后,本论文实现一个在线语音情感识别系统——OESERS系统,将上

7、述的研究成果转化为实际应用产品。系统采用Client/Server结构,具有良好的识别性能、友好的人机交互界面和大规模并发任务处理能力。该系统为三星Bixby语音助手提供语音情感识别支持。-I-哈尔滨工业大学工学硕士学位论文本文的研究工作为目前语音情感识别领域中存在的关键性问题提供了有效的改进方案,经过实验证明,本文所提出的时序深度学习模型对语音情感识别任务效果显著,同时也为深度学习技术在处理时序序列问题上提供了新的思路和方向。关键词:语音情感识别;神经网络;深度学习;注意力机制-II-哈尔滨工业大学工学硕士学位论文AbstractWiththe

8、maturityofspeechrecognitiontechnology,thevoiceofspeechemotionrecogni

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。