基于神经网络的语音情感识别技术研究论文

基于神经网络的语音情感识别技术研究论文

ID:10917523

大小:1.03 MB

页数:54页

时间:2018-07-08

基于神经网络的语音情感识别技术研究论文_第1页
基于神经网络的语音情感识别技术研究论文_第2页
基于神经网络的语音情感识别技术研究论文_第3页
基于神经网络的语音情感识别技术研究论文_第4页
基于神经网络的语音情感识别技术研究论文_第5页
资源描述:

《基于神经网络的语音情感识别技术研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、国内图书分类号:TP39国际图书分类号:681.3工学硕士学位论文基于神经网络的语音情感识别技术研究硕士研究生:韩文静导师:李海峰教授申请学位:工学硕士学科、专业:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2007年7月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP39U.D.C.:681.3ADissertationfortheDegreeofM.Eng.RESAERCHONTECHNIQUESOFNEURALNETWORKBASEDSPEECHEMOTIONR

2、ECOGNITIONCandidate:Supervisor:AcademicDegreeAppliedfor:Specialty:DateofDefence:HanWenjingProf.LiHaifengMasterofEngineeringComputerScienceandTechnologyJuly,2007Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要情感在人类的感知、决策等过程中扮演

3、着重要角色。在人工智能迅速发展的今天,开发具有情感智能的人机交互方式有着极其重要的理论和实际意义。语音作为人类最重要的信息传递方式,携带着丰富的情感信息,目前基于语音信号的情感识别研究已受国内外相关研究机构的广泛关注。本文针对四类常见的情感状态:生气、高兴、悲伤和惊奇展开语音情感识别研究。首先在现有语料库的基础上,对声学韵律特征和共振峰特征的情感区分能力进行了分析,并选择在基频、能量、语速和共振峰等参数的基础上衍生出情感特征。接下来使用Elman反馈网络进行语音情感识别,与常用的MLP(Multip

4、lyLayersPreceptor)相比该模型能够处理情感时序特征,更接近人耳连续的听觉机制。情感识别领域中广泛使用的情感特征按照时间粒度的差异可分为基于语句(utterancebased)的全局统计特征和基于语音帧(framebased)瞬时特征,但这两类特征的时间粒度选取是否合理并未得到验证,于是提出使用基于语段的特征用于语音情感识别,并给出“最佳识别段长”的概念。实验表明,系统识别率同语段长度有着较强的相关性,系统识别率在使用段长为140帧/段的语段特征时达到最高,与使用全局特征相比系统性能提

5、高了4.2%。通过比较使用全局统计特征时的识别结果和使用基于语段的时序特征的识别结果,可以得出这样的结论:全局统计特征和时序特征侧重于在不同的情感维度上区分情感。最后,为进一步提高系统识别性能,构建了GlobalControlElman网络将两类特征相融合。经过特征融合后的系统识别率与分别单独使用全局统计特征和时序特征均有所提高,达到66.0%。上述相关研究工作为后期进行深入的语音情感识别技术研究打下基础。关键词语音情感识别;声学特征;人工神经网络;Elman网络-I-哈尔滨工业大学工学硕士学位论

6、文AbstractEmotionsplayasignificantroleinhumanperceptionanddecisionmaking.Alongwiththerapiddevelopmentofartificialintelligencetheseyears,ithasgreatimportanttheoreticalandpracticalsignificancetoimprovehuman-machineinteractionbyusingemotionintelligence.Spe

7、echasthemostimportantmediumofhumancommunicationcontainslotsofemotionalinformationofthespeakers,sohowtoautomaticallyrecognizeemotionalstatesfromspeechisthesubjectofattentionbyresearchersfromrelatedresearchinstitutionsathomeandabroad.Researchofspeechsign

8、albasedemotionrecognitionisdevelopedfocusingonthefourkindsofemotionalstates:anger,happiness,sadnessandsurprisewhichcanbealwaysfoundindailylife.Firstly,theprosodicandformantfeatures’abilitytodiscriminateemotionstatesisanalyzedbasedonthee

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。