欢迎来到天天文库
浏览记录
ID:35067209
大小:6.02 MB
页数:72页
时间:2019-03-17
《基于深度学习的语音情感识别方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、I学校饌:10286驅若分类号:户密级:^a_UDC:-学号^ ̄當:口0716_^■■m^?一■|l_—若I-I'。’'-、.给狮-也恭I典誦的J?f’气1W廉《帘六朵i脯硕:t学位论文基于深度学习的语音情感识别方法的硏究研究生姓名:失从贤导师姓名:罗批副教暢申请学位类别工学硕±学位巧予单化亲巧大学一级学科名称信息与通信工括论文答辩日期2016年4月18日二级学科名称信号与信息处理学位授予日期2016年月日答辩委员会
2、主席杉打评阅人/2016年月日表魚未?聲硕±学位论文基于深度学习的语音情感识别方法的研究专业名称:僖息与通僖工趕研巧生姓名:朱从巧导师姓名;罗巧RESEARCHONSPEECHEMOTIONRECOGNITIONBASEDONDEEPLEARNINGAThesisSubmited化SoutheastUniversityFortheAcademicDegreeofMasterofEngineeringBY-ZhuCongxi
3、anSupervisedbyProf.LuoLinSchoolofInformationScienceandEnineeringgSoutheastUniversityAril2016p东南大学学位论文独创巧声明本人声明所呈交的学位论文是我个人在导师指导下进行的研巧工作及取得的研究成果。尽我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研究所做
4、的任何贡献均己在论文中作了明确的说明并表示了谢意。-研究生签名:心赁日期:)也辜牛.奇-东南大学学位论文使用授权声明东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件巧电子文档,可W采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一,致,可W公布(包括W电子信息形式刊登)。除在保密期内的保密论文外允许论文被査阅和借阅论文的全部内容或中、英文摘要等部分内容。论文的公布(包括电子信息形式刊登)授权东南大学研巧生院办理。研巧生答名:乂导师签名;日觀
5、采达^狐^摘要一语音是人机交互最自然最理想的方式之。,承载着说话人丰富的情感内容语音情感识别的终一极目标是让机器能够像人类样通过语音识别人类情感,实现更好的人机交流,这在科技应用场景中有着非常广阔的未来。本文主要研巧了基于深度学习的语音情感识别,将深度学习引入语音情感识别算法中,并针对相应的算法提出若干改进应用于语音情感识别中:。本论文的主要研巧内容如下(1)学习并了解了语音情感识别的研巧背景,重点讨论了语、意义、历史W及研巧现状音情感识别的四个研巧对象、,分别为情感描述模型、情感数据库情感
6、特征参数W及情感分类算法。(2)设计并录制汉语语音情感数据库,该库包含害怕、厌倦、开心烦躁、忧虑、伤也和生气屯种基本情感状态语音。,并经过试听测试对数据库中的语音信号进行预处理后,并提取出语音能、、。此外量过零率基频、子带能量、MFCC参数化及频谱特征等参数组成情感特征矢量,为了后一。续研究的需要,本章节还介绍了语谱图这语音二维表示形式(3)讨论了深度学习理论的基础知化包括人工神经网络(ANN、softmaxW及它们的训练算)法。这为下面的深度学习理论提供了基本构件。学习了SDA网络的基本原理,并将SD
7、A用于语音情感特征向量的降维处理,研究了SDA提炼深层特征的能力。与传统降维算法对比,表明了SDA降维具有如下两点优势:1、维数控制能力强2、。,;降维后分类效果好此外为了合理运用样本数据一的标签信息--,运用掠签信息进步提语音情感相关特征AEF),对比其它,(DD特征证明了DDAEF特征在语音情感分类能力上具有明显的优势。最后,提出了运用SDA网络提取SDACC谱特征的方法,并实验对比了其与化WSF谱特征的语音情感分类能力,证明了SDACC克服了化WSF特征的缺陷,展现了卓越的性能。(4)讨论
8、了CNN网络的基本原理及优势,研究将语谱图用于CNN进行语音情感识别的可行性。,为此讨论了语谱图四种分割方式,并得出分段预处理是更好的语谱图分割方式的结论在此基础上意识到多卷积核在微观和宏观两种尺寸下对语音情感特征有着更好的描述,所寸论了
此文档下载收益归作者所有