欢迎来到天天文库
浏览记录
ID:35187974
大小:6.37 MB
页数:62页
时间:2019-03-21
《高斯混合模型用于语音情感识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、单位代码10602I学号201301巧20分类号TP391密级公开^'>纖吁載序GUANGXINORMALUNIVERSITY硕击学佐备文高斯混合模型用于语音倩感识别研究AppliedGaussianMixtureModelinSpeechEmotionRecognitionResearch学院;计算机科学与信息工程学院专业:计算机应用技术研巧方向:信号处理年级:2013级研巧生:紫桂林指导教师:黄汉明教授完成日期:2016年4月寫斯混合模型用于语音猜感
2、识别研究专业若称:计算机应巧技术申请人:蔡桂林指导教师:黄汉明教授论文答辩姜员会^含、V主席:令命姿员:?至命li高斯混合模型用于语音情感识别研巧研巧生;蔡桂林导师;黄汲明教授专业:计算机应用技术方向;信号处理年级:2013级摘要I一语音情感识别技术是人工智能)领域的(A个重要分支,该技术是通过对语音信号进行分析处理来识别说话者当时的情感状态。随着计算机科学技术与其他学科如生理学、也理学、统计学等相互交叉和发展,语音情感识别技术获得了显著的进展。情感自身具有主观性和复杂性,对情感进行建模,开展
3、情感计算研究具有重大的理论和实践意义。随着计算机技术和机器智能技术的发展,越来越多的人工智能设备和产品将会被开发出来,并会在社会生活的各个领域中得到广泛的应用,如教育行业、医学界、服务行业和工业等领域。本文采用高斯混合模型,对语音情感识别问题做了较系统的研究。首先,基于情感理论基础知识确立了本文的实验语料库,并选取了四种基本情感状态、作为本文的研究对象,即生气高兴、恐惧、悲伤。接着对语音信号进行预处理操作,便于提取更为有效的情感特征。其次,鉴于语音倩感特征提取的好坏将会直接影响识别的效果,所W本文的特征参数提取兼顾韵律学、音
4、质W及谱等H个方面,这些特征分别是语速、短时能量、基音频率、一共振峰参数W及Mel频率倒谱系数(MFCC)五类特征,对送系列特征进行提取计算和分析研巧,最终确定了21种语音情感特征作为高斯混合模型(GMM)的输入参数。再次,通过选取不同的情感特征和不同的识别模型进行实验,寻找能区分各种情感的有效情感特征。本文先选用支持向量机(SVM)模型进行识别,通过对比不同的核函数的识别效果决定选用线性核,并且使用网格搜索法确定了用于识别的最优参数;然后采用层次模型决策树、分层模型分别进行识别。最后,利用己确定的21种语音情感特征和离斯混合
5、模型在语料库的训练数据集上对四种基本情感建立识别模型。在建模的过程中,使用到了极大似然估计(MLE)和期望最大化(EM)算法对离斯混合模型的参数进行优化。在进行优化训练的过程中,极大似然估计详细推演了期望最大化算法迭代并直到最后收敛的过程。最终确定了最优的高斯混合模型,并使用该模型在测试数据集上进行了识别实验。同时对其他H种识别模型(即支持向量机、决策树和分层模型)的实验结果做了详细的分析,最后通过对比分析四种模型的实验结果说明了使用高斯混合模型在本文选取的四种基本情感进行识别时具有更强的区分能力,同时也验证了期望最大化算法的参
6、数估计对高斯混合模型的识别率具有重大影响。I关键字;语音情感识别,特征提取,支持向量机(SVM),高斯混合模型(GMM),期望最大化(EM)IIAppliedGaussianMixtureModelinSpeechEmotionRecognitionResearchGraduatestudent:CaiGuilinMentor:HuanHanminggMaor:ComuterAlicationTechnoloield:SinalProcessinGrade:2013jpppgyFg
7、gAbstractThespeechemotionrecognition,whichanaly之esthespeechsignal化identifytheemotionalstateofthespeakerisanimortantbranchofarti巧cialintellienceAI).Withtheinteractionand,pg(developmentofcomputerscienceandvariouswlatedotherdisciplinessuchas
8、physiology,psychologyandstat
此文档下载收益归作者所有