欢迎来到天天文库
浏览记录
ID:32527218
大小:1.66 MB
页数:47页
时间:2019-02-11
《基于gmmubmsvm中文情感语音识别的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于GMM-UBM-SVM中文情感语音识别的研究ResearchofChineseemotionalspeechrecognitionbasedonGMM-UBM-SVM作者姓名解剑学位类型工程硕士学科、专业电子与通信工程研究方向智能信息处理导师及职称陈雁翔副教授朱六璋高级工程师2013年4月I基于GMM-UBM-SVM中文情感语音识别的研究摘要人工智能就是让机器能够实现像人脑一样思考和交流。作为国家“十二五规划”重点发展的交叉学科研究领域越来越受到国内外研究者的重视。语音是人们在生活中最为常见的交流方式,话语
2、中不仅包含了大量的信息,还包含了人们的感情和情绪变化,所以说语言是人类最高智能水平的体现。情感语音处理作为一个新的研究方向,与原始的语音信号处理相比,其更加注重于对语音中情感状态和韵律特征的研究。情感语音识别作为情感语音处理研究中的一个组成部分,在实现人机自然交互方面有重要的作用。论文研究情感语音识别方法,通过分析语音特征与情感状态间的关联关系,在原有的语音识别分类方法的基础上,提出了一种新的情感语音分类识别方法。论文主要创新点:1、语音特征一直是情感语音识别的主要特征,本文针对实验所使用的时长、能量、基频和共
3、振峰等常用语音特征的提取和构造方法进行了详细的介绍。提取了情感语音中的能量、基频、时长及共振峰参数,并分析了以上参数与情感状态间的关联关系,结果表明以上语音特征均能较好的描述所表达地情感,在不同情感状态下同样具有良好的区分性。该研究结果对于情感语音识别与情感语音合成的定量研究有一定的指导意义。2、论文分析了当前常用的情感语音识别方法。针对于语音中的时序参数在SVM等固定维数分类模型中无法适用的问题,提出基于GMM-UBM-SVM的分类方法,使梅尔频率倒谱系数(MelFrequencyCepstrumCoeffi
4、cient,MFCC)等时序性语音特征参数能够进行分类研究,实现了使用时序性语音特征的中文情感语音识别。该方法主要是使用UBM(统一背景模型),MAP自适应出各情感语音的GMM模型,再合并各个高斯分布的均值参数,得到统一维数的GMM超向量,从而把不固定维数的MFCC参数转换成固定维数的GMM超向量,同时利用SVM良好的区分性来完成各情感语音的分类与识别。实验表明,该方法较原有情感语音识别方法情感识别率有所提高。本文提出的情感语音识别方法作为一种新的尝试,具有一定的理论依据和实用效果,同时论文对实验中所遇到的问题
5、进行了分析,为今后的语音的情感识别、情感定量研究奠定了一定的基础。关键词:情感语音识别;UBM;GMM超向量;SVMIIResearchofChineseemotionalspeechrecognitionbasedonGMM-UBM-SVMABSTRACTArtificialintelligenceistomakethemachineabletothinkandcommunicatelikeahumanbrain.Asanational"12thfive-yearplan"focusingonthedevel
6、opmentofinterdisciplinaryresearch,thisfieldhasgainedmoreandmoreattentionbyresearchershomeandabroad.Speechisthemostcommonwayofcommunicationindailylife.Discoursecontainsnotonlyalargeamountofinformation,butalsopeople'schangesoffeelingsandmood.Emotionalspeechpro
7、cessing,asanewresearchdirectioncomparedwiththeoriginalspeechsignalprocessing,paysmoreattentiontotheemotionalstateinthevoiceandrhythmcharacteristics.Emotionalspeechrecognitionisalsoanintegralpartinthestudyofspeechprocessing,andplaysanimportantroleinrealizingh
8、uman-computernaturalinteraction.Thispaperstudiesemotionalspeechrecognitionmethods,byanalyzingtherelationshipbetweenphoneticfeaturesandemotionalstates.Moreover,thispaperproposesanewclassification
此文档下载收益归作者所有