欢迎来到天天文库
浏览记录
ID:5266088
大小:513.57 KB
页数:4页
时间:2017-12-07
《基于emd的改进mfcc的语音情感识别》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、ComputerEngineeringandApplications计算机工程与应用2012,48(18)119基于EMD的改进MFCC的语音情感识别屠彬彬,于凤芹TUBinbin,YUFengqin江南大学物联网工程学院,江苏无锡214122SchoolofInternetofThingsEngineering,JiangnanUniversity,Wuxi,Jiangsu214122,ChinaTUBinbin,YUFengqin.SpeechemotionrecognitionbasedonimprovedMFCCwithEMD.ComputerEngi-neeringandApplic
2、ations,2012,48(18):119-122.Abstract:Non-stationarycharacteristicsofspeechsignalunderthedifferentemotionsareespeciallyobvious.Tradi-tionalMFCCcanonlyreflectspeechstaticfeatures,whileEMDcandescribenon-stationarycharacteristicsofspeechsignalprecisely.Inordertoextractthenon-stationaryfeaturesofemotional
3、speech,theimprovedMFCCstepsareproposedincludingEMDdecompositionintoIMFs,Melfiltering,logarithmandDCT.TheimprovedMFCCisad-optedasthenewfeaturewithSVMtorecognizefourspeechemotionsconsistingofhappy,angry,boredandfear.SimulationresultsdemonstratethattherecognitionrateoftheimprovedMFCCis77.17%,andindiffe
4、rentSNRs,therecognitionratecanbeincreasedby3.26%.Keywords:speechemotionrecognition;Mel-FrequencyCepstralCoefficients(MFCC);EmpiricalModeDecom-position(EMD);SupportVectorMachine(SVM)摘要:人在不同情感下的语音信号其非平稳性尤为明显,传统的MFCC只能反映语音信号的静态特征,经验模态分解能够精细地刻画语音信号的非平稳特性。为提取情感语音的非平稳特征,用经验模态分解将情感语音信号分解为一系列固有模态函数分量,通过Mel滤
5、波器后取其对数能量,进行DCT反变换后得到改进的MFCC作为情感识别的新特征,采用支持向量机对高兴、生气、厌烦和恐惧等四种语音情感识别。仿真实验结果表明:改进的MFCC识别率达到77.17%,在不同的信噪比下,识别率最大可提高3.26%。关键词:语音情感识别;Mel频率倒谱系数;经验模态分解;支持向量机文章编号:1002-8331(2012)18-0119-04文献标识码:A中图分类号:TN9121引言75%。MFCC是将频谱转化为基于Mel频率的非线语音情感识别是当前一个比较活跃的课题,应性频谱,然后转换到倒谱域上,充分模拟了人的听觉[1]特性。人在不同情感下产生的语音信号的非平稳性用于人性
6、化的语音人机界面、情感翻译、测谎和辅[2]更加明显,而MFCC只能反映语音信号的静态特征,助心理治疗等方面。一般用于语音情感识别的参数多为振幅、能量、基频、共振峰频率、Mel频率倒谱所以传统MFCC的识别效果不够理想。系数(Mel-FrequencyCepstralCoefficients,MFCC)希尔伯特黄变换(Hilbert-HuangTransform,HHT)等声学特征,文献[3]提取语音信号中的能量、基频、是一种对非线性、非平稳信号的自适应性时频分析共振峰等全局统计特征,对愤怒、高兴、悲伤和惊奇方法,经验模态分解(EmpiricalModeDecomposi-[5]等四种情感的平均
7、识别率仅为66%。文献[4]用tion,EMD)是其最关键的步骤。情感语音信号的非MFCC作为特征参数,在柏林情感语音库下,对高兴、平稳性尤为明显,EMD分解能够精细地刻画语音信生气、悲伤、厌恶四种情感语音的平均识别率最高为号的非平稳特性。因此,本文提出了一种基于经验基金项目:国家自然科学基金(No.61075008)。作者简介:屠彬彬(1985—),男,硕士,主要研究领域为语音信号处理;于凤芹(
此文档下载收益归作者所有