基于emd的改进mfcc的语音情感识别

ID：5266088

大小：513.57 KB

页数：4页

时间：2017-12-07

资源描述：

《基于emd的改进mfcc的语音情感识别》由会员上传分享，免费在线阅读，更多相关内容在行业资料-天天文库。

1、ComputerEngineeringandApplications计算机工程与应用2012，48（18）119基于EMD的改进MFCC的语音情感识别屠彬彬，于凤芹TUBinbin,YUFengqin江南大学物联网工程学院，江苏无锡214122SchoolofInternetofThingsEngineering,JiangnanUniversity,Wuxi,Jiangsu214122,ChinaTUBinbin,YUFengqin.SpeechemotionrecognitionbasedonimprovedMFCCwithEMD.ComputerEngi-neeringandApplic

2、ations,2012,48（18）：119-122.Abstract：Non-stationarycharacteristicsofspeechsignalunderthedifferentemotionsareespeciallyobvious.Tradi-tionalMFCCcanonlyreflectspeechstaticfeatures,whileEMDcandescribenon-stationarycharacteristicsofspeechsignalprecisely.Inordertoextractthenon-stationaryfeaturesofemotional

3、speech,theimprovedMFCCstepsareproposedincludingEMDdecompositionintoIMFs,Melfiltering,logarithmandDCT.TheimprovedMFCCisad-optedasthenewfeaturewithSVMtorecognizefourspeechemotionsconsistingofhappy,angry,boredandfear.SimulationresultsdemonstratethattherecognitionrateoftheimprovedMFCCis77.17%,andindiffe

4、rentSNRs,therecognitionratecanbeincreasedby3.26%.Keywords：speechemotionrecognition;Mel-FrequencyCepstralCoefficients（MFCC）;EmpiricalModeDecom-position（EMD）;SupportVectorMachine（SVM）摘要：人在不同情感下的语音信号其非平稳性尤为明显，传统的MFCC只能反映语音信号的静态特征，经验模态分解能够精细地刻画语音信号的非平稳特性。为提取情感语音的非平稳特征，用经验模态分解将情感语音信号分解为一系列固有模态函数分量，通过Mel滤

5、波器后取其对数能量，进行DCT反变换后得到改进的MFCC作为情感识别的新特征，采用支持向量机对高兴、生气、厌烦和恐惧等四种语音情感识别。仿真实验结果表明：改进的MFCC识别率达到77.17%，在不同的信噪比下，识别率最大可提高3.26%。关键词：语音情感识别；Mel频率倒谱系数；经验模态分解；支持向量机文章编号：1002-8331（2012）18-0119-04文献标识码：A中图分类号：TN9121引言75%。MFCC是将频谱转化为基于Mel频率的非线语音情感识别是当前一个比较活跃的课题，应性频谱，然后转换到倒谱域上，充分模拟了人的听觉[1]特性。人在不同情感下产生的语音信号的非平稳性用于人性

6、化的语音人机界面、情感翻译、测谎和辅[2]更加明显，而MFCC只能反映语音信号的静态特征，助心理治疗等方面。一般用于语音情感识别的参数多为振幅、能量、基频、共振峰频率、Mel频率倒谱所以传统MFCC的识别效果不够理想。系数（Mel-FrequencyCepstralCoefficients，MFCC）希尔伯特黄变换（Hilbert-HuangTransform，HHT）等声学特征，文献[3]提取语音信号中的能量、基频、是一种对非线性、非平稳信号的自适应性时频分析共振峰等全局统计特征，对愤怒、高兴、悲伤和惊奇方法，经验模态分解（EmpiricalModeDecomposi-[5]等四种情感的平均

7、识别率仅为66%。文献[4]用tion，EMD）是其最关键的步骤。情感语音信号的非MFCC作为特征参数，在柏林情感语音库下，对高兴、平稳性尤为明显，EMD分解能够精细地刻画语音信生气、悲伤、厌恶四种情感语音的平均识别率最高为号的非平稳特性。因此，本文提出了一种基于经验基金项目：国家自然科学基金（No.61075008）。作者简介：屠彬彬（1985—），男，硕士，主要研究领域为语音信号处理；于凤芹（

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 / 4



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于emd的改进mfcc的语音情感识别

基于emd的改进mfcc的语音情感识别

相关文章

相关标签