基于mfcc等组合特征的说话人识别模型

基于mfcc等组合特征的说话人识别模型

ID:33489900

大小:301.95 KB

页数:4页

时间:2019-02-26

基于mfcc等组合特征的说话人识别模型_第1页
基于mfcc等组合特征的说话人识别模型_第2页
基于mfcc等组合特征的说话人识别模型_第3页
基于mfcc等组合特征的说话人识别模型_第4页
资源描述:

《基于mfcc等组合特征的说话人识别模型》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第31卷第6期三峡大学学报(自然科学版)Vol.31No.62009年12月JofChinaThreeGorgesUniv.(NaturalSciences)Dec.2009基于MFCC等组合特征的说话人识别模型11,21朱建伟孙水发刘晓丽(1.三峡大学电气信息学院,湖北宜昌443002;2.三峡大学智能视觉与图像信息研究所,湖北宜昌443002)摘要:为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参数:基于人的听觉特性的MFCC参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差

2、分、基音周期变化率,并将它们作为说话人识别系统的特征参数,建立了基于VQ的识别模型.实验表明:本文系统使用VAD,使系统的识别率提高了5%~8%,较单独使用MFCC参数的说话人识别系统的识别率提高了2%~3%.关键词:说话人识别;Mel倒谱系数;基音轮廓特征;语音活性检测中图分类号:TN912文献标识码:A文章编号:16722948X(2009)0620077203SpeakerRecognitionModelBasedonMFCCandCombinedFeatures11,21ZhuJianweiSunShuifaLiuXiaoli(1.CollegeofElec

3、tricalEngineering&InformationScience,ChinaThreeGorgesUniv.,Yichang443002,China;2.InstituteofIntelligentVisionandImageInformation,ChinaThreeGorgesUniv.,Yichang443002,China)AbstractInordertoeffectivelyextractthespeechfeaturesandimprovethespeakerrecognitionaccuracy,aVADalgorithmbasedonthe

4、finitestatemachine(FSM)isappliedontheoriginalvoicefirstly.Thefollowingfourfeaturesareselected:theMelfrequencycepstralcoefficient(MFCC)parametersbasedonthecharacter2isticsofhumanhearing,thepitchcontourbasedonthephysiologicalcharacteristicsofpronunciationfeatures,thepitchfirst2orderdiffe

5、renceandthepitchchangedrate.Vectorquantization(VQ)basedspeakerrecogni2tionmodelisestablished.Theexperimentalresultsshowthattherecognitionrateoftheproposedsystemisimproved2%-3%thanthespeakerrecognitionsystemusingtheMFCCparametersonly,and5%-8%thanthesystemwithoutusingtheVAD.Keywordsspeak

6、errecognition;MFCC;pitchcontourfeatures;VAD说话人识别可以分为说话人辨认(SpeakerIden2特征提取和模式匹配(模式识别)是说话人识别tification)和说话人确认(SpeakerVerification).前者的两个关键问题.目前常用的特征参数有线性预测倒是把待识别的一段语音判定为属于若干个参考说话谱系数(LinearPredictiveCepstrumCoefficient,人中的哪一个所说的,是一个“多选一”问题.而后者LPCC)、Mel频率倒谱系数(Mel2FrequencyCeps2则是判定一段语音是否是

7、所声明的某个参考人所说trumCoefficient,MFCC)和感知线性预测(Percep2[2]的,这只有两种选择:肯定(接受)或者否定(拒绝),是tualLinearPredictive,PLP)参数等.MFCC比[1]一个“二选一”的问题.论文所要研究的是与文本无LPCC和PLP具有更优越的识别性能,是目前应用[324]关的说话人辨认系统.最广的特征参数.模式匹配方法主要有基于模板收稿日期:2009206223基金项目:湖北省教育厅科学技术研究计划重大项目“基于真实感知的多方虚拟工作环境关键技术研究”(Z20081301)通讯作者:孙水发(1977-),

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。