欢迎来到天天文库
浏览记录
ID:33925815
大小:269.23 KB
页数:4页
时间:2019-02-28
《基于fmfcc和hmm的说话人识别》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第27卷第5期计算机仿真2010年5月文章编号:1006—9348(2010)05-0352—03基于FMFCC和HMM的说话人识别张永亮,张先庭,鲁宇明(1.南昌航空大学电子信息工程学院,江西南昌330063;2.南京航空航天大学自动化学院,江苏南京210016)摘要:美尔频率倒谱系数(MFCC)是说话人识别中常用的特征参数,而语音信号是非平稳信号,MFCC并不能很好的反映语音的时频特性。针对这一缺陷,为了提高说话人的识别率,结合新的时频分析工具分数傅立叶变换(FRF1.)。将MFCC推广到分数形式,得到分数美尔频率倒谱系数(
2、FMFCC),用以表征语音信号的特征;并利用可分性测度验证了特征参数的有效性;通过建立20个不同说话人的FMFCC特征库,采用隐马尔可夫模型(HMM)对说话人进行仿真识别。仿真结果表明,在合适的变换阶次下,说话人的平均识别率可达93%以上。关键词:分数傅立叶变换;频率倒谱系数;隐马尔可夫模型中阔分类号:TIY391.4文献标识码:BSpeakerRecognitionBasedonFM[Ii’CCandHMMZHANGYong—liang,ZHANGXian—ting,LUYu—ming(1.CollegeofElectroni
3、csandInformationEngineering,NanChangHangKongUniversity,NanehangJiangxi330063,China;2.CollegeofAutomationEngineering,NanJingUniversityofAeronauticsandAstronautics,NanjingJiangsu210016,China)ABSTRACT:Melfrequencycepstralcoeficient(MFCC)isafrequently—usedcharacteristici
4、nspeakerrecogniton.Inevidence,speecharenon—stationarysignals,thetime—frequencycharacteristicofspeechisnotclearlyexpressedthr0ughMFCC.Thus,inthecalculationofMFCCparameter,fractionalFouriertransform(FRn’)isadoptedtore—placediscreteFouriertransform.ThenfractionalMelfreq
5、uencycepstralcoeficient(FMFCC)isacquired,andtheeffectivityoftheparameterisverified.Finally,theHiddenMarkovModel(HMM)of20diferentspeakersisestab—lished,andspeakeridentificationisperformed.Thesimulationshowsthatindifferenttransformorders,theaverageofrightspeakerrecogni
6、tionrateisupto93%.KEYWORDS:FractionalFouriertransform;Frequencycepstralcoeficient;HiddenMarkovmodel1引言仿,它具有较好的区分能力,并且计算简便,是目前使用最为说话人识别是一项根据语音波形中反映说话人生理、心广泛的语音特征之一。但是,MFCC特征的获取是基于传统理和行为特征的语音参数,自动识别说话人身份的生物认证的傅立叶变换(FT)。FI"最适宜处理的是频率不随时间变化技术”J。与其它生物识别技术(诸如人脸、指纹、血液、的平稳信号,
7、而语音信号是一种非平稳的时变信号,因此,标DNA、虹膜、视网膜等)相比,说话人识别所采用的语音信号准Fr并不能完全刻画语音信号的特征。FRFY是传统Fr在具有不会遗失、无需记忆和使用方便等优点,在生物识别技分数阶次上的推广,其变换谱包含空域和频域的双域信息,术领域中,说话人识别技术以其独特的方便性和经济性等优作为一种有效的时频分析工具,目前已经被广泛地应用于信势,日益成为一种重要的安全验证方式。个人特征的提取和息安全、模式识别、光学系统分析J、量子理论等领识别模型的建立是说话人识别的两个关键技术,其中尤以个域。本文利用FReT的
8、时频特性,在计算MFCC特征参数时,人特征的提取最为关键,特征提取是说话人识别算法的重用FRFY替换Fr,将MFCC特征参数推广到分数形式,得到点,也是难点。在说话人识别中,常用的特征参数有基音周分数美尔频率倒谱系数(FMFCC),通过数值实验验证了其有期、共振
此文档下载收益归作者所有