用于说话人识别的犕犉犆犆的改进算法

用于说话人识别的犕犉犆犆的改进算法

ID:38278576

大小:557.35 KB

页数:4页

时间:2019-05-26

用于说话人识别的犕犉犆犆的改进算法_第1页
用于说话人识别的犕犉犆犆的改进算法_第2页
用于说话人识别的犕犉犆犆的改进算法_第3页
用于说话人识别的犕犉犆犆的改进算法_第4页
资源描述:

《用于说话人识别的犕犉犆犆的改进算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、电子测量技术第32卷第8期信息技术及图像处理ELECTRONICMEASUREMENTTECHNOLOGY2009年8月用于说话人识别的犕犉犆犆的改进算法张伟伟杨鼎才(燕山大学信息科学与工程学院秦皇岛066004)摘要:在说话人识别系统中,MFCC参数是使用最多的特征参数之一。MFCC参数主要描述了表征声道特性的谱包络特征,而忽略了基音频率对它的影响。基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能。本文提出了一种基于平滑幅度谱包络的MFCC的改进参数,该参数不直接对语音短时幅度谱进行提取,而是先对幅度谱进行平滑,在谱包络的基础上计算MFCC参数,

2、以降低基音频率对其的影响。关键词:说话人识别;梅尔倒谱系数(MFCC);基音频率中图分类号:TP912.3文献标识码:A犐犿狆狉狅狏犲犱犕犉犆犆犪犾犵狅狉犻狋犺犿狌狊犲犱狋狅狊狆犲犪犽犲狉狉犲犮狅犵狀犻狋犻狅狀ZhangWeiweiYangDingcai(ThecollegeofInformationScienceandengineering,YanShanUniversity,Qinhuangdao066004)犃犫狊狋狉犪犮狋:Inthespeakerrecognitionsystem,MFCCparametersisoneofthemostcharacteristicp

3、arameter.MFCCparametersismaindescribesthespectrumenvelopefeatures,whichisusedtostatethevacaltrackcharacterizatics,whileignoringtheimpactofpitchfrequency.ThepitchfrequencywillaffecttheMFCCparameterstoaccuratelydescribethevacaltrackcharacteristics,andthenimpacttheperformanceoftheSpeakerRecogn

4、itionSystem.ThisarticleproposesaimprovedMFCCparameterswhichisbasedonsmoothingamplitudespectrumenvelope.Inordertoreducetheimpactofitspitchfrequency,theparameterisnotdirectlytoextractspeechshorttimeamplitudespectrum,butfirstsmoothingtheamplitudespectrum,andbasedonthespectrumenvelopetocalcula

5、tedtheMFCCparameters.犓犲狔狑狅狉犱狊:Speakerrecognition;MelFrequencyCepstralCoefficients(MFCC);pitchfrequency0引言说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨认或确认的目的。一个说话人识别系统可分为两个阶段,即训练阶段和识别阶段。在训练阶段,系统的每一个说话者说若干训练语料,系统根据这些语料,对每一个说话人进行特征提取,提取出能描述该说话人的特征样本,通过训练学习建立每个使用者的模板或模型参数参考集。而在识别阶段,

6、把从图1说话人识别基本原理图待识别说话人说出的语音信号中提取的特征参数,与在训练过程中得到的参考参量集或模型模板加以比较,并且根使用。因为人的听觉系统是一个比较理想的说话人识别据一定的相似性准则进行判定,取与测试音模型匹配距离系统,而MFCC(Mel倒谱系数)模拟了人的听觉特性,是符最小的说话人模型所对应的说话人为辨认的结果。其基[1]合人听觉特性的语音特征参量,在实际应用中取得了较高本原理图框图如图1所示。的识别率[3]。该特征谱由Davies和Mermelstein提出来在说话人识别系统中常用的语音特征参数主要有的,并证明了基于MFCC特征参数的说话人识别系统比基LPC倒

7、谱系数LPCC、Mel频率倒谱系数MFCC(mel于其他特征参数的识别系统优越[4]。frequencycepstralcoefficients)等、基音周期和共振峰[2]在识别阶段,采用的模式匹配方法有:概率统计方法、等。在实际应用中,一般多选取MFCC作为特征矢量来·118·张伟伟等:用于说话人识别的MFCC的改进算法第8期动态时间规整方法、矢量量化方法、隐马尔可夫模型方法、数)犮(狀):犕-1人工神经网络方法等。由于矢量量化方法具有简单、实用π狀(犿+1/2)),0≤狀<犕(4)犮(狀)=∑犛(犿

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。