一种基于小波包分析的说话人识别算法-论文.pdf

一种基于小波包分析的说话人识别算法-论文.pdf

ID:58156226

大小:309.11 KB

页数:5页

时间:2020-04-25

一种基于小波包分析的说话人识别算法-论文.pdf_第1页
一种基于小波包分析的说话人识别算法-论文.pdf_第2页
一种基于小波包分析的说话人识别算法-论文.pdf_第3页
一种基于小波包分析的说话人识别算法-论文.pdf_第4页
一种基于小波包分析的说话人识别算法-论文.pdf_第5页
资源描述:

《一种基于小波包分析的说话人识别算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、小型微型计算机系统2014年7月第7期JournalofChineseComputerSystemsVO1.35NO.72014一种基于小波包分析的说话人识别算法胡峰松,王磊(湖南大学信息科学与工程学院,长沙410082)E-mail:wangwanglei333@163.com摘要:在通过对MFCC算法的研究和实验,发现在噪音环境下基于梅尔频率倒谱系数(MFCC)的识别率受到了影响.为了提高在噪音环境下说话人识别系统的识别率,通过对MFCC参数提取过程进行改进,用小波包变换代替快速傅里叶变换和Mel滤波器组,获得了新参数newMFCC,然后将信号的频谱重心与newMF

2、CC结合成新的特征参数进行提取.实验结果表明,新特征参数newMFCC+SC和newMFCC和原来的MFCC相比,在噪音情况下都有更好的识别率;在高信噪比条件下,newMFCC+SC的识别效果要优于newMFCC,而在低信噪比条件下,newMFCC的识别效果要优于newMFCC+SC;同时它们的动态参数要比新特征参数的静态参数识别率更好.关键词:说话人识别;小波包分析;梅尔频率倒谱系数;频谱重心;动态参数中图分类号:TP391文献标识码:A文章编号:1000—1220(2014)07—1610-05ANewSpeakerRecognitionMethodBasedonW

3、aveletPacketAnalysisHUFeng—song。WANGLei(CollegeofInformationScienceandEngineering。HunanUniversity,Changsha410082。China)Abstract:ThroughtheanalysisandresearchofMel—FrequencyCepstralCoefficient(MFCC),therecognitionrateoftraditionalMel—FrequencyCeptralCoeficient(MFCC)undernoisyenvironmentis

4、greatlyinfluenced.Inordertoacquiresatisfactoryperformanceofspeechrecognitionsystemundernoisyenvironment。WaveletPacketTransformation(岍)methodisintroducedtofeatureparame·tersbyreplacingtheFFrandMelfilterbanksinvirtueofMFCC.AnewimprovedfeaturenamednewMFCCwasproposed.Thispa—perproposesanewsp

5、eechrecognitionmethodofnewMFCCandSpectralCentroid(SC)featureintegration.ThesimulationresultsshowthatthenewcharacteristicparametersnewMFCC+SCandnewMFCCcomparedwiththeoriginalMFCC。inanoisysituationhavebetterrecognitionrate.IntheconditionofhighSNR。theidentificationofannewMFCC+SCisbetterthan

6、newMFCC,butinlOWSNRconditions。therecognitioneffectofnewMFCCiSbetterthannewMFCC+SC.Atthesametime,therateoftheirdynamicfeatureparametersarebetterthantherateoftheirstaticparameters.Keywords:speakerrecognition;waveletpacketanalysis;melfrequencyceptralcoeficient;spectralcentroid;dynamicparame

7、ter1引言是识别过程中最重要的问题之一.常用的语音特征参数有倒谱系数LPCC、Mel频率倒谱系数MFCC(Mel—FrequencyCep—说话人识别是一种通过对说话人的语音进行信息提取,然tralCoeficient)等,文献[3]提出了一种结合MFCC和噪后分析信息特征,从而进一步对说话人的语音特征与说话人集音情况下词汇信息特征的说话人识别系统,通过发现词汇信合中的语音特征进行分析,并进一步识别说话人的过程.说话人识别中信息易采集、设备成本低、识别时间短等特点使得说话人识别已经成为生物识别认证技术中常用的技术之一.说话人识别包括两个

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。