基于矢量量化的说话人识别算法的研究

基于矢量量化的说话人识别算法的研究

ID:32468463

大小:1.72 MB

页数:66页

时间:2019-02-06

基于矢量量化的说话人识别算法的研究_第1页
基于矢量量化的说话人识别算法的研究_第2页
基于矢量量化的说话人识别算法的研究_第3页
基于矢量量化的说话人识别算法的研究_第4页
基于矢量量化的说话人识别算法的研究_第5页
资源描述:

《基于矢量量化的说话人识别算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、武汉理T大学硕士学位论义摘要说话人识别是指通过说话人的语音说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本说话人识别系统采用了矢量量化方法,它包括两个主要的模块:特征提取和特征匹配。在特征提取过程中,将提取少量的能够体现每个说话人的特征的语音信号的参数。在特征匹配模块中包括有两个步骤:一是训练步骤,二是识别步骤。本文首先在研究了语音信号的一般处理方法的基础上,重点研究了双门限端点检测算法和LPC美尔倒谱特征端点检测方法的基本理论。并且研究了语音信号的数字模型,包括激励模型、声管模型和

2、辐射模型三个子模型。然后,在研究说话人识别的参数和特征提取原理的基础上,重点研究了美尔倒谱系数(MFCC)的原理和特点,并且设计和实现了美尔倒谱系数提取过程。接着,在介绍了矢量量化的基本原理和失真测度方法的基础上,重点研究了矢量量化器最佳码本设计的算法一LBG算法,选择为本系统的矢量量化方法。最后提出了一种以MFCC为特征的基于近邻划分算法的矢量量化的说话人识别方案,并在MATLAB上进行了仿宾实验,得出了识别速度变快,识别精度高等意义的结论。本系统通过MATLAl3语音处理工具箱,提取输入语音的特征参数,采用美尔倒谱系数

3、特征参数,提高了系统的识别性能,采用LBG算法进行码书设计,并通过使用矢量量化技术为每一说话人设计码书,避免了由于说话人使用同一码书带来的量化误差。本系统获得了很高的识别率,并且具有运算速度快,计算量小,差错率低等优点。关键词:说话人识别,美尔倒谱系数(MFCC),矢量量化(vQ),LBG算法!!坚堡三查兰堡圭兰垡堡苎一——ABSTRACTSpeakerrecognitionistheprocessofautomaticallyrecognizingwhoisspeakingonthebasisofindividualin

4、formationincludeinspeechsignals.Ithaswellapplicationprospectsinmanyfields.Inthisspeakerrecognitionsystemcontainstwomainmodules:featureextractionandfeaturematching.Featureextractionistheprocessthatextractsasmailamountofdatafromthevoicesignalthatcanlaterbeusedtorepr

5、esenteachspeaker.Featurematchinginvolvestwodistinguishphases.Thefirstoneisreferredtothetrainingphasewhilethesecondoneisreferredtoasthetestingphase.Firstly,inthispaper,IanalyzethecommonprincipleofthevoicesignM,andfoellSonthedoublelimitmethodofmeasuringtheextremepoi

6、ntofthevoicesignalandthemethodofmeasuringtheLPCMFCCextremepoint.nenIresearchthethreesubmodelofdigitalmodelofvoicesignal:inspiredmodel,soundgatemodel,andradiantmodel.Secondly,basedonthetheoryoffeatureparameter,Istudytheparameterrepresentingthespeechsignalforthespea

7、ker‘——MelFrequencyCepstmmCoefficients(MFCC)andimplementtheprocessoftheextractionofMelFrequencyCepstrumCoefficients.Thirdly,IexplaintheprincipleofVectorQuantization(VQ)andthemeasureofVedistortion,andilluminatethebestarithmetictobuildaspeaker-specificVQcodebook--LBG

8、algorithmaMoreover,intheprogressofclusteringtheTrainingVectors,Iusethenearestdividingalgorithmtoimprovetheefficiencyofsearchcodeword.andtoincreasethespe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。