说话人识别的自适应算法研究

说话人识别的自适应算法研究

ID:32476251

大小:1.56 MB

页数:57页

时间:2019-02-07

说话人识别的自适应算法研究_第1页
说话人识别的自适应算法研究_第2页
说话人识别的自适应算法研究_第3页
说话人识别的自适应算法研究_第4页
说话人识别的自适应算法研究_第5页
资源描述:

《说话人识别的自适应算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、武汉理工大学硕士学位论文摘要本论文主要内容是基于矢量量化(VQ)和隐马尔可夫模型(HMM)的说话人识别算法的研究和改进。说话人识别是根据人的声音来识别人的一种生物认证技术,具有非常好的应用前景。而矢量量化和隐马尔可夫模型相结合则是在说话人识别领域中应用最广泛,效果最好的手段之一。作者对说话人识别的各个环节的相关知识进行了广泛学习,其中包括语音信号预处理、获取特征量以及基于不同模型的识别方法。在研究过程中,重点对识别方法,即识别算法方面做了下列三个方面的工作:(1)基于VQ的说话人识别研究:适合于特定人识别,但该方法对于由说话人差别引起的语音特征的

2、变化却无能为力。(2)基于}m蹦的说话人识别研究:适合于非特定人识别,因为它作为统计模型能够吸收由不同说话人引起的语音特征的变化。(3)基于模糊矢量量化以及隐马尔可夫模型(FVQ/HMM)的说话人识别研究:FVQ/HMM作为HMM的特殊形式,其模型参数数量较传统HMM少,模型学习对训练数据量要求不高;具有学习收敛速度快,适合于实时自适应学习;识别速度快,适合于实时大词汇量连续语音识别等特点。另外,它和传统分段VQ识别方法相比,FVQ/H/lN可以得到最佳的分段效果,且通过模糊c一均值(FCM)聚类分析减少了码本的量化误差。关键词:说话人识别,自适

3、应,矢量量化,隐马尔可夫模型,模糊矢量量化武汉理工大学硕士学位论文AbstractThesubstanceofthismagisterialthesisistheresearchandimprovementofspeakerrecognitionwhichisbasedontheVQ(VectorQuantization)andHMM(HiddenMarkovModel).Withcheerfulprospect,speakerrecognitionisabiometricsthatrecognizespeopleviatheirvoice,an

4、dthecombinationofVQandHMMisoneofthebestandmostprevailingmethodinthefieldofspeakerrecognition.Theauthorwidelystudiestheknowledgeofeverypartofspeakerrecognitionwhichinvolvesvoicesignalpreprocessing,charactervectorextractingandrecognitionmethodbasedondifierentmodel.Duringthiswor

5、k,themainbodyistherecognitionmethod,namely,recognitionalgorithm.Threeaspectsofitareasfollows:(1)StudyofspeakerrecognitionbasedonVQ:ItisapplicabletoSD(SpeakDependent)recognitionbutunabletodealwiththevarietyinvoicecharacterwhichresultfromdifferentspeaker.(2)Studyofspeakerrecogn

6、itionbasedonHMM:Asakindofstatisticalmodel,itisapplicabletoSl(SpeakIndependent)recognitionbecauseitincludesthevarietyinvoicecharacterwhichresultfromdifferentspeaker.(3)StudyofspeakerrecognitionbasedonFVO(FuzzyVQ)/HMM:ItisthespecialformofHMM.ComparedwithoriginalHMM,ithaslesspar

7、ameterstoreducetrainingdataforlearning,higherconstringencyspeedoflearningtobeapplicabletoreal—timeself-adaptinglearningandhigherrecognitionspeedtobeapplicabletoreal.timecontinuousvoicerecognitionwithlargevocabular弘ComparedwithoriginaldivisionVQ,ithasbeaereffectofdivisionandle

8、ssquantizationerrorofcodebookbyFCM(FuzzyC—Means)clusteringanalysis.K

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。