说话人识别系统的研究

说话人识别系统的研究

ID:32476265

大小:4.09 MB

页数:63页

时间:2019-02-07

说话人识别系统的研究_第1页
说话人识别系统的研究_第2页
说话人识别系统的研究_第3页
说话人识别系统的研究_第4页
说话人识别系统的研究_第5页
资源描述:

《说话人识别系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要说话人识别作为生物认证技术的一种,是根据语音波形中反映说话人生理和行为特征的语音参数,自动鉴别说话人身份的一项技术。说话人识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。因此,研究一种识别率高、鲁棒性强的说话人识别方法是国内外众多研究者努力的目标。本文通过分析说话人识别基本原理与系统结构,考察现有的说话人识别技术,研究采用线性预测倒谱系数和美尔倒谱系数为特征参数,运用矢量量化的说话人识别方法,建立说话人识别系统。为了有效地提

2、高系统的识别效果,具体工作总结如下:首先研究了语音端点检测算法,介绍了常用的短时能量、短时平均过零率、基于小波变换后的分形理论和基于频带方差的端点检测方法,相关实验仿真均反映其各自算法特点。并在分析以上算法存在不足的情况下,提出了改进算法即子带频带方差和功率谱熵的端点检测算法,实验仿真结果证明了其优越性。.接着研究了特征提取算法,主要研究了几种常见的语音特征参数(LPC、LPCC、MFCC),并对MFCC和LPCC进行了一定的理论推导,并提出了一种新的特征参数一基于最小方差无失真响应的感知倒谱系

3、数PMCC。然后研究了说话人识别方法,简单介绍了各类常用的说话人识别方法,动态时间规正(DTw)方法,矢量量化(VQ)方法,隐马尔可夫模型(HMM)方法,高斯混合模型(GMM)方法,人工神经网络(ANN)方法、支持向量机模型(s、,M)方法。着重详细地介绍了矢量量化(VQ)方法的基本原理及其应用,同时提出了改进的矢量量化(VQ)方法,并作为本系统识别方法。最后研究了系统的实现过程,提取的线性预测系数语音特征参数(LPCC)和美尔倒谱系数语音特征参数(MFCC),首先对LPcC和MFCC运用矢量量

4、化(VQ)方法在不同码本容量,不同时长进行说话人识别实验,然后对LPCC和MFCC运用改进的矢量量化(VQ)方法在不同时长进行说话人识别实验,并比较、分析其识别实验结果,得出最佳识别方法一基于标准差的WDMvQ算法作为系统的识别方法。关键词:端点检测;特征提取;线性预测系数;美尔倒谱系数;说话人识别;矢量量化Abs仃act一’’..,--二---;二-—二----二-—---———■二-—·-----—_——---------—---—-—---------—------·-—---------

5、--------—-—-----—------------—-—-—--·------------—··---------—------—------—-·----。。。。‘。一AbstractSpeakerrecogmtionaSoneof也ebiom以cstechmquesistorecogllizeSpeaker’sident毋缸.omitsvoiceWtlichcontaillsphysiolo西calandbeha啊oralcharacteristicsspecifictoeaChin

6、diviiIum.Speakerreco嘶tionhaScaughtmaIlyattentionsforitspaIticul砌yadV锄故唱eoncoIⅣe11ience,economyandveraCi锣andbecomeanirnportant锄dpopularauthenticationtecmqueinhumaIllifeandwork.Therefore,amorcrobuStmethodforspeal(errecogmtionw胁hi曲accuracyofreco印itionra

7、teistheaimforresearchersathomeaIldabroad.By纽alyzingtllegeneral研nciplesandsystem咖ctureofspeakerreco嘶tionaIldconsideratingsubsistemtecllllologyofspeakerreco鲥tion,Linearpredictionc印蛐coef!ficient(LPCC)andMelc印smlmcoe衢cient(MFCC)areadoptedascharaCteristic

8、parameters,thevectorquantizationⅣQ)isusedaLsspeakerrecognitionmemodt0setupspeakerrecognitionsystem.Tbimpr0VeⅡlerecogIlitionefrect,t11etasksaremadeasfollows:Firstly,endpointdetectionisstudied,someclaSsicendpointdeteCtionmetllodsarediscussedhere,suchas

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。