欢迎来到天天文库
浏览记录
ID:35097711
大小:4.88 MB
页数:60页
时间:2019-03-17
《说话人识别中特征提取算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号TN912.34密级公开学号131627■、■:ammi■■■画誦腸欄’1TOH靈IJ硕±学位论文(学术型)题目说话人识别中特征提取算法研究作者黄婉著指导教师曹辉副教授_级学科名称信息与通信工程二级学科名称信号与信息处理提交日期二〇—六年五月学位论文原创性声明本人声明所呈交的学位论文是我在导师的指导下进行研究工作所取得的研究成果。尽我所知,除文中已经注明引用的内容和致谢的地方外,本论文不包含其他个人或集体已经发表或撰写过的研究成果,也不包含本人或他人已申请学位或其他用途使用过的成果。
2、对本文的研究做出重要贡献的个人和集体,均已在文中作了明确说明并表示谢意。一切相关的法律责任本学位论文若有不实或者侵犯他人权利的,本人愿意承担。:作者签名:卷疏鹿曰期年女月曰学位论文知识产权及使用授权声明书本人在导师指导下所完成的学位论文及相关成果。,知识产权归属陕西师范大学本人完全了解陕西师范大学有关保存,允许本论文坡査阅和、使用学位论文的规定借阅,学校有较保留学位论文并向国家有关部口或机构送交论文的纸质版和电子版,有极将本论文的全部或部分内容编入有关数据库进行检索,可W采用任何复制手段保存和汇编本论文。本人保证毕业离校后,发表本论文或使用本论文成
3、果时署名单位仍为陕西师范大学。保密论文解密后适用本声明。作者签名:葦疏慧日親W《年月日摘要说话人识别技术利用说话人之间的个体差异对人们的身份进行辨别,涉及到生理、。学、声学语音学等多个学科领域,相对于虹膜识别和指纹识别更加便捷说话人识别关键问题在于准确提取说话人的特征参数。本文采用的特征参数是Mel频率倒谱系数(MelFrequencyC巧stralCoeficient,MFCC。MFCC从人耳的听觉机理出发,体现了人耳最根本的听音效果。识别模型)方面,结合支持向量机(SupportVectorMachineSVM)在解决小样本W及
4、非线性模,,选择SVM来进行后续说话人识别实验式识别问题中的优势。通过研究MFCC特征参数提取过程W及语音信号的非线性特性,得出W下几方面的研究结果:(1)在设计Mel滤波器组时所用的窗函数的不同可能会对识别效果带来影响,本文分别使用H角窗、汉宁窗W及汉明窗设计Mel滤波器组,并将得到的H种MFCC参数分别进行了仿真实验。实验结果表明,使用汉明窗构造Mel滤波器组得到的分类效果较好。(2)与傅里叶变换相比,小波分析方法在处理非线性非平稳信号方面具有很大优势,本文在小波包变换原理的基础上结合小波包分解树结点和信号频带范围的对应关系,提取小波包变换系数
5、(Waveletpackettransformcoe巧cientWPTC作为新的特征,)参数。仿真实验证明了WPTC特征参数的识别性能优于MFCC。(3)传统的MFCC特征参数没有完全体现语音信号的非线性特征。本文采用经caecomstonEMD验模态分解方法(Emirilmodedpoii分离出语音信号的高频部分,p,)再用分形维数(FractalDimensionFD,,)表示高频信息中的非线性特征得到特征参数EMD-FD与传统MFCC特征参数相融合构成更高维的特征空间。仿真实验结果,将其。表明,誠合了非线性特征的参数平均识别率比MFCC
6、提高2%左右l关键词:说话人识别,Me频率倒谱系数,,分,小波包变换经验模态分解形维数1AbstractSpeakerRecognitioniitihzes化ediferentvoicefeaturesbetween化edifers打tspeakerstodiscriminatethem,whichisinvolvedwiththefieldsofphysiology,acousticsandpho打etics.Gomparedtoirisrecog打itio打andfi打gerprintrecognitio
7、打itismoresimplea打d,CO打venie打t.I打seakerrecognitio打systemthekeroblemistoextractthefeaturep,yparametsexactp;ersofspeakerly.TheMelFrequencyCepstralCoeficient(MFCC)wasusedin1:hispap化MFCCisanaly
此文档下载收益归作者所有