欢迎来到天天文库
浏览记录
ID:35178904
大小:6.96 MB
页数:66页
时间:2019-03-20
《基于矢量量化的说话人识别的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、苟护"7巧¥妾夥署濁节—咚会爲If!,':.'4':中-:'i:;.U;V;'....r,.;VL'.I.I密级;1?^.,保密期限:..聲義乂榮硕±学位论文’:;‘P.\'t■’基于矢量量化的说话人识别的研究TheReseardiofSeakerReconitionBasedpg.,'V,,乂’...onVectoruantizationQ'?学号P13201061
2、姓名涂佩佩学位类别工学硕±,通信与信息系统fxSS.5指导教师朱军副教授完成时间2016年5月—■-;I‘■':'V?.?.'.'r丰.V‘:r.'IV独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得安徽大学或其他教育机构的学位或证书而使用过的材料一。与我同工作的同志
3、对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。"^学位论文作者签名:夸乃签字日期:TP年月日/么f学位论文版权使用授权书本学位论文作者完全了解安徽大学有关保留,、使用学位论文的规定有权保留并向国家有关部口或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权安徽大学可W将学位论文的全部或部分内容编入有关数据库进行检索,可W采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名;;导师签名冰琴
4、签字曰期:y乂年月曰签字曰期:年名月曰?摘要一,说话人识别作为生物识别的种应用范围非常的广泛,是依据语音波形中,^此来自动鉴。所反映的说话人生理及行为的语音特征参数1别说话人的身份本文研究的是基于矢量量化的说话人识别。一本文采用矢量量化的模板训练方法,设计了个基于矢量量化的与文本无关,主要工作如下的说话人识别系统:(1)语音库的建立,语音库是由本人在背景噪声相对小的环境下自巧录制的lEditPro2.18W/Z、汉语普通话语音数据库。使用Coo软件录制
5、,设置采样频率为量化精度为16M,信道选择单声道混合,该语音库由30名男性和16名女性的语音姐成,并截取10s用于训练,5s用于测试截取。(2)阐述语音信号的前期处理工作,主要对语音信号进行预加重、分帖加窗,和端点检测并对语音信号短时域的特征函数:短时能量函数、短时平均过零率进行了分析。然后介绍了端点检测的H个方法:双口限法、谱减法、谱煽法,对H种端点检测方法作仿真分析,针对双口限端点检测方法中存在的漏检现象进行了改进,改进后的算法有效地避免了漏检问题。3接着对常用的语音信
6、号的特征参数进行介绍和研究,重点分析了线性预()测系数(LinearPredictionCoeficient,LPC)、线性预测倒谱系数(LinearPredictionGepstralCoeficients,LPCC)和梅尔频率倒谱系数(MelFrequencyCepstralCoeficients,MFCC)及其提取方法,本文选用的是MFCC。之后重点分析了矢量量化的原理、过程及算法,针对量化过程进行了改进,即采用多级矢量量化的方法。(4)最后在Matla
7、b平台下,设计与文本无关的说话人识别系统,在量化过程中采用多级矢量量化,测试了自行录制的46个说话人的语音库,得到了较高的识别率。关键词:说话人识别;矢量量化;线性预测系数;线性预测倒谱系数;梅尔频率倒谱系数IAb巧ractAbstractSpeakerrecog打itio打,asabranchofbiometrics,iswildlyappliedinmanyfields.区过sedo打thespeechfeatur己par过me
8、t己rsthatextractedfromthesp己echwaveform,whichreflectthehsioloicalandbehavioralcharacteristicsoftheseakerthepygp,'speakerrecognitionide打tifythespeakersidentityautomatically.Theresearchofseakerreco打it
此文档下载收益归作者所有