基于混合特征参数和gmm-ubm的说话人识别系统的研究

基于混合特征参数和gmm-ubm的说话人识别系统的研究

ID:35182829

大小:4.20 MB

页数:78页

时间:2019-03-21

基于混合特征参数和gmm-ubm的说话人识别系统的研究_第1页
基于混合特征参数和gmm-ubm的说话人识别系统的研究_第2页
基于混合特征参数和gmm-ubm的说话人识别系统的研究_第3页
基于混合特征参数和gmm-ubm的说话人识别系统的研究_第4页
基于混合特征参数和gmm-ubm的说话人识别系统的研究_第5页
资源描述:

《基于混合特征参数和gmm-ubm的说话人识别系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、密级桂林电子科技大学硕士学位论文(全日制工学硕士)题目基于混合特征参数和GMM-UBM的说话人识别系统的研究(英文)ResearchofSpeakerRecognitionSystemBasedonMixedFestureParametersandGMM-UBM研究生学号:1308202028研究生姓名:王茂蓉指导教师姓名、职务:周萍教授申请学科门类:工学硕士学科、专业:控制科学与工程提交论文日期:2016年4月论文答辩日期:2016年6月'独创性(或创新性)声明工作及取得的研究成本人声

2、明所呈交的论文是我个人在导师指导下进行的研究果。尽我所知,除了文中特别加臥标注和致谢中所罗列的内容扣外,论文中不包含其化人己经发表或異写过的研巧成果;也不包含为获得桂林电子科技大学或其它教育机一已构的学化或证书而使用过的材料。与我同工作的同志对本研究所巧的任何贡献均在论文中做了明确的说巧并表示了谢意。人承担…切相关责任。申请学位论文与资料若有不实么处,本I'JO日期.9本人盤名:王端:化.各il关于论文使用授权的说明?本人完全了稱桂林电子科技大学有关保留和使用学位

3、论文的规定,即:研巧生在校巧读学垃期间论文工作的知巧产权单位属桂林电子科技大学。本人保证毕业离校。学校有权保后,发表论文或使用论文工作成果时署名单位仍然为桂林电子科技大学校可W公布论文的全部或部分内容,留送交论文的复印件;学,允许查阅和谓闽论文可臥允许采用影印、缩巧或其它复制手段保存论文。(保密的论文在解密后遵守此规定)本学化论文属于保密在。__年解密盾适用本授权书本人篮名;王哉港曰期;导师盛名::曰期化.摘要摘要随着互联网技术和信息技术的飞速发展,以语音为

4、载体的说话人识别技术应运而生。由于它的无侵害性和对用户最自然直观的方式,使得说话人识别技术成为最容易被接受的生物认证方式之一,并在社会各个领域得到广泛应用,如司法侦查、电子商务、金融等。虽然说话人识别技术在理论上已取得了不错的成果,但在实际应用中还存在一些问题,需要进一步的研究。本文从说话人识别的整体框架入手,在总结分析现有说话人识别技术的基础上,对语音信号的前端处理、特征提取、模型匹配等问题进行研究,具体的工作内容和创新如下:(1)由于端点检测的准确性影响到整个系统的识别率,本文针对短时TEO能

5、量算法抗噪性差的缺点,提出一种强噪声下的端点检测新算法。该算法在短时TEO能量端点检测的基础上,增加Mel倒谱距离判断环节,采用先粗判后精判的互补性两级判决机制,然后与传统双门限法和谱熵法在不同背景噪声不同信噪比下进行对比实验。实验表明,在信噪比相对较低的环境下,该改进算法在没有增加运算复杂度的同时提高了系统检测的准确度。(2)特征参数的选取影响系统识别的好坏,为了最大可能地提取出能反映说话人个性特征的参数,本文提出将表征说话人语音特性的Mel倒谱系数和体现语音信号时域特征的短时TEO能量的混合特

6、征参数应用于说话人识别中。目的是通过增加表征说话人语音特征参数的维数来改善系统性能;并采用相关距离Fisher比选取贡献值大的向量,重新组合得到更能完整描述说话人语音特征的混合参数。(3)分析基于GMM-UBM说话人识别系统的主要技术,建立基于GMM-UBM的说话人识别系统模型。通过训练全部说话人的语音信号得到UBM,再利用MAP得到待识别的语音的GMM模型。计算出每个说话人的对数概率得分,通过分析比较区分不同说话人,确定其身份。通过实验对比MFCC、MFCC+MFCC、TEO-MFCC三组特征

7、参数各自的识别效果,证明本文提出的混合特征参数在不增加复杂度的同时能够得到更高的识别率,鲁棒性更好。另外,本文还分析了相关距离Fisher比加权降维算法和高斯混合模型阶数以及测试时长对识别结果的影响,最后将端点检测和特征提取两种改进算法组合起来,系统地进行说话人识别实验。关键词:说话人识别端点检测Mel倒谱距离MFCCTEOGMM-UBMIAbstractAbstractWiththerapiddevelopmentofInternettechnologyandinformationtechnol

8、ogy,thetechnologyofspeakerrecognitionwithvoicecomesintobeing.Becauseofitsnon-invasiveandthemostnaturalandintuitivewayforusers,thespeakerrecognitiontechnologybecomesoneofthemostacceptablewaysofbiometricauthentication,anditiswidelyusedinallareas

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。