基于Ⅰ-Vector的声纹识别系统设计与实现

基于Ⅰ-Vector的声纹识别系统设计与实现

ID:37032959

大小:2.28 MB

页数:62页

时间:2019-05-15

基于Ⅰ-Vector的声纹识别系统设计与实现_第1页
基于Ⅰ-Vector的声纹识别系统设计与实现_第2页
基于Ⅰ-Vector的声纹识别系统设计与实现_第3页
基于Ⅰ-Vector的声纹识别系统设计与实现_第4页
基于Ⅰ-Vector的声纹识别系统设计与实现_第5页
资源描述:

《基于Ⅰ-Vector的声纹识别系统设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号学号M201676106学校代码10487密级硕士学位论文基于I-Vector的声纹识别系统设计与实现学位申请人:黄超学科专业:软件工程指导教师:陆永忠副教授答辩日期:2018.12.19AThesisSubmittedinPartialFulfillmentoftheRequirementsfortheDegreefortheMasterofEngineeringDesignandimplementationofvoiceprintrecognitionsystembasedonI-VectorCandidate:HuangChaoMajor:SoftwareEn

2、gineeringSupervisor:Assoc.Prof.LuYongzhongHuazhongUniversityofScience&TechnologyWuhan430074,P.R.ChinaDecember,2018华中科技大学硕士学位论文摘要伴随着计算机科技的发展,最近一些年来,发展带来的网络信息安全出现在日常生活中越加频繁,越来越多的民众关心这个问题。由于生物特征识别的方法的独特和有效性,是得这个方式逐渐兴起,受到了很多学术界和工业界的关注。声纹识别是一种新型的根据说话人语音来进行身份认证的技术,能使用户充分参与到其中,而且这个过程中需要的设备成本也低,使

3、得这个技术可以广泛应用在金融、军事、信息电子、互联网、公安等领域。梅尔频率倒谱参数(MFCC)充分利用了人类的生理特征优势以及语音信号的频谱特征,常常被用来作为描述说话人特性的特征参数。在实际运用中,声纹识别的发展所遇到最大问题之一就是如何克服前后语音数据信道不一致的问题,针对这个问题,本文采用了i-vector/PLDA的方法作为声纹识别的核心算法,通过PLDA来补偿包含说话人特性信息和信道信息的i-vector特征,来达到消除信道不一致的干扰;由于预处理阶段对系统最终展现效果至关重要,在语音预处理阶段采用了基于短时能量和LTSD的语音端点检测的方法结合的方式来提取语音

4、中有效片段,在PLDA阶段前,系统对i-vector特征进行了高斯白化处理,最终效果有了一定提升;实验对比了不同评分方式对系统性能的影响,为了提高系统反应速度,针对耗时的部分进行了优化,降低了在训练和识别上的时间消耗,对系统识别的效果带来了显著提高。本文根据标准软件工程的开发步骤,对系统做出了详细的分析和设计,并实现了系统的各种功能。经过实际测试表明,实现的声纹识别系统不仅能够满足识别的各种需求,而且在性能上,也保证了检测的实时性和准确性。关键词:声纹识别语音预处理梅尔频率倒谱系数信道I华中科技大学硕士学位论文AbstractWiththedevelopmentofcom

5、puterscienceandtechnology,inrecentyears,thedevelopmentofnetworkinformationsecurityappearsmoreandmorefrequentlyindailylife,moreandmorepeopleareconcernedaboutthisissue.Becauseoftheuniquenessandvalidityofthebiometricrecognitionmethod,ithasgraduallyemergedandattractedtheattentionofmanyacademi

6、csandindustry.Voiceprintrecognitionisanewtechnologyforidentityauthenticationbasedonspeaker'svoice,whichenablesuserstofullyparticipateintheprocess,andthecostofequipmentrequiredintheprocessisalsolow,makingthistechnologycanbewidelyusedinfinance,military,informationelectronics,Internet,public

7、securityandotherfields.MeyerFrequencyCepstrumParameter(MFCC)makesfulluseoftheadvantagesofhumanphysiologicalcharacteristicsandthespectralcharacteristicsofspeechsignals,andisoftenusedasafeatureparametertodescribethespeaker'scharacteristics.Inpractice,oneofthebiggestpr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。