基于听觉特征参数的说话人识别技术

基于听觉特征参数的说话人识别技术

ID:35177849

大小:3.92 MB

页数:73页

时间:2019-03-20

基于听觉特征参数的说话人识别技术_第1页
基于听觉特征参数的说话人识别技术_第2页
基于听觉特征参数的说话人识别技术_第3页
基于听觉特征参数的说话人识别技术_第4页
基于听觉特征参数的说话人识别技术_第5页
资源描述:

《基于听觉特征参数的说话人识别技术》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码10530学号201330101206分类号TN912密级硕士学位论文基于听觉特征参数的说话人识别技术学位申请人熊冰峰指导教师曾以成教授学院名称物理与光电工程学院学科专业电子科学与技术研究方向语音信号处理二○一六年五月十六日SpeakerRecognitionTechnologyBasedonAuditoryFeatureParametersCandidateBingfengXiongSupervisorProfessorYichengZengCollegeSchoolofPhysicsandOptoelec

2、tricEngineeringProgramElectronicScienceandTechnologySpecializationSpeechSignalProcessingDegreeMasterofEngineeringUniversityXiangtanUniversitythDataMay16,2016i湘運大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加W标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果

3、作品。对本文的研巧做出重要贡。献的个人和集体,均已在文中W明确方式标明本人完全意识到本声明的法律后果由本人承担。I/作者签名:日期从伸^月》日。学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湘潭大学可W将本学位论文的全部或部分内容编、入有关数据库进行检索,可W采用影印缩印或扫描等复制手段保存和汇编本学位论文。渉密论文按学校规定处理。/。:如作者签名

4、:日期細A月/日口':^月导师签名:日期知日I摘要语言是人类信息交流最常用的方式,它自然方便、准确高效。随着科技的发展,用现代手段研究语音信号处理技术,对于促进人机交互技术的进步具有十分重要的意义。语音信号处理技术是语音学和数字信号处理想结合的交叉学科,它与信息科学中许多前沿学科保持着密切联系。语音信号处理可分为三个方向,语音识别,语音情感识别,说话人识别。语音识别是让机器识别和理解人类语音信号转变为相应文本或命令,语音情感识别是机器从语音信号中识别人的各种情感,说话人识别是通过对说话人语音信号的分析,自

5、动识别说话人身份的技术。本文主要研究方向是说话人识别技术。说话人识别又称为声纹识别,是语音信号处理的一个重要分支,说话人识别技术最关键的一个环节是提取特征参数,是一直以来研究者们研究的热点问题。针对目前说话人识别研究情况,本文开展了以下的研究工作:(1)语音信号前端处理须加窗分帧,但容易造成频谱泄露的问题,这不利于得到可靠的精确的特征参数,我们提出一种汉明卷积窗,分析与实验表明这种窗函数性能指标优于经典窗函数,在语音预处理中用其代替传统窗函数,能较好地抑制频谱失真。(2)目前主流的说话人识别系统是采用线性预测倒谱系数

6、(LPCC)和梅尔倒谱系数(MFCC),虽然在高信噪比的环境下取得了较好的识别率,但是在低信噪比环境,系统识别率下降较快,说明特征参数的抗噪性能低,针对这一问题,根据人耳听觉系统的特性,提出基于听觉特性的全极点伽马通滤波器模型(APGF),更加符合人耳非对称滤波特性,实验表明这种听觉特征参数具有更好的鲁棒性。(3)目前常用的特征参数都需通过傅里叶变换,得到语音信号的频域信息,但傅里叶变换分辨率单一,对长时语音非平稳信号,并不具有优势。本文结合小波变换的多分辨率分析的优点,通过听觉变换得到耳蜗倒谱系数,将耳蜗特征参数应

7、用于说话人识别系统,鲁棒性和抗噪性能优于经典的特征参数。进一步研究了Mel域、Bark域和ERB域尺度等不同频域尺度的耳蜗倒谱系数,分别进行仿真实验,实验结果表明ERB尺度耳蜗倒谱特征参数优于Bark尺度的倒谱特征。以上研究对说话人识别工程应用有积极意义。关键词:汉明卷积窗;全极点伽马通模型;小波变换;耳蜗倒谱系数IAbstractLanguageisthemostcommonlyusedapproachofinformationcommunication.Itisnaturalandconvenient,accur

8、ateandefficient.Withthedevelopmentoftechnology,itisveryimportanttostudyspeechsignalprocessingtechnologybymodernmeanstopromotetheprogressofhumancomputerinteractiontechnology.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。