说话人识别中的特征参数提取和识别算法研究

说话人识别中的特征参数提取和识别算法研究

ID:23932878

大小:10.77 MB

页数:112页

时间:2018-11-11

说话人识别中的特征参数提取和识别算法研究_第1页
说话人识别中的特征参数提取和识别算法研究_第2页
说话人识别中的特征参数提取和识别算法研究_第3页
说话人识别中的特征参数提取和识别算法研究_第4页
说话人识别中的特征参数提取和识别算法研究_第5页
资源描述:

《说话人识别中的特征参数提取和识别算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、’密级分类号.UDC^NANJiNGUNiVERSiTrOFSCIENCE&TECHNOLOGY博士学位论文说话人识别中的特征参数提取和识别算法研究(题名和副题名)张燕(作者姓名)唐振民教授指导教师姓名学位类别工学博士学科名称控制科学与工程研究方向论文提交时间2016.11注1:注明《国际十进分类法UDC》的类号。博士学位论文说话人识别中的特征参数提取和识别算法研究作者:张燕指导教师:唐振民教授南京理工大学2016年1

2、1月Ph.D.DissertationResearchonFeatureExtractionandModelAlgorithmforSpeakerRecognitionByZhanYangSupervisedbyProf.ZhenminTangNaninUniversitofScience&TechnolojgygyNov2016,声明本学位论文是我在导师的指导下取得的研究成果,尽我所知,在本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发表或公布过的研

3、究成果,也不包含我为获得任何教育机构的学位或学历而使用过的材料一。与我同工作的同事对本学位论文做出的贡献均己在论文中作了明确的说明。研究生签名,咱:士月学位论文使用授权声明南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅或上网公布本学位论文的部分或全部内容,可以向有关部门或机构送交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对于保密论文,按保密的有关规定和程序处理。研究生签名:年卿阳博士学位论文说话人识别中的特征参数提取和识别算法研究摘要随着云计算,大数据时代的到来,移动环境下

4、的多模态自然人机交互,包括面向服务机器人的语音交互需求,对话系统及安全验证系统,都对当前的说话人识别技术提出更大的挑战。互联网时代对数据分析提出了更高的要求,分析的颗粒度越来越小,对用户行为数据的分析也越来越关键。得益于丰富多样的终端存储与处理,语音作为人类获取信息最有效、最自然的方式,其采集保存与应用变得越来越方便,智能语音交互和安全验证受到更为广泛的关注。说话人识别是通过对说话人语音信号的参数分析和特征提取,依据训练的说话人特定模型进行待测语音的身份认定。本文首先对说话人识别课题的研究意义及发展历程等进行了综述性的介绍,

5、并指出了当前说话人识别领域的研究热点和难点问题。在前人取得的研究成果的基础上,针对说话人识别任务,在端点检测预处理,鉴别性特征提取和识别算法三个环节进行了系统且较为深入的研究,设计了文本无关的说话人识别实验系统,包括对语音片段端点的检测模块、预处理模块、针对鉴别性分析的特征提取模块和多种创新性识别算法模块,并进行了充分的理论分析与实验验证。主要创新性工作如下:一1.提出了种多层次框架的鲁棒性语音端点检测算法,该算法的优势在于充分考一虑各种特征的特性将多种特征方法有机结合在起,并引入了投票机制,保证了算法在不同噪声条件下的

6、鲁棒性,提高了低信噪比情况下的端点检测精度。该算法由三个模块组成,在语音增强模块中,首先利用判决引导方法估计先验信噪比,然后利用改进的维纳滤波方法进行噪声抑制征提取和投票模块中,分别提取多种具有鉴别意义的短;在特时特征。鉴于部分特征更适合特定的噪声条件,因此采用投票的模式增强特征的可靠性和辨别能力在分类模块中,采用两个标准语音数据库训练的不同信噪比下的SVM模;””:one-aans-:?型,最后采用gitone的方法来有效确定语音/<,|丨语音段在不同类型噪声条件下,信噪比20dB时,语音/非语音的平均正确检测率可以达到97.

7、8%。2。.提出了两种用于说话人识别的鉴别性特征提取方法首先鉴于说话人个性信息在不同频带呈不均勻分布的原理-m,基于Ftio值来衡量不同子频带对说话人个性信息的区分度,,设计非均匀滤波器通过实验数值分析及量化,提取非均匀鉴别性特征,在仿真实验中,NUFCC特征的识别率比MFCC特征平均提高了2.23%,表明该特征作为针,能够有效利用不同子频带的信息,对说话人识别任务提取的特征,改善系统的性能具有良好的区分性。其次提出提取汉语单字音节特征的方法,该方法基于经典的砑斤帧特一征分析理念,,,结合汉语自负的音节结构和发音特点对语音

8、帧序列进行进步处理找到单个汉字的典型帧序列,然后将帧序列的特征矢量进行拼接得到该字的特征矢

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。