欢迎来到天天文库
浏览记录
ID:35068674
大小:4.51 MB
页数:123页
时间:2019-03-17
《基于稀疏编码的鲁棒说话人识别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、工学博士学位论文基于稀疏编码的鲁棒说话人识别方法研究哈尔滨理工大学2016年6月国内图书分类号:TP391.4工学博士学位论文基于稀疏编码的鲁棒说话人识别方法研究博士研究生:谢怡宁导师:黄金杰申请学位级别:工学博士学科、专业:计算机应用技术所在单位:计算机科学与技术学院答辩日期:2016年6月授予学位单位:哈尔滨理工大学ClassifiedIndex:TP391.4DissertationfortheDoctorDegreeinEngineeringRobustSpeakerRecognitionBasedonSparseCodingCandidate:XieYiningSup
2、ervisor:HuangJinjieAcademicDegreeAppliedfor:DoctorofEngineeringSpecialty:ComputerAppliedTechnologyDateofOralExamination:June,2016University:HarbinUniversityofScienceandTechnology滨理工大学博±学位论文原创性声明.哈尔本人郑重声明:此处所提交的博±学位论文《基于稀疏编码的鲁棒说话人识别方法研究)〉,是本人在导师指导下,在哈尔滨理工大学攻读博±学位期间独立进行研究工作所取得的成果。据本人所知,论
3、文中除己注明部分外不包含他人已发表或撰写过的研究成果。对本文研究工作做出贡献的个人和集体,均已在文中W明确方式注明。本声明的法律结果将完全由本人承担。曰期/作者签名::月。曰M巧戶(呼哈尔滨理工大学博±学位论文使用授权书《基于稀疏编码的鲁棒说话人识别方法研究》系本人在哈尔滨理工大学攻读博±学位期间在导师指导下完成的博±学位论文。本论文的研究成果归哈尔滨理工大学所有,本论文的研究内容不得其他单位的名义发表。本人完全了解哈尔滨理工大学关于保存、使用学位论文的规定,同意学校保留并向有关部口提交论文和电子版本,允许论文被查阅和借阅。本人授权哈尔滨
4、理工大学可W采用影印。、缩印或其他复制手段保存论文,可公布论文的全部或部分内容本学位论文属于。保密[],在年解密后适用授权书不保密已。](请在til上相应方框内打々^^作者签名:?个技円期:年月鬥!3一r。:円期导师签名:如年^月円基于稀疏编码的鲁棒说话人识别方法研究摘要说话人识别又称声纹识别,是一种通过语音确定说话人身份的技术。由于使用语音具有采集方便、成本低廉等优点,说话人识别被广泛用于生物认证、安全监控、军事侦查和金融交互等领域,具有广阔的应用前景。数十年来,世界各国的研究机构和公司企业纷纷投入大量人力物力展开研究,有力地推动了说话人识别
5、技术的发展。目前说话人识别技术已逐步从实验室走向应用,而现实环境的复杂性对说话人识别提出了更高的要求,包括鲁棒性、实时性、识别率和稳定性等。这就要求在说话人识别关键环节上有所突破,尤其是语音活动检测、特征提取,以及说话人模型的构建等方面。目前的说话人识别技术在干净语音环境下有理想的识别率,但在噪声环境下,其性能会急剧降低,这阻碍了说话人识别技术走向现实应用。本文针对说话人识别技术缺乏噪声鲁棒性的问题,将稀疏编码技术用于说话人识别的各个环节,包括语音活动检测、语音特征提取和说话人建模等,提出了系统的解决方案,以提高说话人系统在噪声环境下的识别率,主要工作包括以下几个方面:首先,从
6、理论上分析了两种稀疏编码方法对噪声的建模能力,为稀疏编码的应用奠定了基础。稀疏编码在对噪声的建模方面有两种方式:第一种用残差对噪声建模,噪声的理论模型是高斯白噪声,其内在的假定在于语音在语音字典上稀疏,而噪声在语音字典上不稀疏,白噪声在任何字典上都表现得不稀疏,满足了这一要求;第二种采用一个噪声字典对噪声建模,其内在假定在于语音和噪声在各自的字典上稀疏,且在自己的字典上比在对方的字典上更稀疏。本文从理论上分析了这两种稀疏编码方式重构信号时误差的上下限,然后用实验验证了理论分析的结论,表明当噪声不稀疏时,第一种方法和第二种方法的重构误差在理论上有相同的下限和不同的上限;当噪声也可
7、能稀疏时,第二种方法增加了一个字典对噪声建模,融入了更多先验知识,其重构误差上限要低于第一种方法。然后,针对语音活动检测容易受到噪声影响的问题,基于稀疏编码构建噪声字典,提出了一种对噪声鲁棒的语音活动检测方法。语音活动检测是说话人识别的第一步,能减少算法处理的数据量,提高识别效率。目前的语音-I-活动检测方法虽然也考虑了噪声,但只能解决噪声环境已知,且噪声环境不变的情况。当噪声环境发生改变,或者噪声不平稳,其性能将急剧降低。本文首先采用高斯混合模型识别噪声类型;然后将经过训练后的噪声字典与语
此文档下载收益归作者所有