基于压缩感知的说话人识别技术的研究

基于压缩感知的说话人识别技术的研究

ID:36422165

大小:8.24 MB

页数:85页

时间:2019-05-10

基于压缩感知的说话人识别技术的研究_第1页
基于压缩感知的说话人识别技术的研究_第2页
基于压缩感知的说话人识别技术的研究_第3页
基于压缩感知的说话人识别技术的研究_第4页
基于压缩感知的说话人识别技术的研究_第5页
资源描述:

《基于压缩感知的说话人识别技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据SpeakerRecognitionBasedonCompressedSensingADissertationSubmittedtoSoutheastUniversityFortheAcademicDegreeofMasterofEngineeringBYLVZhenSupervisedbyProlessorZouCairong—SchoolofInformationScienceandEngineeringSoutheastUniversityMarch2014万方数据东南大学学位论文独创性声明本人声明所呈交的学位论文是我个人

2、在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其它人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。㈣躞研究生签名:东南大学学位论文使用授权声明东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文文件,可以采用影印、缩印或其它复制手段保存论文。本人电子文文件的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅

3、和借阅,可以公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权东南大学研究生院办理。研究生签名:二登盈导师签名:研究生签名:逻!猛导师签名:Et期:历恨乒.雳万方数据摘要随着信息技术和网络通信的快速发展,人们对信息安全性的要求越来越高,说话人识别技术,凭借其较高的安全性和便捷的使用方式,广泛地被应用于互联网和通信领域,完整的说话人识别系统由预处理、特征提取、模式匹配和判定这几块共同构成,自Bell实验室的L.GKesta提出了“声纹”的概念后,大量学者针对说话人识别技术中不同模块展开研究,收获颇丰。目前,与文本相关的说话人

4、识别技术的研究相对较为成熟,识别性能较好,但是与文本无关的说话人识别技术性能的提升空间还很大,除此之外,由于现实生活中绝大部分的语音信号都含有噪音,而传统的说话人识别算法大多针对干净语音,因此寻找一种鲁棒性较好的说话人识别技术也迫在眉睫。另一方面,近几年,压缩感知理论受到国内外的广泛关注,该理论突破了奈奎斯特采样速率的限制,对可压缩信号在采样的同时也进行压缩,将压缩感知这一新理论与说话人识别这一亟需突破的领域相结合,为说话人识别系统性能的提升带来希望,具有重大的实际应用价值。本文在对压缩感知理论和说话人识别技术进行深入学习的基础上,针对

5、与文本无关的说话人识别技术,做了以下工作:1)研究了稀疏表示理论在模式识别领域中应用,分析了稀疏表示理论和压缩感知的联系与区别,提出用组合特征矢量训练GMM均值超向量,并以此为基础构建稀疏基,随后提出了一种基于压缩感知稀疏表示的说话人识别算法,为两种理论的结合开辟了思路;2)深入研究了贝叶斯框架下的压缩感知算法,给出了区别于传统重建算法的贝叶斯重建算法,鉴于该算法得到的解更接近于最小厶范数的解,率先提出了基于贝叶斯压缩感知的说话人识别算法;3)针对基于压缩感知的说话人识别算法中的稀疏系数的特点,引入半高斯先验,详细分析基于该先验的贝叶斯

6、压缩感知后,提出基于近似贝叶斯压缩感知的说话人识别算法;4)针对说话人识别系统在噪声环境下识别率普遍较低的问题,在详细分析语音信号和噪声信号稀疏性差异后,提出了一种基于压缩感知的语音增强算法,并将其应用在说话人识别前端。本文最后对所做的工作和成果做了总结,并对今后的工作进行了展望。关键词:说话人识别,压缩感知,稀疏表示,贝叶斯压缩感知,高斯混合模型万方数据东南大学硕士学位论文万方数据AbstractWiththerapiddevelopmentofinformationtechnologyandnetworkcommunication,

7、peoplehavebecomeincreasinglydemandingforinformationsecurity.Speakerrecognitiontechnology,byvirtueofitshighsecurityandconvenience,iswidelyusedintheIntemetandcommunication.Acompletespeakerrecognitionsystemconsistsofpreprocessing,featureextraction,pattemmatchinganddetermini

8、ng.SinceBelllabsLGKestaproposedtheconceptof”voiceprint”,alargenumberofscholarsmakeresearchesindifferent

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。