声纹密码技术的研究

声纹密码技术的研究

ID:33817155

大小:5.21 MB

页数:129页

时间:2019-03-01

声纹密码技术的研究_第1页
声纹密码技术的研究_第2页
声纹密码技术的研究_第3页
声纹密码技术的研究_第4页
声纹密码技术的研究_第5页
资源描述:

《声纹密码技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Universit3of一‘andTechnol093ofChinaUnlversltyotScienceandl'eclmologvotChinaDissertationforDoctor'SDegreeAResearchontheVocaIPasswordSystemAuthor’SName:Yi—QianPanSpeciality:Signal&InformationProcessingSupervisor:Prof.Qing—FengLiuProf.Li-RongDaiFinishedtime:May9,2012中国科学技术大学学位论文原创性声明本

2、人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除己特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均己在论文中作了明确的说明。作者签名:签字日期:少穆.占.莎中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保

3、存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。d公开口保密(年)作者签名:超盎签字日期:’o,’.6.6导师签名:毖边旅争荔签字日期:型兰兰:2摘要在生物特征认证技术领域,声纹密码具备快速、便捷、双重加密等优势,在刑侦、安全、经济、生活等各个方向拥有广阔的应用前景。经典的声纹密码系统首先采用语音识别系统对密码内容进行确认,再利用文本无关的说话人识别系统对说话人个性特征进行确认,两次确认策略确保了声纹密码系统的高性能。然而现有的声纹密码系统过多地依赖于语音识别对密码内容的预判决功能,如果冒认者已经获得密

4、码内容,系统错误接收率将显著增加。在此背景下,本文针对冒认者己知密码文本的声纹密码任务,分别在特征域、模型域和得分域进行深入研究和创新,提升了密码文本己知时的系统性能。首先,本文在声纹密码系统特征前端提出特征域偏差估计(FSBE)N信道补偿方法。利用卷积信道噪声在倒谱域表现为线性偏移的现象,传统的CMS、CMVN、双高斯CDF.Matching等信道补偿方法基于单高斯或双高斯特征分布假设,利用各种特征参数归一化方法削弱信道和噪声干扰。相对于传统方法因单高斯或双高斯特征分布假设与实际数据分布不符带来的局限性,本文提出的FSBE方法利用最大化每条测试语音相对于

5、说话人模型和冒认者模型似然度,将测试语音自动投影至目标模型各高斯分量对应的信道空间,训练获得线性或分段线性特征偏移参数。FSBE方法不再依赖参数归一化思想,通过训练获得较好的特征优化效果,也可用作传统信道补偿技术的补充方法。实验验证了特征域偏移估计方法对声纹密码系统信道失配问题具有一定的改善效果。其次,本文对声纹密码系统中说话人模型建模方法进行了研究,提出了高斯混合帧模型(GMFM)的新方法。传统的非参数与参数模型估计方法在密码已知的声纹密码系统中都存在不足之处,前者仅能反映有限注册数据的分布结构,无法描述潜在变化规律以及说话人内部差异,后者在数据稀疏情况

6、下难以获得准确的参数估计,比如GMM.UBM方法中仅调整均值向量不更新协方差矩阵的近似策略导致说话人模型与实际数据分布差异较大,且GMM模型存在忽略文本相关瞬时信息的缺陷。本文结合非参数方法与参数估计方法提出了GMFM建模方法,以每帧训练样本注册一个高斯分量,令每个高斯密度函数的均值向量为对应帧特征向量。为了避免参数估计过拟合的问题,该策略假定所有高斯分量共享少量数目的协方差对角阵,利用最大似然准则进行训练,从而获得较为准确的说话人模型。GMFM方法兼顾了文本相关瞬时信息和说话人内部差异,并且通过绑定方差缓解了数据稀疏的影响,尤其适合短时声纹密码任务。实验

7、表明基于GMFM模型的声纹密码系统相对基线系统获得较大性能提升。再次,本文在声纹密码任务中提出一种基于最小分类错误(MCE)准则的区分性声纹密码模型训练策略。传统区分。陛/)ll练方法对数据量需求较大,在声纹密码这类短语音任务中难以发挥效用。本文提出的区分性训练新策略将训练集所有说话人的原始特征转换为一种表征其相对于注册模板距离的说话人无关新特征,从而可以集中所有说话人数据组成正例训练集和反例训练集,最终基于MCE准则进行两类区分性训练获得一对通用的正例和反例模型。该策略不仅巧妙地解决了声纹密码任务中区分性训练数据量不足的问题,而且将说话人相关的确认任务转

8、化为说话人无关的经典分类任务,更加灵活有效、节省资源、适合大规模测

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。