欢迎来到天天文库
浏览记录
ID:43733997
大小:1.09 MB
页数:89页
时间:2019-10-13
《说话人确认和辨认的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、密级:秘密说话人确认和辨认的研究与实现ResearchandImplementationofSpeakerVerificationandIdentification(申请清华大学工学硕士学位论文)院(系、所):计算机科学与技术系专业:计算机应用研究生:何致远指导教师:胡起秀教授2002年6月说话人确认和辨认的研究与实现何致远独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得清华大学或其它教育机构的学位或证书而使用过的材
2、料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:H期:关于论文使用授权的说明本人完全了解清华大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)签名:导师签名:日期:说话人识别是语音信号处理的核心技术之一,随着人机交互和多媒体技术的发展以及普适计算的提出,说话人确认和辨认技术得到了越来越多的重视,其研究与应用也在不断发展和深化山2,21]。木文围绕着为完成国家863项
3、目、清华大学985项目以及某公安部门与清华大学的合作开发项目等任务而实现的若干说话人确认和辨认系统,详细介绍了说话人识别的基木概念和基木理论,深入阐述了说话人确认和辨认中的关键技术及系统实现,并对说话人识别的研究与应用进行了总结和展望。已经实现的说话人识别系统包括:•基于随机数字串的文木提示的说话人确认系统;•基于姓名的文木相关的说话人确认系统和说话人辨认系统;•基于连续语音的文本无关的说话人确认系统;•基于连续语音的文本无关的闭集和开集说话人辨认系统。在这些系统的实现过程中,我对说话人确认和辨认进行了深入的研究,取得了以下成果:(1)提出了一种基于公共
4、码本的DHMM模型训练方法⑺,并用这种方法成功地实现了文木提示和文木相关的说话人确认及辨认。该方法能够有效地降低训练和识别所需的语音数据量,并保持较高的识别准确率。与采用个人码本的模型训练方法相比,这种方法能够准确地区分正识者和冒充者,并且其相似性得分能够肓接反映出说话人个性特征的差异,不需要另外设计得分规一化算法。(2)在以往研究的基础上提出了一种基于码本统计分布的距离测度l,0J,并运用于文木无关的说话人确认和辨认。这种距离测度克服了传统的绝对值距离和欧氏距离无法正确反映正识者和冒充者之间特征差异的缺陷,能够有效地度量集内训练人和集外说话人之间、以及
5、集内各个训练人之间的特征差异。(3)提出了一种基于背景说话人模型差的得分规一化方法和拒识阈值的区间估计方法,成功地解决了文本无关的说话人确认和开集说话人辨认的拒识问题。在以往的研究中,我们用拟合高斯分布的方法进行得分规一化,并用统计值或实验值作为拒识阈值⑸。这种方法虽然速度较快,但准确性欠佳。基于背景说话人模型差的得分规一化方法精确地描述了冒充者在高维特征空间中的分布,用区间估计方法产牛的拒识阈值偏差也相对较小,从而大大提高了识别的准确性[g]。(1)针对说话人识别中语音能量变化和噪声对提取有效语音数据的影响,在传统时域语音切分算法山的基础上,提出了3种
6、孤立词精确切分算法和1种连续语音的非精确切分算法,它们分别是:•基于帧幅度统计阈值的孤立词切分算法;这种算法能够较好地克服各个孤立词语音能量变化对切分的影响,实际运用于基于随机数字串的文木提示的说话人确认系统中。•基于动态搜索窗的孤立词切分算法;这种算法能够较准确地区分能量较低的短时噪声和一般孤立词语音,实际运用于基于姓名的文木相关的说话人确认系统中。•基于帧参数规一化的孤立词切分算法;前两种切分算法有一个共同的缺点,即需要较多的局部阈值和加权系数,算法的相关程度较高,鲁棒性较差。基于帧参数规一化的孤立词切分算法考虑了长吋语音的变化,并且相关性较低,因而
7、鲁棒性较强。实际运用于基于姓名的文本相关的说话人辨认系统中。•基于帧信噪比统计阈值的连续语音切分算法。这种方法针对连续语音的说话人识别中不需要对语音进行精确切分的特点,舍弃那些信噪比较低的无声帧和噪声帧,达到数据选择的目的。我们在基于连续语音的文木无关的说话人确认和辨认系统中使用了这种切分算法,实验表明这确实是一种简便实用的方法。(2)提出了一种两级决策的开集说话人辨认方法。与传统的开集拒识策略不同,这种方法能够有效地降低由于仅有一个公共拒识阈值而带来的决策风险,进而提高识别的正确率。关键词:说话人确认,说话人辨认,语音切分,距离测度,背景说话人模型,得
8、分规一化,拒识阈值AbstractSpeakerrecognitionisake
此文档下载收益归作者所有