基于全局背景模型和辅助模型的说话人确认系统的研究

基于全局背景模型和辅助模型的说话人确认系统的研究

ID:34453468

大小:348.53 KB

页数:5页

时间:2019-03-06

基于全局背景模型和辅助模型的说话人确认系统的研究_第1页
基于全局背景模型和辅助模型的说话人确认系统的研究_第2页
基于全局背景模型和辅助模型的说话人确认系统的研究_第3页
基于全局背景模型和辅助模型的说话人确认系统的研究_第4页
基于全局背景模型和辅助模型的说话人确认系统的研究_第5页
资源描述:

《基于全局背景模型和辅助模型的说话人确认系统的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第36卷第2期信息化研究V01.36No.22010年2月InformatizationResearchFeb.2010基于全局背景模型和辅助模型的说话人确认系统的研究汤小飞,曾毓敏,李晓伟(南京师范大学物理科学与技术学院,江苏省南京市210097)摘要:大多数说话人确认系统都设置一个背景模型用于描述假冒者的特性。文中提出一种新的说话人确认背景模型,对所有说话人采用同一全局背景模型(UBM),并为每个说话人建立一个竞争者模型(coho~mode1)和一个疏远者模型(c—coho~mode1)。在全局背景模型不能做出准确判断的情况下,启用竞争者模型或疏远者模型再次进行判决。

2、该模型充分利用了相近者模型和疏远者模型的特性。实验表明新的背景模型使系统性能有明显的提高。关键词:说话人确认;背景模型;全局背景模型;竞争者模型;疏远者模型中图分类号:TP181模型表示特征空间中一般说话人的特性;另一方面对0引言相近的假冒者和声学特征相差很大的假冒者。对测试说话人确认是一个二元判决问题,即给定说话人句判决时,先利用同样UBM模型将判决空间分成两个的确认语句及其身份,系统做出接受或拒绝的判断。区域,对于落入不确定区域的测试句,启用相应的竞争大多数说话人确认系统都设置一个背景模型,用于描者模型和疏远者模型重新做出判决。这样充分利用了述假冒者的特性。假设某一用

3、户的性质为0,则假冒三个模型的互补性,可提高系统的识别率,而增加的计者背景模型的作用就是要准确描述0的非,即0。理算开销不多。论上,背景模型中说话人越多,则越能描述0。1说话人确认中的背景模型被广为研究的假冒者模型大致可分为两种:一种是全局模型(UBM);一种是竞争者模型(coho~mod.1.1说话人确认系统e1)。这两个模型各有优缺点,全局模型对声学特征相说话人确认是一个假设检验问题,即给定测试语差比较大的区分性能较强,而对声学特征相近的识别音,在下列两个事件中做出选择:Hl:是由真实说较差。竞争者模型可以较好地区分声学特征相近的假话人发出,H0:X是由假冒者发出。如

4、图l所示。冒者,但对声学特征相差较大的则区分性能较差⋯。全局模型和竞争者模型分别代表特征空问中的不同区域J,因此可考虑将两者级联。对每个说话人分别建立一个全局背景模型和竞争者模型。测试时,先用全局背景模型对测试语句进行判决。当测试语句在图1说话人确认系统全局模型无法判定时,进入竞争者模型进行第二次判本文采用GMM(高斯混合模型)作为声称者模决。对每个说话人采用不同的全局模型,即为每一位型3J。GMM本质上是一种多维概率密度函数。一个注册者分别建立一个全局模型,这样虽然使每个说话具有个混合数的D维GMM可用m个高斯分量的人背景模型的描述更加精确,但是整个确认系统更加加权和来

5、表示:复杂,增加了计算量。对每个人都准备一个全局模型耗费的时间是巨大的,所以研究者们又提出一种所有p(一xIA):∑O)ib()(1)lI人都只用同一个全局模型的方法。其中:表示观测向量;表示每个混合加权值,且本文提出一种以UBM为主,竞争者模型和疏远者模型为辅的背景模型。对所有的声称者而言,用UBM∑=1。bi(),l,2,3⋯,m表示每个混合D维高斯密度函数,即:收稿日期:2009—11—19;修回日期:2009-12-20。·19··研究与设计·信息化研究2010年2月式中:为测试语句的帧数。。对说话人确认系统而言,背景模型的归一化作用非常重要J。因为绝对似然分数容

6、易受许多与发音exP{一1—I—xi)∑-I(一t—xi)}(2)有关因素的影响,例如说话人声道特性、发音文本内式中:五表示均值矢量;∑‘表示协方差矩阵]。所容、语音质量等。这些因素会导致决策门限不易设定。’l以如果我们以A表示GMM的参数,整个高斯混合模型设定背景模型可增强说话人之间的可分离性,使决策门限的设置更方便,有利于削减说话人的背景干扰,以由单个高斯模型的均值矢量、协方差矩阵、混合模型权及将说话人语音声学特性的变异性归一化。值共同组成,如下式:1.3竞争者模型以及疏远者模型A={∞,/x,∑},=l,2,3,⋯,m(3)Reynolds提出了如何选择竞争者模型的

7、方法,GMM的训练就是对GMM参数的估计,使它和用定义一个距离d来衡量两个说话人模型和之问的于训练的特征矢量分布最相近。当前GMM训练最流距离:行的算法是最大似然估计(ML)算法。在说话人确认系统中,确认错误由误拒率FR和d(Ai,Ajg+lg(7)误受率FA来表示,前者是拒绝真实的声称者造成的式中:和分别表示第和个人的测试语句;A和错误,后者则是把假冒者错认为其声称者而造成的错A分别代表两个说话人的模型。两个模型的特性越相误。随着判决门限的提高,FA逐渐下降,FR逐渐升近,则距离d越小。在假冒者为声学特性比较相近的情高,在F

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。