基于全局背景模型和辅助模型的说话人确认系统的研究

ID：34453468

大小：348.53 KB

页数：5页

时间：2019-03-06

资源描述：

《基于全局背景模型和辅助模型的说话人确认系统的研究》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、第36卷第2期信息化研究V01．36No．22010年2月InformatizationResearchFeb．2010基于全局背景模型和辅助模型的说话人确认系统的研究汤小飞，曾毓敏，李晓伟(南京师范大学物理科学与技术学院，江苏省南京市210097)摘要：大多数说话人确认系统都设置一个背景模型用于描述假冒者的特性。文中提出一种新的说话人确认背景模型，对所有说话人采用同一全局背景模型(UBM)，并为每个说话人建立一个竞争者模型(coho~mode1)和一个疏远者模型(c—coho~mode1)。在全局背景模型不能做出准确判断的情况下，启用竞争者模型或疏远者模型再次进行判决。

2、该模型充分利用了相近者模型和疏远者模型的特性。实验表明新的背景模型使系统性能有明显的提高。关键词：说话人确认；背景模型；全局背景模型；竞争者模型；疏远者模型中图分类号：TP181模型表示特征空间中一般说话人的特性；另一方面对0引言相近的假冒者和声学特征相差很大的假冒者。对测试说话人确认是一个二元判决问题，即给定说话人句判决时，先利用同样UBM模型将判决空间分成两个的确认语句及其身份，系统做出接受或拒绝的判断。区域，对于落入不确定区域的测试句，启用相应的竞争大多数说话人确认系统都设置一个背景模型，用于描者模型和疏远者模型重新做出判决。这样充分利用了述假冒者的特性。假设某一用

3、户的性质为0，则假冒三个模型的互补性，可提高系统的识别率，而增加的计者背景模型的作用就是要准确描述0的非，即0。理算开销不多。论上，背景模型中说话人越多，则越能描述0。1说话人确认中的背景模型被广为研究的假冒者模型大致可分为两种：一种是全局模型(UBM)；一种是竞争者模型(coho~mod．1．1说话人确认系统e1)。这两个模型各有优缺点，全局模型对声学特征相说话人确认是一个假设检验问题，即给定测试语差比较大的区分性能较强，而对声学特征相近的识别音，在下列两个事件中做出选择：Hl：是由真实说较差。竞争者模型可以较好地区分声学特征相近的假话人发出，H0：X是由假冒者发出。如

4、图l所示。冒者，但对声学特征相差较大的则区分性能较差⋯。全局模型和竞争者模型分别代表特征空问中的不同区域J，因此可考虑将两者级联。对每个说话人分别建立一个全局背景模型和竞争者模型。测试时，先用全局背景模型对测试语句进行判决。当测试语句在图1说话人确认系统全局模型无法判定时，进入竞争者模型进行第二次判本文采用GMM(高斯混合模型)作为声称者模决。对每个说话人采用不同的全局模型，即为每一位型3J。GMM本质上是一种多维概率密度函数。一个注册者分别建立一个全局模型，这样虽然使每个说话具有个混合数的D维GMM可用m个高斯分量的人背景模型的描述更加精确，但是整个确认系统更加加权和来

5、表示：复杂，增加了计算量。对每个人都准备一个全局模型耗费的时间是巨大的，所以研究者们又提出一种所有p(一xIA)：∑O)ib()(1)lI人都只用同一个全局模型的方法。其中：表示观测向量；表示每个混合加权值，且本文提出一种以UBM为主，竞争者模型和疏远者模型为辅的背景模型。对所有的声称者而言，用UBM∑=1。bi()，l，2，3⋯，m表示每个混合D维高斯密度函数，即：收稿日期：2009—11—19；修回日期：2009-12-20。·19··研究与设计·信息化研究2010年2月式中：为测试语句的帧数。。对说话人确认系统而言，背景模型的归一化作用非常重要J。因为绝对似然分数容

6、易受许多与发音exP{一1—I—xi)∑-I(一t—xi)}(2)有关因素的影响，例如说话人声道特性、发音文本内式中：五表示均值矢量；∑‘表示协方差矩阵]。所容、语音质量等。这些因素会导致决策门限不易设定。’l以如果我们以A表示GMM的参数，整个高斯混合模型设定背景模型可增强说话人之间的可分离性，使决策门限的设置更方便，有利于削减说话人的背景干扰，以由单个高斯模型的均值矢量、协方差矩阵、混合模型权及将说话人语音声学特性的变异性归一化。值共同组成，如下式：1．3竞争者模型以及疏远者模型A={∞，／x，∑}，=l，2，3，⋯，m(3)Reynolds提出了如何选择竞争者模型的

7、方法，GMM的训练就是对GMM参数的估计，使它和用定义一个距离d来衡量两个说话人模型和之问的于训练的特征矢量分布最相近。当前GMM训练最流距离：行的算法是最大似然估计(ML)算法。在说话人确认系统中，确认错误由误拒率FR和d(Ai,Ajg+lg(7)误受率FA来表示，前者是拒绝真实的声称者造成的式中：和分别表示第和个人的测试语句；A和错误，后者则是把假冒者错认为其声称者而造成的错A分别代表两个说话人的模型。两个模型的特性越相误。随着判决门限的提高，FA逐渐下降，FR逐渐升近，则距离d越小。在假冒者为声学特性比较相近的情高，在F

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 5



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于全局背景模型和辅助模型的说话人确认系统的研究

基于全局背景模型和辅助模型的说话人确认系统的研究

相关文章

相关标签