基于参考说话人模型和双层结构的说话人辨认

ID：36502707

大小：371.26 KB

页数：7页

时间：2019-05-11

资源描述：

《基于参考说话人模型和双层结构的说话人辨认》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、Seediscussions,stats,andauthorprofilesforthispublicationat:https://www.researchgate.net/publication/267470442Speakeridentificationusingareferencespeakermodelbasedatwo-layerstructureArticleinQinghuaDaxueXuebao/JournalofTsinghuaUniversity·September2011CITATIONSREADS0155authors,including:GangW

2、angFangZhengAIOFMTsinghuaUniversity92PUBLICATIONS652CITATIONS177PUBLICATIONS841CITATIONSSEEPROFILESEEPROFILEAllcontentfollowingthispagewasuploadedbyFangZhengon11November2014.Theuserhasrequestedenhancementofthedownloadedfile.ＩＳＳＮ１０００－００５４清华大学学报（自然科学版）２０１１年第５１卷第９期２２／３３ＣＮ１１－２２２３／ＮＪＴｓｉｎｇｈｕａＵｎｉｖ

3、（Ｓｃｉ＆Ｔｅｃｈ），２０１１，Ｖｏｌ．５１，Ｎｏ．９１２６１－１２６６基于参考说话人模型和双层结构的说话人辨认王刚，邬晓钧，郑方，王琳琳，张陈昊（１．清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心，北京１０００８４；２．清华大学计算机科学与技术系，北京１０００８４）摘要：为了提高基于Ｇａｕｓｓ混合模型通用背景模型Ｋｅｙｗｏｒｄｓ：ｔｗｏ－ｌａｙｅｒｓｔｒｕｃｔｕｒｅ；ｆａｓｔｓｐｅａｋｅｒｉｄｅｎｔｉｆｉｃａｔｉｏｎ；（ＧＭＭ－ＵＢＭ）的说话人辨认系统的运算效率，提出一种基ｒｅｆｅｒｅｎｃｅｓｐｅａｋｅｒｍｏｄｅｌ于参考说话人模型的双层结构用于目标说话人剪枝，

4、采用矢量量化方法从目标说话人模型集合中训练参考说话人模型，说话人辨认是说话人识别的一种，把待辨认利用语音与参考说人模型的偏差来描述说话人的发音特性，的语音判定为是否属于Ｎ个目标说话人当中的某将辨认语音偏差向量和目标说话人偏差向量的相似性作为［１］一位，是一个多选一的问题。说话人辨认在近距离度量来进行目标说话人剪枝。实验结果表明：在基于十几年来一直都是研究热点，也在许多领域如司ＧＭＭ－ＵＢＭ的说话人辨认系统中，对包含５２００个目标说话法和金融领域得到了实际应用。目前说话人辨认人和１０００个集外说话人的测试集进行开集辨认的条件下，最流行的方法是Ｇａｕｓｓ混合模型通用背景模型在提高

5、辨认的运算效率１２．５倍的同时识别率仅下降（Ｇａｕｓｓｉａｎｍｉｘｔｕｒｅｍｏｄｅｌ－ｕｎｉｖｅｒｓａｌｂａｃｋｇｒｏｕｎｄｍｏｄ－０．３％。［２］关键词：双层结构；快速说话人辨认；参考说话人模型ｅｌ，ＧＭＭ－ＵＢＭ），Ｇａｕｓｓ混合模型支持向量机（Ｇａｕｓｓｉａｎｍｉｘｔｕｒｅｍｏｄｅｌ－ｓｕｐｐｏｒｔｖｅｃｔｏｒｍｏｄｅｌ，中图分类号：ＴＰ３９１文献标志码：Ａ［３］ＧＭＭ－ＳＶＭ），或者以ＧＭＭ－ＵＢＭ为基础进行文章编号：１０００－００５４（２０１１）０９－１２６１－０６的一定地改进，如联合因子分析（ｊｏｉｎｔｆａｃｔｏｒａｎａｌｙ－［４］ｓｉｓ，ＪＦＡ）等。当前的说话人

6、辨认系统在一定Ｓｐｅａｋｅｒｉｄｅｎｔｉｆｉｃａｔｉｏｎｕｓｉｎｇａｒｅｆｅｒｅｎｃｅ条件下已经能达到很高的准确率［１－２］，但是随着目ｓｐｅａｋｅｒｍｏｄｅｌｂａｓｅｄａｔｗｏ－ｌａｙｅｒｓｔｒｕｃｔｕｒｅ标说话人数量的增多［５］（几千甚至上万或更大），ＷＡＮＧＧａｎｇ，ＷＵＸｉａｏｊｕｎ，ＺＨＥＮＧＴｈｏｍａｓＦａｎｇ，目前的说话人辨认系统的时间性能往往较难满足ＷＡＮＧＬｉｎｌｉｎ，ＺＨＡＮＧＣｈｅｎｈａｏ要求，尤其是对于那些实时性要求较高的系统。（１．ＣｅｎｔｅｒｆｏｒＳｐｅｅｃｈａｎｄＬａｎｇｕａｇｅＴｅｃｈｎｏｌｏｇｉｅｓ，Ｄｉｖｉｓｉｏｎｏｆ例如在安全监听当中，需

7、要快速辨认监听语音是ＴｅｃｈｎｉｃａｌＩｎｎｏｖａｔｉｏｎａｎｄＤｅｖｅｌｏｐｍｅｎｔ，否属于目标说话人集合中的某一个，不仅要求系ＴｓｉｎｇｈｕａＮａｔｉｏｎａｌＬａｂｏｒａｔｏｒｙｆｏｒＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，Ｂｅｉｊｉｎｇ１０００８４，Ｃｈｉｎａ；统有较好的辨认准确率，还要求有很高的辨认２．ＤｅｐａｒｔｍｅｎｔｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，速度。ＴｓｉｎｇｈｕａＵｎｉｖｅｒｓｉｔｙ，Ｂｅｉｊｉｎｇ１０００８４，Ｃｈｉｎａ）［３］

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 7



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于参考说话人模型和双层结构的说话人辨认

基于参考说话人模型和双层结构的说话人辨认

相关文章

相关标签