欢迎来到天天文库
浏览记录
ID:36502707
大小:371.26 KB
页数:7页
时间:2019-05-11
《基于参考说话人模型和双层结构的说话人辨认》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Seediscussions,stats,andauthorprofilesforthispublicationat:https://www.researchgate.net/publication/267470442Speakeridentificationusingareferencespeakermodelbasedatwo-layerstructureArticleinQinghuaDaxueXuebao/JournalofTsinghuaUniversity·September2011CITATIONSREADS0155authors,including:GangW
2、angFangZhengAIOFMTsinghuaUniversity92PUBLICATIONS652CITATIONS177PUBLICATIONS841CITATIONSSEEPROFILESEEPROFILEAllcontentfollowingthispagewasuploadedbyFangZhengon11November2014.Theuserhasrequestedenhancementofthedownloadedfile.ISSN1000-0054清华大学学报(自然科学版)2011年第51卷第9期22/33CN11-2223/NJTsinghuaUniv
3、(Sci&Tech),2011,Vol.51,No.91261-1266基于参考说话人模型和双层结构的说话人辨认王刚,邬晓钧,郑方,王琳琳,张陈昊(1.清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心,北京100084;2.清华大学计算机科学与技术系,北京100084)摘要:为了提高基于Gauss混合模型通用背景模型Keywords:two-layerstructure;fastspeakeridentification;(GMM-UBM)的说话人辨认系统的运算效率,提出一种基referencespeakermodel于参考说话人模型的双层结构用于目标说话人剪枝,
4、采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,说话人辨认是说话人识别的一种,把待辨认利用语音与参考说人模型的偏差来描述说话人的发音特性,的语音判定为是否属于N个目标说话人当中的某将辨认语音偏差向量和目标说话人偏差向量的相似性作为[1]一位,是一个多选一的问题。说话人辨认在近距离度量来进行目标说话人剪枝。实验结果表明:在基于十几年来一直都是研究热点,也在许多领域如司GMM-UBM的说话人辨认系统中,对包含5200个目标说话法和金融领域得到了实际应用。目前说话人辨认人和1000个集外说话人的测试集进行开集辨认的条件下,最流行的方法是Gauss混合模型通用背景模型在提高
5、辨认的运算效率12.5倍的同时识别率仅下降(Gaussianmixturemodel-universalbackgroundmod-0.3%。[2]关键词:双层结构;快速说话人辨认;参考说话人模型el,GMM-UBM),Gauss混合模型支持向量机(Gaussianmixturemodel-supportvectormodel,中图分类号:TP391文献标志码:A[3]GMM-SVM),或者以GMM-UBM为基础进行文章编号:1000-0054(2011)09-1261-06的一定地改进,如联合因子分析(jointfactoranaly-[4]sis,JFA)等。当前的说话人
6、辨认系统在一定Speakeridentificationusingareference条件下已经能达到很高的准确率[1-2],但是随着目speakermodelbasedatwo-layerstructure标说话人数量的增多[5](几千甚至上万或更大),WANGGang,WUXiaojun,ZHENGThomasFang,目前的说话人辨认系统的时间性能往往较难满足WANGLinlin,ZHANGChenhao要求,尤其是对于那些实时性要求较高的系统。(1.CenterforSpeechandLanguageTechnologies,Divisionof例如在安全监听当中,需
7、要快速辨认监听语音是TechnicalInnovationandDevelopment,否属于目标说话人集合中的某一个,不仅要求系TsinghuaNationalLaboratoryforInformationScienceandTechnology,Beijing100084,China;统有较好的辨认准确率,还要求有很高的辨认2.DepartmentofComputerScienceandTechnology,速度。TsinghuaUniversity,Beijing100084,China)[3]
此文档下载收益归作者所有