基于参考说话人模型和双层结构的说话人辨认

基于参考说话人模型和双层结构的说话人辨认

ID:36502707

大小:371.26 KB

页数:7页

时间:2019-05-11

基于参考说话人模型和双层结构的说话人辨认_第1页
基于参考说话人模型和双层结构的说话人辨认_第2页
基于参考说话人模型和双层结构的说话人辨认_第3页
基于参考说话人模型和双层结构的说话人辨认_第4页
基于参考说话人模型和双层结构的说话人辨认_第5页
资源描述:

《基于参考说话人模型和双层结构的说话人辨认》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Seediscussions,stats,andauthorprofilesforthispublicationat:https://www.researchgate.net/publication/267470442Speakeridentificationusingareferencespeakermodelbasedatwo-layerstructureArticleinQinghuaDaxueXuebao/JournalofTsinghuaUniversity·September2011CITATIONSREADS0155authors,including:GangW

2、angFangZhengAIOFMTsinghuaUniversity92PUBLICATIONS652CITATIONS177PUBLICATIONS841CITATIONSSEEPROFILESEEPROFILEAllcontentfollowingthispagewasuploadedbyFangZhengon11November2014.Theuserhasrequestedenhancementofthedownloadedfile.ISSN1000-0054清华大学学报(自然科学版)2011年第51卷第9期22/33CN11-2223/NJTsinghuaUniv

3、(Sci&Tech),2011,Vol.51,No.91261-1266基于参考说话人模型和双层结构的说话人辨认王刚,邬晓钧,郑方,王琳琳,张陈昊(1.清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心,北京100084;2.清华大学计算机科学与技术系,北京100084)摘要:为了提高基于Gauss混合模型通用背景模型Keywords:two-layerstructure;fastspeakeridentification;(GMM-UBM)的说话人辨认系统的运算效率,提出一种基referencespeakermodel于参考说话人模型的双层结构用于目标说话人剪枝,

4、采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,说话人辨认是说话人识别的一种,把待辨认利用语音与参考说人模型的偏差来描述说话人的发音特性,的语音判定为是否属于N个目标说话人当中的某将辨认语音偏差向量和目标说话人偏差向量的相似性作为[1]一位,是一个多选一的问题。说话人辨认在近距离度量来进行目标说话人剪枝。实验结果表明:在基于十几年来一直都是研究热点,也在许多领域如司GMM-UBM的说话人辨认系统中,对包含5200个目标说话法和金融领域得到了实际应用。目前说话人辨认人和1000个集外说话人的测试集进行开集辨认的条件下,最流行的方法是Gauss混合模型通用背景模型在提高

5、辨认的运算效率12.5倍的同时识别率仅下降(Gaussianmixturemodel-universalbackgroundmod-0.3%。[2]关键词:双层结构;快速说话人辨认;参考说话人模型el,GMM-UBM),Gauss混合模型支持向量机(Gaussianmixturemodel-supportvectormodel,中图分类号:TP391文献标志码:A[3]GMM-SVM),或者以GMM-UBM为基础进行文章编号:1000-0054(2011)09-1261-06的一定地改进,如联合因子分析(jointfactoranaly-[4]sis,JFA)等。当前的说话人

6、辨认系统在一定Speakeridentificationusingareference条件下已经能达到很高的准确率[1-2],但是随着目speakermodelbasedatwo-layerstructure标说话人数量的增多[5](几千甚至上万或更大),WANGGang,WUXiaojun,ZHENGThomasFang,目前的说话人辨认系统的时间性能往往较难满足WANGLinlin,ZHANGChenhao要求,尤其是对于那些实时性要求较高的系统。(1.CenterforSpeechandLanguageTechnologies,Divisionof例如在安全监听当中,需

7、要快速辨认监听语音是TechnicalInnovationandDevelopment,否属于目标说话人集合中的某一个,不仅要求系TsinghuaNationalLaboratoryforInformationScienceandTechnology,Beijing100084,China;统有较好的辨认准确率,还要求有很高的辨认2.DepartmentofComputerScienceandTechnology,速度。TsinghuaUniversity,Beijing100084,China)[3]

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。