欢迎来到天天文库
浏览记录
ID:38263714
大小:230.82 KB
页数:3页
时间:2019-05-25
《基于区分性GMM文本无关的话者识别的研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第1卷第2期INTELLIGEN智T能COM计PU算TE机RA与ND应AP用PLICATIONSV01.1No.22011年8月Aug.201l基于区分性GMM文本无关的话者识别的研究付浩楠,吕成国(黑龙江大学计算机科学技术学院,哈尔滨150080)摘要:说话人识别的关键在于如何为集合中的每一个人建立一个能表征该说话人个性特征的声学模型,建模方法将会严重影响系统的性能。基于当今与文本无关的话者识别的主流模型——高斯混合模型(GaussianMixtureModel,GMM)的基础上,从声学的角度剖析了男女发音的差别,以增加说话人之间的差异性为出发点,引入竞争性思想和通用背景模型(
2、UniversalBackgroundModel,UBM),提出了具有区分性的GMM的建模方法,克服了传统GMM需要大量训练样本的局限性和UBM将说话人强制服从统一分布的弱点。最后实验的对比结果表明,具有区分性的GMM相比传统的高斯混合模型在识别率上有所提高。关键词:说话人识别;高斯混合模型;通用背景模型;EM算法;区分性;竞争思想中图分类号:TN912.3文献标识码:A文章编号:2095—2163(2011)02—0086—03ResearchofSpeakerRecognitionbasedonDipartiteGMMFUHaonan,LVChengguo(SchoolofC
3、omputerScienceandTechnology,HeilongjiangUniversity,Harbin150080,China)Abstract:CharacteristicmodelingplaysanimportantroleintechnologyofSpeakerRecognition.Themodelingmethodwillseriouslyimpactontheperformanceofspeakerrecognitionsystem.ThisarticleisbasedonthemainmodelofText—independentSpeakerRec
4、ognition,analysesgenderdiffer—encesinpronunciationandincreasesthediferencesbetweenthespeakersasastartingpoint,thenintroducestheideaofcompetitionandUBMintoGaussianMixtureModel(GMM)atthetimeofcharacteristicmodeling.Therefore,anewapproachofcharacteristicmodelingisdipartitewhichispre—sented.Theme
5、thodovercomesthelimitationthatthereareplentifultrainingsamplesfortraditionalGMMandtheshortcomingthatthedistributionsofallspeakersareunifiedforUBM.Finally.itmaybuilddipartitemodelsforeveryspeaker.TheexperimentshowsthatthemodelbasedondipartitealgorithmhashigherperformancethantraditionalGMMalgor
6、ithm.Keywords:SpeakerRecognition;GaussianMixtureModel(GMM);UniversalBackgroundModel;EMalgorithm;Dipartite;Competition0引言GMM的概率密度函数表示如下:MM语音信号作为人类身份生物认证的主要特征逐渐引起、.1、.1P(l)=2P(,iI)=2Or.P(li,)(1)厂国内外广大学者的研究热潮,成为了“密码时代”的终结i=】i=I者。基于高斯混合模型(GaussianMixtureModel,GMM)的话式中,为GMM的混合度,={,,∑f】为模型的参者识别以其简单
7、、灵活和很好的鲁棒性已经成为当今与文数集合;为D维的特征矢量;i为隐状态编号,d代表第个本无关的说话人识别的主流技术,将说话人识别带到了一高斯分量的混合权值,其值对应为第i个高斯分量的先验概个新阶段。基于概率统计的GMM需要大量的训练样本来反率。因此有=1,整个GMM模型的结构如图1所示。映说话人在特征空间的统计分布_1。这种方法的本质是将人类的语音信号在特征空问的分布由若干个高斯概率密度函数线性加权组合来逼近。本文提出的具有区分性的GMM的建模方法是建立在传统的高斯混合模型[2
此文档下载收益归作者所有