基于最大似然线性回归矩阵的说话人识别算法研究

ID：38190424

大小：2.60 MB

页数：5页

时间：2019-05-25

资源描述：

《基于最大似然线性回归矩阵的说话人识别算法研究》由会员上传分享，免费在线阅读，更多相关内容在行业资料-天天文库。

1、第XX卷第X期自动化学报Vol.XX,No.X200X年X月ACTAAUTOMATICASINICAMonth,200X基于最大似然线性回归矩阵的说话人识别算法研究钟山1何亮1邓妍1刘加1摘要本文研究将自适应领域的最大似然线性回归（Maximumlikelihoodlinearregression，MLLR）变换矩阵作为特征进行文本无关的说话人识别算法.本文引入了基于统一背景模型的MLLRSV-SVM说话人识别算法，并在此基础上进行高层音素聚类以进一步提高识别性能.在采用多种信道补偿技术后，在NISTSRE2006年1训练语段-1测试

2、语段同信道和跨信道数据库上，基于MLLR特征的系统和其它最好的系统性能接近并有很强互补性，经过简单线性融合就能极大提高识别性能.关键词说话人识别，最大线性似然回归，支持向量机，信道补偿中图分类号TP24ResearchonMLLRbasedspeakerrecognitionalgorithm1111ZHONGShanHELiangDENGYanLIUJiaAbstractThispaperresearchesonusingmaximumlikelihoodlinearregression(MLLR)asfeaturefortext-

3、independentspeakerrecognitionalgorithm.Weintroduceauniversalbackgroundmodel(UBM)basedMLLRSV-SVMalgorithm¯rst,andthenextendsthealgorithmtomulti-classforfurtherimprovement.Afterchannelcompensation,intheNIST2006SRE1conv4w-1conv4w/miccorpus,MLLRbasedsystemiscomparableandcom

4、plementarywithstateoftheartsystems.Theperformanceisgreatlyimprovedbysimplylinearfusion.KeywordsSpeakerrecognition,MLLR,SVM,Channelcompensation虽然最近几年说话人识别技术的发展突飞猛试条件，系统的鲁棒性不够.最后，由于目标说进，新的识别系统不断涌现，但是仍然没有哪套话人的数据不够，一般由UBM映射（通常为最大系统能够有压倒性优势，在近几次由美国国家技后验概率自适应，Maximumaposterio

5、r，MAP）术和标准署（NationalInstituteofStandardsand到说话人的GMM上，而SVM系统只是把MAP后Technology,NIST）举办的说话人评测中，各参评的GMM作为分类器的输入特征.MAP过程中考单位都不约而同采用了多系统融合的解决方案，只虑到了与UBM模型的耦合性，而这种耦合性事实上有博采众长，才能得到最佳性能.高斯混合模型-也降低了每个说话人模型的区分性.通用背景模型（Gaussianmixturemodel-universal为了弥补这两种主流算法在以上三方面的不backgroundmode

6、l,GMM-UBM）[1]和以高斯超矢足，研究人员提出了很多改进方法.比如，引入量（Gaussiansupervector,GSV）为特征输入的支高层音素信息的PhonticGMM（PGMM）[3]，分持矢量机（Supportvectormachine,SVM）[2]是别针对GMM和SVM进行信道补偿的隐藏因子分当前主流的文本无关说话人识别系统，在历年评析（Latentfactoranalysis,LFA）[4]和无用分量投测中都表现了相当的优越性.但是这两种基于影（Nuisanceattributeprojection,NAP）[5

7、]，以及短时倒谱特征建模的主流算法仍然存在三点不对UBM更新量建模以消除特定说话人模型间的耦足.首先，它忽略了同样包含特定说话人信息的合性[6].长时特征和高层信息.其次，由于不能明确分割说本文从另外一个角度来解决以上问题，研究话人、信道以及通话的不同，因此针对不同的测将MLLR变换矩阵形成超矢量作为特征的说话人识别算法.在说话人识别系统中引入MLLR变收稿日期2008-05-23收修改稿日期2008-09-22换矩阵作为特征，最早是由SRI的AndreasStol-ReceivedMay23,2008;inrevisedformSe

8、ptember22,2008[7]cke在2005年提出来的.因为原本用于说话国家自然科学基金委员会与微软亚洲研究院联合资助项目(60776800)，国家863资助项目(2006AA010101，2007AA04Z223

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 5



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于最大似然线性回归矩阵的说话人识别算法研究

基于最大似然线性回归矩阵的说话人识别算法研究

相关文章

相关标签