说话人模型聚类算法研究与分析

说话人模型聚类算法研究与分析

ID:46733699

大小:1.44 MB

页数:3页

时间:2019-11-27

说话人模型聚类算法研究与分析_第1页
说话人模型聚类算法研究与分析_第2页
说话人模型聚类算法研究与分析_第3页
资源描述:

《说话人模型聚类算法研究与分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、综述说话人模型聚类算法研究与分析Theresearchandanalysisofspeakerclusteringalgorithm谭萍邢玉娟高翔(兰州文理学院数字媒体学院,甘肃兰州730000)摘要:针对说话人确认识别率不高及实时性差的问题,在深入研究传统高斯混合模型以及K均值聚类算法的基础上提出两种基于说话人高斯混合模型的说话人聚类算法:KL散度聚类算法和巴氏距离聚类算法。根据不同的聚类算法,得到各个类的聚类中心模型,将其作为SVM的输入得出最终识别结果。仿真实验将两种聚类算法进行详细的分析

2、比较,实验结果显示巴氏距离聚类算法具有较好的识别性能和抗噪性。关键词:说话人确认;高斯混合模型;KL散度;巴氏距离;支持向量机Abstract:Inordertoimprovespeakerrecognitionrateandreal-time,twospeakerclusteringalgorithmsbasedonGMMspeakermodelareproposedinthispaper.TheyareKLdivergenceclusteringalgorithmandBhattachary

3、yadistanceclusteringalgorithmdependingonK-meansclusteringalgorithm.Accordingtodifferentclusteringalgorithm,theclustercentermodelsforeachclassareobtainedasSVMinputtogetthefinalrecognitionresult.Weanalyzethesetwokindsofclusteringalgorithmfordetailedins

4、imulationexperiment.AndtheresultsshowthatBhattacharyyadistanceclusteringalgorithmhasbetterperformanceandnoiseimmunitycomparedtoKLdivergenceclusteringalgorithm.Keywords:speakerverification;gaussianmixturemodel;kullback-leiblerdistance;bhattacharyyadis

5、tance;supportvectormachine中图分类号:TP391文献标识码:B文章编号:1003-8965(2015)05-0087-021引言MPX(

6、,)λθ=∑agxii()i=1(1)说话人识别是生物身份认证技术中的重要分支,主其中PX(

7、,)λθ表示语音序列:Xxx={12,,xN}在要通过提取说话人语音中的个性特征参数,实现说话人身给定模型λ下的似然概率。λ表示某个说话人的模型。份的自动识别。支持向量机(SupportVectorMachine,gxii()(=1,2,

8、,M)是每个成员的高斯概率密度函数:[1]SVM)是一种基于统计学习理论的机器学习方法,由于11T−1gx()=×−−∑−exp((xµµ)(x))iD/21/2iii其出色的分类性能,近几年成为话者识别领域研究的热点。(2)π

9、∑

10、2(2)iM高斯混合模型(Gaussianmixturemodel,GMM)可以有其中a是混合权值且∑ai=1,µi是均值向量,∑为ii=1i效的描述说话人语音特征分布。将SVM和GMM相结合协方差矩阵。参数θµ={,aiMiii,Σ=}(1,2,,)可通过期[3

11、][2],在说话人确认领域获得了成功的应用。然而,在说话望最大化方法EM算法进行估算。人识别系统中随着注册人数的增加,语音数据规模急剧变大,GMM的计算复杂度增大,从而导致SVM训练速度3说话人模型聚类变慢,进而影响系统的性能。针对上述问题,本文提出两种新的基于GMM的聚类算法。该算法借助GMM模型对随着说话人识别系统注册人数的增加,采集的语音话者语音数据建模,分别依据话者GMM模型间的KL散数据的规模会急剧增大,从而导致GMM计算复杂度变高,度和巴氏距离对模型进行聚类,减少SVM训练样本数量,

12、进而影响到系统的识别性能。因此,本文提出两种说话人从而达到提高系统识别性能和鲁棒性的目的。模型聚类算法,以期在保证识别率的情况下支持向量机训练阶段的计算复杂度。2说话人GMM模型假设聚类数目为K,聚类中心模型为:1sn()c()ccc()()()cj()p={ω,miM,Σ=1,,},其中ωωi=∑,iiisnj=11sn1sn()cj()()cj()GMM模型是一种统计模型,它利用若干个高斯概率Σ=i∑Σ,mmi=∑,分别是聚类中心模型的权值snj=1snj=1密度函数的加权和来近似地描述说

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。