基于gmm的算法在语音检出系统中的应用研究

基于gmm的算法在语音检出系统中的应用研究

ID:23669339

大小:57.50 KB

页数:8页

时间:2018-11-09

基于gmm的算法在语音检出系统中的应用研究_第1页
基于gmm的算法在语音检出系统中的应用研究_第2页
基于gmm的算法在语音检出系统中的应用研究_第3页
基于gmm的算法在语音检出系统中的应用研究_第4页
基于gmm的算法在语音检出系统中的应用研究_第5页
资源描述:

《基于gmm的算法在语音检出系统中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于GMM的算法在语音检出系统中的应用研究乔立升,赵永忠,吴韬,沈军(中国人民解放军78020部队,云南昆明650221)摘要:高斯混合模型(GMM)由于通过改变高斯的混合度,能够逼近任意概率分布,所以在语音识别领域应用广泛。对高斯混合模型的训练,常见的训练方法是最大似然估计(MLE),这种训练方法能最大程度拟合所有样本的分布,但没有考虑模型之间的相互影响,导致识别过程会出现混淆情况;区分性模型训练算法,适合应用于大数据量复杂组合类别的区分问题。这里提出采用的区分性模型训练方法,其原则是最小化分类错误风险,通过更精确细致

2、地刻画不同模型之间的分类面,提升识别的效果。实验结果表明,该训练方法比最大似然估计的训练方法在多类别语音检出任务中具有更好的识别效果。.jyqkumLikelihoodEstimation,MLE),该方法基于MLE规则,最大程度拟合所有样本的分布,模型参数不断更新,直到观察序列的概率提高到某些极限点。实际上,由于其没有考虑声学模型之间的相互影响,在训练语料量比较大时,识别过程中会出现混淆情况。区分性的模型训练算法,适合应用于大数据量复杂类别组合的区分问题[6]。本文提出采用的区分性模型训练方法,其原则是最小化分类错误风

3、险,将有限的模型描述能力更多用于容易错的边界样本的区分,参数估计时不仅使得属于该类别的训练数据概率最大,同时还要使得不属于该类别的训练数据概率最小,通过更精确细致地刻画不同模型之间的分类面,达到提升识别效果的目的。实验结果表明,基于该算法的训练方法比最大似然估计的训练方法在多类别语音检出任务中具有更好的识别效果。1高斯混合模型描述GMM用于语音检出[7],它直接对语音中各类数据特征的统计分布进行拟合。GMM可以看作是单状态的HMM,GMM模型并不关注语音的时序过程,它只描述语音特征参数的静态分布,不同类别语音特征的静态分

4、布不同,因此通过比较不同类数据的GMM模型,就可以区分不同的语音类别。在实际应用中,GMM高斯混合度要求比较高,一般要32个高斯函数或以上,甚至达到2048个高斯函数。一个高斯混合模型的概率密度函数由多个高斯概率密度函数加权求和得到,如式(1)所示:式中:μi为均值矢量;Σi为协方差矩阵。至此,整个高斯混合模型λ可由{ωi,μi,Σi}来描述。其中GMM的协方差矩阵Σi可以有多种形式,可以是每个高斯概率密度函数都有一个经过训练得到的协方差矩阵,也可以是某一类别语音的GMM模型的所有高斯概率密度函数共用同一个协方差矩阵,还

5、可以是所有语音类别的GMM模型都共用同一个协方差矩阵。同时,协方差矩阵既可以是满阵也可以是对角阵,但考虑到在模型的训练过程中需要用到协方差矩阵的逆,而矩阵求逆往往是一个非常耗时的过程,所以协方差矩阵一般采用对角阵的形式。采用GMM作为语音声学模型的原因如下:(1)一个语音类别的声学特征参数在特征空间的分布由该类别语音不同音的特征矢量的分布组成。对于语音检出,可以认为GMM的各个高斯成分模拟了同一类别语音不同的未知音素的声学特征,每个高斯成分描述了不同的音素分布。(2)统计理论表明,用多个高斯概率密度函数的线性组合可以逼近

6、任意分布,因此,GMM可以对任意的语音特征分布进行精确的描述。实际上,将GMM模型应用于语音检出任务,用每个类别语音数据单独训练一个GMM模型,在测试时测试语音对所有的GMM模型求对数似然度函数,得分高的模型就判断为目标类别。同时,由于每个类别的数据可以积累较多,数据量可以得到保证,高斯数目一般较大,如128,由于这种特性,在语音检出任务中这种方法的识别率一般较高。当然,在基于概率统计模型的识别算法中,不仅模型结构的选择是否合适影响着最终的识别效果,模型参数的训练估计是否准确同样重要。模型训练是指对模型参数进行估计,对于

7、高斯混合模型而言,即是对λ进行估计。2最大似然估计训练方法对于高斯混合模型的训练,目前最常见的训练方法是采用MLE[7]。若给定训练样本为X={x1,x2,?,xN},则基于MLE的目标函数为:在参数估计之前,用K均值算法初始化模型,模型参数通过反复替换λ?=λ而提高。同时,为避免混乱,通过EM算法把整个训练过程看作MLE方法,把单个重估过程看作MLE重估,进一步用MLE公式重估,直到满足聚类规则的门限时终止,门限通常设置为观察序列概率的对数的平均。通过最大似然估计训练得到的模型参数,能够保证训练数据在该模型上出现的概率

8、最大,很好地表征了训练样本数据。但是MLE作为爬山算法,随意选择初始模型λ,即可导致局部最优,存在目标函数不能直接最大化的问题。然而在语音检出中,识别分类问题至少牵涉到两个类别,因此,采用最大似然准则训练得到的模型,对于识别分类问题并不一定是最好的。3区分性模型训练方法最小化分类错误(MCE)风险原则的区分性模型训练

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。