科大讯飞语种识别系统介绍

科大讯飞语种识别系统介绍

ID:43205982

大小:754.50 KB

页数:14页

时间:2019-10-02

科大讯飞语种识别系统介绍_第1页
科大讯飞语种识别系统介绍_第2页
科大讯飞语种识别系统介绍_第3页
科大讯飞语种识别系统介绍_第4页
科大讯飞语种识别系统介绍_第5页
资源描述:

《科大讯飞语种识别系统介绍》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、语种识别系统介绍提纲语种识别系统框架Acoustic-GMM系统介绍Acoustic-GSV系统介绍语种识别系统框架现有语种识别系统的主流方法包括基于Acoustic的方案和基于PhoneRecognize的方案,这两种系统由于建模方法等的差异,具有较好的互补性图1:语种识别系统框架Acoustic系统介绍图2:Acoustic系统框架Acoustic系统基于Acoustic的语种识别由于其稳定性和鲁棒性,在语种识别中获得的广泛的应用,是历届NISTLRE比赛中不可缺少的基本系统之一。Acoustic系

2、统又包括GMM-MMI系统和GMM-SVM两种建模方式:Acoustic系统--GMM-MMI系统框架图3GMM-MMI系统流程图GMM-MMI系统可以分成三大块:特征提取模块、模型训练模块以及测试模块,下面分别介绍三个部分特征提取模块(1)1)MFCC:语种识别系统中,仅使用MFCC(Mel-FrequencyCepstralCoefficient)的C0~C6前7阶参数,后面在此基础上,进行SDC扩展。2)VTLN声道长度规整(VocalTractLengthNormalization,VTLN),

3、将每个人的声道规整到统一的长度上,用来减弱不同发音人带来的影响。3)RASTARelAtiveSpecTrAl这个词组的简称,是HynekHermansky等人根据人类语音听觉感知对于激励源缓变不敏感的这种特性,提出的一种对于语音参数的时间轨迹进行滤波,以便从语音的参数表示中减小非语音部分的频谱部分的方法,是一种经验性的滤波器:图4特征提取顺序特征提取模块(2)4)SDC:ShiftedDeltaCepstra也称为移位差分倒谱特征特征提取模块(3)(5)VoiceActivityDetection--

4、VAD对识别性能影响很大,在语种识别系统中主要采用基于能量四门限的VAD技术(6)倒谱均值相减(CepstralMeanSubtraction,CMS)基于不变信道的假设一种外部信道估计。信道的噪声可以看成是信道固定的系统畸变和随机信道传输噪声(认为是白噪声)的和。倒谱参数上减去均值,相应的也就去除了调制噪声。(7)特征高斯化语种识别所用参数,本身都是随机矢量,因而具有相应的概率分布,训练和识别信道的不匹配也就体现在概率分布的差别上。受实际环境的影响,特征参数的概率分布往往发生改变。对特征参数进行规整,

5、使得训练和识别时候的特征参数的概率分布比较接近,这样两者之间不匹配的问题就应该能得到改善。(8)特征端FA特征域方法的因子分析可以当成一种鲁棒性前端的算法,就是对特征直接去掉噪声的部分,得到相对“干净”的数据,主要在于去噪。GMM-MMI系统模型训练UBM训练:K-Means聚类得到UBM模型的初始化模型EM算法迭代训练得到UBM模型各语种GMM训练各语种数据在UBM模型基础上MLE估计出各语种模型2.MMI区分性准则下训练增加各语种之间的区分度图5UBM-GMM训练步骤GMM-MMI高斯后端训练高斯后

6、端分类器包括LDA变换矩阵和各语种模型的单高斯的GMM模型。开发集的选择:一般要包括和测试集一样的语种类别,并且数据类型要和测试集尽量的相似,并且不能和训练集有任何的重合,否则会造成开发集得分和测试集得分mismatchLDA训练:各语种的测试得分向量通过LDA降维,提取更有区分性的分量,将原始的N维得分向量减为维数为N-1(N为语种总种类)。各语种单高斯模型的训练:在开发集上利用LDA得到的各语种的得分向量,训练各语种的单高斯模型(每个语种一个模型)。图6高斯后端训练步骤GMM-MMI系统测试流程图7

7、GMM-MMI测试流程Acoustic系统—GMM-SVM系统图8GSV系统框图GMM-SVM系统模型训练部分三个关键部分GMMSuperVector:每条语音,采用最大后验概率(Maximumaposteriori,MAP)准则,从UBM中自适应得到这条语音的GMM模型,然后将所有高斯的每一维均值向量按照顺序排列起来,构成一个超矢量作为SVM的输入,就称为GMMSuperVector2.SVM模型的均值核函数和均值方差核函数GMM只更新均值时GMM同时更新均值方差3.Model-Pushing技术谢谢

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。