GMM-HMM语音识别原理详解.doc

ID：27483386

大小：24.50 KB

页数：4页

时间：2018-12-04

资源描述：

《GMM-HMM语音识别原理详解.doc》由会员上传分享，免费在线阅读，更多相关内容在应用文档-天天文库。

1、GMM-HMM语音识别原理详解　　本文简明讲述GMM-HMM在语音识别上的原理，建模和测试过程。　　1.什么是HiddenMarkovModel？　　HMM要解决的三个问题：　　1）Likelihood　　2）Decoding　　3）Training　　2.GMM是什么？怎样用GMM求某一音素（phoneme）的概率？　　3.GMM+HMM大法解决语音识别　　3.1识别　　3.2训练　　3.2.1TrainingtheparamsofGMM　　3.2.2TrainingtheparamsofHMM　　==============================================

2、======================　　　　1.什么是HiddenMarkovModel？　　　　ANS：一个有隐节点（unobservable）和可见节点（visible）的马尔科夫过程（见详解）。　　隐节点表示状态，可见节点表示我们听到的语音或者看到的时序信号。　　最开始时，我们指定这个HMM的结构，训练HMM模型时：给定n个时序信号y1...yT（训练样本），用MLE（typicallyimplementedinEM）估计参数：　　1.N个状态的初始概率　　2.状态转移概率a　　3.输出概率b　　--------------　　在语音处理中，一个word由若干phoneme（音

3、素）组成；　　每个HMM对应于一个word或者音素（phoneme）　　一个word表示成若干states，每个state表示为一个音素　　用HMM需要解决3个问题：　　1）Likelihood：一个HMM生成一串observaTIon序列x的概率　　　　其中，αt（sj）表示HMM在时刻t处于状态j，且observaTIon={x1，。。.，xt}的概率　　，　　aij是状态i到状态j的转移概率，　　bj（xt）表示在状态j的时候生成xt的概率，　　2）Decoding：给定一串observaTIon序列x，找出最可能从属的HMM状态序列　　在实际计算中会做剪枝，不是计算每个可能state

4、序列的probability，而是用ViterbiapproximaTIon：　　从时刻1：t，只记录转移概率最大的state和概率。　　记Vt（si）为从时刻t-1的所有状态转移到时刻t时状态为j的最大概率：　　　　记为：从时刻t-1的哪个状态转移到时刻t时状态为j的概率最大；　　进行Viterbiapproximation过程如下：　　　　然后根据记录的最可能转移状态序列进行回溯：　　　　3）Training：给定一个observation序列x，训练出HMM参数λ={aij，bij}theEM（Forward-Backward）algorithm　　这部分我们放到“3.GMM+HMM大

5、法解决语音识别”中和GMM的training一起讲　　---------------------------------------------------------------------

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 / 4



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

GMM-HMM语音识别原理详解.doc

GMM-HMM语音识别原理详解.doc

相关文章

相关标签