欢迎来到天天文库
浏览记录
ID:38564880
大小:852.50 KB
页数:35页
时间:2019-06-15
《HMM介绍及其在语音识别中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、及其在语音识别中的应用报告人:李敏HMM介绍内容提要语音识别简介隐马尔可夫模型相关理论隐马尔可夫模型基本算法HMM在语音识别中的应用语音识别声学信息论语音语言学信号处理人工智能模式识别数理统计听写机查询系统电话拨号残疾人用品消费电子……实际应用学科基础语音识别技术基础与应用语音识别系统的基本构成analysisPatterntrainingTemplatesormodelsPatternclassifierDecisionlogicspeechRecognizedspeechLPCCMFCCTestpatternReferencepatternSearchalgorith
2、m语者无关/相关词表大小孤立词vs.连续语音环境噪声等语音识别的几个关键因素常用语音识别方法1.模式匹配的方法:DTW2.统计模型方法:HMM3.人工神经网络的方法AndreiA.MarkovRussianstatistician1856–1922马尔可夫链理论s1s2s3N=3t=0q0=s3有N个状态,S1,S2…SN一阶离散马尔可夫模型下一个时刻所处的状态是随机出现的在每个时刻t,系统只能处于唯一一个状态qt存在一个离散的时间序列t=0,t=1……当前状态当前状态qt只与前面相邻的一个状态qt-1有关,与其他状态无关s1s2s3一阶离散马尔可夫模型11/21/21/
3、32/3s1s2s3一阶离散马尔可夫模型11/21/21/32/3aij---转移概率并且满足如下的标准随机约束条件:下雨多云晴天0.30.20.60.40.20.10.30.10.8下雨---状态1多云---状态2晴天---状态3一阶离散马尔可夫模型问题:连续8天的天气状况为“晴天-晴天-晴天-下雨-下雨-晴天-多云-晴天”的概率是多少?一阶离散马尔可夫模型晴天晴天晴天下雨下雨晴天多云晴天0.80.80.10.40.30.10.2晴天晴天一阶离散马尔可夫链晴天下雨下雨tt+1晴天-晴天-晴天-下雨-下雨-晴天-多云-晴天晴天多云晴天t-1马尔可夫链信号统计理论模型起源于
4、60年代后期Baum和他的同事首先提出Baker(CMU)和Jelinek(IBM)在70年代早期实现在语音处理上的应用隐马尔可夫链(HMM)理论123a12a21a22a11a23a32a13a31a33每个硬币代表一个状态;每个状态有两个观测值:正面H和反面T;每个状态产生H的概率为P(H);每个状态产生T的概率为1-P(H)隐马尔可夫链—三个硬币隐马尔可夫模型状态总数N;每个状态对应的观测事件数M;状态转移矩阵每个状态下取所有观测事件的概率分布起始状态为了完整地描述一个隐马尔可夫模型,应当指定状态数N,观测符号数M,以及三个概率密度A、B和。这些参数之间有一定的联
5、系,因此为了方便,HMM常用来简记。隐马尔可夫模型的参数问题一:给定模型参数和观测序列,如何快速求出在该模型下,观测事件序列发生的概率?——估计问题问题二:给定模型参数和观测序列,如何找出一个最佳状态序列?——解码问题问题三:给定观测序列,如何调整参数使条件概率最大?——学习问题隐马尔可夫模型的三个基本问题估计问题:前向算法和后向算法解码问题:Viterbi算法学习问题:Baum-Welch算法如何解决三个基本问题估计问题—前向算法定义前向变量:表示模型下,在时刻t,观测事件为Ot,状态为i的概率。s1s2sNsj时刻tt+1a1ja2jaNj估计问题—前向算法递归求解:
6、初始:递归:中止:StateT123123N2(1)2(2)2(3)2(N)3(1)3(2)3(3)3(N)1(1)1(2)1(N)1(3)T(N)T(3)T(2)T(1)估计问题—后向算法定义后向变量:表示从终止时刻T到时刻t+1的观测事件序列是,并且时刻t的状态是i的概率s1s2sNsi时刻tt+1ai1ai2aiN估计问题—后向算法递归求解:初始:递归:解码问题—Viterbi算法找一个状态序列,这个状态序列在t时状态为i,并且状态i与前面t-1个状态构成的状态序列的概率值最大s1s2sNsj时刻tt+1a1ja2jaNj三硬币隐马尔
7、可夫模型状态1状态2状态30.50.750.250.50.250.75P(H)P(T)观测序列O=(HHHHTHTT)设初始状态概率和状态转移概率都是1/3,忽略这些概率s1s2s3s1s2s3s1s2s3s1s2s3s1s2s3s1s2s3s1s2s3s1s2s30.50.75t0.250.75*0.50.7520.75*0.250.752*0.50.7530.752*0.250.753*0.50.7540.753*0.250.754*0.50.754*0.250.7550.755*0.50.7560.755*0.250.7
此文档下载收益归作者所有