资源描述:
《隐马尔可夫模型及其应用简介》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第19讲基于隐马尔可夫模型的模式识别要点:HiddenMarkovModels(HMM)隐马尔可夫模型的结构示意图隐马尔可夫模型的基本定义隐马尔可夫模型的参数描述隐马尔可夫模型的基本问题隐马尔可夫模型的应用领域隐马尔可夫模型的经典文献隐马尔可夫模型的结构示意图隐马尔可夫模型可以看作一个随机二元组(O,q),其中O称为观察序列,q称为状态序列,可以分别表示为:O=(o1,o2,…,oT),q=(q1,q2,…,qT)O和q之间的关系可以用状态转移观察生成图来描述:返回q1q2qto1o2ot隐马尔可夫模型的基本定义定义1:(O,q)是一个隐马尔可夫模型当且仅当定义2:(O,q)
2、是一个隐马尔可夫模型当且仅当返回隐马尔可夫模型的参数描述如果在任意时刻t的状态qt只能从集合{1,2,…,N},观察ot只能从集合{v1,...,vM}取值,那么为了完整描述一个隐马尔可夫模型需要确定下面的所有参数:返回(1)转移概率:A={aij},aij=P(qt+1=j
3、qt=i);(2)输出概率:B={bik},bi(vk)=bik=P(ot=vk
4、qt=i);(3)初始状态分布:π={πi},πi=P(q1=i)。λ={A,B,π}称为隐马尔可夫模型的参数描述。转移概率举例返回输出概率举例返回初始状态分布举例初始状态分布相当于状态的先验分布:举例如下:π={πi}={1/3,
5、1/3,1/3}π={πi}={0.2,0.6,0.2}π={πi}={0.5,0.3,0.2}返回隐马尔可夫模型的基本问题(1)评估问题:对于给定模型λ,求某个观察序列O的概率P(O
6、λ);(2)解码问题:对于给定模型λ和观察序列O,求最可能的状态序列q;(3)学习问题:对于给定观察值序列O,调整参数λ,使得概率P(O
7、λ)最大。硬币投掷模型返回评估问题的解决有两种基本的解决方案:(1)利用前向变量计算:(2)利用后向变量计算:返回利用前向变量解决评估问题(1)初始化:(2)递归计算:(3)计算结果:采用动态规划算法(示意图),复杂度O(N2T)返回前向递归计算示意图返回利用后向变量
8、解决评估问题(1)初始化:(2)递归计算:(3)计算结果:采用动态规划算法(示意图),复杂度O(N2T)返回后向递归计算示意图返回解码问题的解决有两种基本的最优标准:(1)单个状态最优:(2)整个状态序列最优:返回单个最优状态求解定义后验概率变量:单个最优状态为:返回整个最优状态序列求解定义路径变量:韦特比(Viterbi)算法:(1)初始化:(2)递归计算:(3)终止:(4)路径反推:返回学习问题的解决定义双状态变量:学习(重估)公式(前向-后向算法)描述如下:返回双状态变量计算示意图返回硬币投掷模型如果按照一定的概率分布随机投掷三枚硬币,假如每次投掷后你只被告知硬币的正反,但不被告
9、知所投掷的硬币,那么硬币投掷对你来说就构成一个隐马尔可夫模型,描述如下:(1)三个状态:S1,S2,S3(每个硬币构成一个状态)(2)两个观察值:H(Head,正面),T(Tail,反面)(3)参数举例:πi=1/3,aij=1/3计算举例返回硬币投掷模型计算举例设观察序列为O=(HHHHTHTTTT)P(O
10、λ)=(1/3)10(0.5+0.75+0.25)5(0.5+0.25+0.75)5=(0.5)10整体最优状态序列计算如下(忽略状态转移的影响):(1)初始化:(2)递归计算过程(3)最优状态反推过程想一想,单个最优状态是什么?返回递归计算过程示意图递推公式:返回最优状态反推过
11、程示意图反推公式:返回隐马尔可夫模型的应用领域词性标注(POSTagging)语音识别音字转换组块分析基因和蛋白质序列分析一般化:任何与线性序列相关的现象返回隐马尔可夫模型在词性标注中的应用问题:已知单词序列w1w2…wn,求词性序列c1c2…cnHMM模型:将词性为理解为状态将单词为理解为输出值训练:统计词性转移矩阵[aij]和词性到单词的输出矩阵[bik]求解:Viterbi算法返回隐马尔可夫模型的经典文献Rabiner,L.R.,ATutorialonHiddenMarkovModelsandSelectedApplicationsinSpeechRecognition,Proc
12、eedingsoftheIEEE,vol.77,no.2,Feb.1989,pgs257-285.Rabiner,L.R.,B.H.Juang.1993.FundamentalsofSpeechRecognition.Prentice-Hall.HTK:HMMToolkitHiddenMarkovModel(HMM)WhitePaper(GeneMatcher)返回