资源描述:
《隐马尔科夫模型ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、隐马尔科夫模型(HMM)内容提要1.HMM的概述与应用2.HMM的定义及三个基本问题3.三个基本问题的求解算法HMM的概述与应用HMM模型是一项发展多年的建模技术,它曾经在语音识别、光字符识别(OCR)等领域得到过最成功的应用。上世纪八九十年代,HMM开始应用于生物信息学,对于研究蛋白质家族同源性,揭示进化保守性发挥了重要作用。在生物信息学中的主要应用DNA系列的对比基因发现例子:赌场的欺诈某赌场在掷骰子根据点数决定胜负时,暗中采取了如下作弊手段在连续多次掷骰子的过程中,通常使用公平骰子AB0.90.1A,偶而混入一个灌铅骰子B0.80.2骰子A骰子B1点1/602点1/61/83点1/6
2、1/84点1/63/165点1/63/166点1/63/8公平骰子A与灌铅骰子B的区别时间1234567骰子AAABAAA掷出点数3345162一次连续掷骰子的过程模拟隐序列明序列查封赌场后,调查人员发现了一些连续掷骰子的记录,其中有一个骰子掷出的点数记录如下:33451625536634411346254453342233…问题1–评估问题给定一个骰子掷出的点数记录124552646214614613613666166466163661636616361651561511514612356234问题会出现这个点数记录的概率有多大?问题2–解码问题给定一个骰子掷出的点数记录12455264
3、6214614613613666166466163661636616361651561511514612356234问题点数序列中的哪些点数是用骰子B掷出的?问题3–学习问题给定一个骰子掷出的点数记录124552646214614613613666166466163661636616361651561511514612356234问题作弊骰子掷出各点数的概率是怎样的?公平骰子掷出各点数的概率又是怎样的?赌场是何时换用骰子的?骰子BHMM的定义赌场的例子中隐状态集:S={骰子A,骰子B}明字符集:V={1,2,3,4,5,6}b21=0,b22=b23=1/8,b24=b25=3/16,b2
4、6=3/81/61/61/61/61/61/601/81/83/163/163/8初始状态概率:π1=1,π2=0隐状态转移概率:a11=0.9,a12=0.1a21=0.8,a22=0.2初始状态明字符生成概率b11=b12=…=b16=1/61.001:2:3:4:5:骰子A6:0.11:2:3:4:5:6:0.80.90.2一阶离散HMM是一个关于时间序列的随机生成模型基本要素有限隐状态集离散明字符集S={S1,…,SN}V={V1,…,VM}初始状态概率矢量状态转移概率矩阵明字符生成概率矩阵π=(π1,…,πN)A=(aij)N×NB=(bjk)N×MHMM记作λ=(S,V,π,A
5、,B)或λ=(π,A,B)aij,bjk及πi均为概率,需满足概率的性质(非负性,正则性等)HMM将两个序列相联系起来1.由离散隐状态组成的状态序列(路径)Q=(q1,…,qT),每个qt∈S是一个状态由初始状态概率及状态转移概率(π,A)所决定2.由明字符组成的观察序列O=(o1,…,oT),每个ot∈V均为一个离散明字符由状态序列及各状态的明字符生成概率(Q,B)所决定赌场的例子中:隐状态明观察AAAABAAAAABAAAAAAAAAAAAAAAAAAAAAAABAABAAAAAAAAA…33454141553663441134625445334223332124225631341…q
6、1q2q3q4qT...o1o2o3o4oT...观察序列O状态序列QHMMλHMM中的两条基本假设1.状态独立性:状态序列具有马氏性P(qt
7、q1,…,qt-1)=P(qt
8、qt-1)第t次所用的骰子类型只依赖于第t-1次的骰子类型2.观察独立性:观察到的明字符仅与当前时间的状态有关P(ot
9、o1,…,ot-1,q1,…,qt)=P(ot
10、qt)第t次掷出的点数只依赖于第t次所用的骰子类型三个基本问题识别问题/评估问题•给定观察序列O和HMM=(π,A,B),判断O是由产生出来的可能性有多大.•计算骰子点数序列的确由“作弊”模型生成的可能性解码问题•给定观察序列O和HMMλ=(π,A
11、,B),计算与序列O相对应的状态序列是什么•在骰子点数序列中,判断哪些点数是用骰子B掷出的学习问题•给定一系列观察序列样本,确定能够产生出这些序列的模型λ=(π,A,B)•如何从大量的点数序列样本中学习得出“作弊模型”的参数三个基本问题的求解算法识别问题/评估问题识别问题:给定观察序列O和多个HMM(λ1,…,λK),判断O是由哪个HMM产生出来的。评估问题:给定观察序列O和HMMλ=(π,A,B),计算观察序列O出现的