隐马尔科夫模型和词性标注备课讲稿.ppt

隐马尔科夫模型和词性标注备课讲稿.ppt

ID:59941121

大小:2.72 MB

页数:101页

时间:2020-11-28

隐马尔科夫模型和词性标注备课讲稿.ppt_第1页
隐马尔科夫模型和词性标注备课讲稿.ppt_第2页
隐马尔科夫模型和词性标注备课讲稿.ppt_第3页
隐马尔科夫模型和词性标注备课讲稿.ppt_第4页
隐马尔科夫模型和词性标注备课讲稿.ppt_第5页
资源描述:

《隐马尔科夫模型和词性标注备课讲稿.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、隐马尔科夫模型和词性标注隐马尔科夫模型概述马尔科夫链状态序列:X1,X2,X3,…常常是“时序”的从Xt-1到Xt的转换只依赖于Xt-1X2X3X4X1转移概率 TransitionProbabilities假设一个状态Xt有N个可能的值Xt=s1,Xt=s2,…..,Xt=sN.转移概率的数量为:N2P(Xt=si

2、Xt-1=sj),1≤i,j≤N转移概率可以表示为N×N的矩阵或者有向图MMBigramMM(一阶MM)MMTrigramMM(二阶MM)有限状态自动机状态:输入输出字母表中的符号弧:状态的转移仍然是VMM(Visible

3、MM)HMMHMM,从状态产生输出HMMHMM,不同状态可能产生相同输出HMMHMM,从弧产生输出HMMHMM,输出带有概率HMMHMM,两个状态间有多条弧,具有不同的概率隐马尔可夫模型 HiddenMarkovModel估算隐藏于表面事件背后的事件的概率观察到一个人每天带雨伞的情况,反过来推测天气情况HiddenMarkovModelHMM是一个五元组(S,S0,Y,Ps,PY).S:{s1…sT}是状态集,S0是初始状态Y:{y1…yV}是输出字母表PS(sj

4、si):转移(transition)概率的分布,也表示为aijPY(yk

5、

6、si,sj):发射(emission)概率的分布,也表示为bijk给定一个HMM和一个输出序列Y={y1,y2,…,yk)任务1:计算观察序列的概率任务2:计算能够解释观察序列的最大可能的状态序列任务3:根据观察序列寻找最佳参数模型任务1:计算观察序列的概率计算观察序列的概率前提:HMM模型的参数已经训练完毕想知道:根据该模型输出某一个观察序列的概率是多少应用:基于类的语言模型,将词进行归类,变计算词与词之间的转移概率为类与类之间的转移概率,由于类的数量比词少得多,因此一定程度避免了数据稀疏问题TrellisorLattice(栅格)

7、发射概率为1的情况Y=“toe”P(Y)=0.6×0.88×1+0.4×0.1×1=0.568算法描述从初始状态开始扩展在时间点t扩展得到的状态必须能够产生与观察序列在t时刻相同的输出比如在t=1时,观察序列输出‘t’,因此只有状态A和C得到了扩展在t+1时刻,只能对在t时刻保留下来的状态节点进行扩展比如在t=2时,只能对t=1时刻的A和C两个状态进行扩展每条路径上的概率做累乘,不同路径的概率做累加直到观察序列全部考察完毕,算法结束发射概率不为1的情况0.236608就是在上述模型下“toe”出现的概率Trigram的情况以Bigram

8、为状态基于类的Trigram模型N-gramclassLMp(wi

9、wi-2,wi-1)p(wi

10、ci)p(ci

11、ci-2,ci-1)C:Consonant(辅音),V:Vowel(元音)ClassTrigram的Trellis输出Y=“toy”重叠(overlapping) 的ClassTrigram“r”有时是元音,有时是辅音,因此p(r

12、C)和p(r

13、V)都不为零重叠的类Trigram的Trellis讨论我们既可以从左向右计算,也可以从右向左计算,甚至可以从中间向两头计算Trellis的计算对于Forward-Backward(

14、也称为Baum-Welch)参数估计很有用任务2:计算能够解释观察序列的最大可能的状态序列Viterbi算法用于搜索能够生成观察序列的最大概率的状态序列Sbest=argmaxSP(S

15、Y)=argmaxSP(S,Y)/P(Y)=argmaxS∏i=1…kp(yi

16、si,si-1)p(si

17、si-1)Viterbi能够找到最佳解,其思想精髓在于将全局最佳解的计算过程分解为阶段最佳解的计算示意从D2返回Stage1的最佳状态为C1因为p(A1-D2)=0.60.5=0.3而p(C1-D2)=0.40.8=0.32尽管搜索还没有完全结束

18、,但是D2已经找到了最佳返回节点Viterbi示例argmaxXYZP(XYZ

19、rry)Viterbi计算Viterbi算法三重循环第一重:遍历每一个观察值第二重:遍历当前观察值所对应的每一个状态第三重:遍历能够到达当前观察值当前状态的上一时刻的每一个状态计算假设上一时刻为t,t时刻的的状态为i,t+1时刻的状态为j,t+1时刻的观察值为k,则计算:j(t+1)=max1iNi(t)aijbijkj(t+1)=argmax1iNi(t)aijbijkt+1时刻状态j的返回指针指向t时刻的状态j(t+1)输出三重循环都结

20、束后,在最后时刻找到值最大的状态,并从该状态开始,根据返回指针查找各时刻的处于最佳路径上的状态,并反序输出。N-best计算保留n个最佳结果,而不是1个最优解:VCV;次优解:CCVN-BestPaths

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。