HMM在自然语言处理领域中的应用研究

HMM在自然语言处理领域中的应用研究

ID:38131750

大小:395.80 KB

页数:5页

时间:2019-05-30

HMM在自然语言处理领域中的应用研究_第1页
HMM在自然语言处理领域中的应用研究_第2页
HMM在自然语言处理领域中的应用研究_第3页
HMM在自然语言处理领域中的应用研究_第4页
HMM在自然语言处理领域中的应用研究_第5页
资源描述:

《HMM在自然语言处理领域中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第期计算机技术与发展v01.20No.220lO年2月O3MPUTERTECHNOIA~YANDDEVELOPMENTFeb.2010HMM在自然语言处理领域中的应用研究韩普,姜杰(南京师范大学教育科学学院,江苏南京210097)摘要:隐马尔可夫模型(}MM)是一种强大的统计学机器学习技术,该模型已经成功地应用于连续语音识别、在线手写识别,在生物学信息中也得到了广泛的应用。由于该模型的强大的学习能力,在自然语言处理领域逐渐得到了应用。对隐马尔可夫模型在词性标注、命名实体识别、信息抽取应用中的关键问

2、题进行了分析。着重分析了在信息抽取时使用隐马尔可夫模型的重点和难点问题,期望让更多的研究人员进一步认识和了解HMM。最后分析了隐马尔可夫模型在应用中的不足之处和改进研究。关键词:隐马尔可夫模型;信息抽取;词性标注;命名实体中图分类号:TP391文献标识码:A文章编号:1673—629X(2010)02—0245—04ApplicationandResearchofHiddenMarkovModelinNaturalLanguageProcessingDomainHANPu,JIANGJie(Col

3、lege0fEducationScience,NanjingNormalUniverstiy,Nanjing210097,China)Abstract:HiddenMarkovmoddisakindofpowerfulstatisticalmachinelearningtechnology。whichhasbeensI】ocesullyappliedinc∞-tinuousspeechrecognitionandonlinechar~errecognition.Ithasab0beenwidely

4、usedinbk,k~yinformation.Bq~auseofthismodd’spowerfulI~rningcapacity,itisincreasinglyappliedinnatural一~gtlageplDc镫s;l.Analyzetheapplicatica0fhiddenMarkovmodIelinpartofspeechtagging,namedentityrecognitionandinformationextraction。amongwhichtheapplicationo

5、fhiddenMarkovmodelinin—formationextractionisemphatieaUyaIlalyzed,hoping懈resea~lmshaveabetterunderstandingabout洲.Attheendofthepaper,makeananalysisabouttheinadeque~iesandimplantresearchofHⅢinapplication.Key~~ds:hiddenMarkovmodel;informationextraction;po

6、st’—of_’speechtagging;namedentity0引言1隐马尔可夫模型的概述隐马尔可夫模型(HMM)是一种强有力的概率机1.1概述器学习过程,已被成功应用于语音识别[1]、手写体识隐马尔可夫模型(m嗄)是一个二重马尔可夫随别、生物信息学等领域。机过程,包括具有状态转移概率的马尔可夫链和输出HMM处理新的数据具有很好的鲁棒性,并且有观测值的随机过程,其状态只有通过观测序列的随机一套成熟的算法。过程才能表现出来。一个HMM包含两层:一个可观隐马尔可夫模型的优点是它有强壮的概率统计作察

7、层和一个隐藏层。可观察层是待识别的观察序列,为基础,而这个特点也很适合处理自然语言领域的任隐藏层是一个马尔可夫过程,即一个有限状态机,其中务,在自然语言处理中[t3l,HMM已被应用于词性标每个状态转移都带有转移概率。一阶隐马尔可夫模型注[4,5I、命名实体识别[6I、信息抽取[7—10等任务。做了如下两个重要假设:其前提对于一个随机事件,HMM也有个明显的缺点就是模型的建立比较困有一个观察值序列O={,2,⋯,},该事件隐含难。而模型的构建恰是使用HMM的关键步骤。着一个状态序列S=,s2,⋯,

8、}。假设1:t时刻的状态q,向t+1时刻的状态q川转移的概率仅仅与口有关,而与以往任何时刻的状态收祷日期:2009一O6—05;修回日期:2oo9一O9一o3无关,即隐藏的状态序列构成一阶马尔可夫链,数学表基金项目:国家自然科学基金(60873175)作者简介:韩普(1983一),男,山东人,硕士,研究方向为信息抽示为:P(giIql⋯9H):P(I口H)。取、自然语言处理。假设2:在t时刻输出观测值O,的概率,只取决于·246·计算机技术与发展第2O卷当前时刻t所处的状态q,而与

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。