应用条件随机场进行汉语词法分析、语块分析的研究

应用条件随机场进行汉语词法分析、语块分析的研究

ID:33682494

大小:1.24 MB

页数:46页

时间:2019-02-28

应用条件随机场进行汉语词法分析、语块分析的研究_第1页
应用条件随机场进行汉语词法分析、语块分析的研究_第2页
应用条件随机场进行汉语词法分析、语块分析的研究_第3页
应用条件随机场进行汉语词法分析、语块分析的研究_第4页
应用条件随机场进行汉语词法分析、语块分析的研究_第5页
资源描述:

《应用条件随机场进行汉语词法分析、语块分析的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文摘要介绍了词法分析、句法分析在自然语言理解研究中基础的、决定性的重要地位。针对目前词法分析、句法分析研究热点集中在基于规则方法和基于统计方法的联合应用,介绍了最大熵理论和最大熵理论对于自然语言理解研究的重要意义,并进一步介绍了条件随机场(以最大熵理论为驱动发展起来的一种用于对序列数据进行切分和标记的概率框架)。提出了应用条件随机场来构建统一的汉语词法分析。以往应用条件随机场进行汉语分词时,将分词转化为对汉字的标注。提出了使用词图作为基础的标记序列来完成汉语的词法分析,这样充分利用了现有的词典资源,在特

2、征架的选择时也可以方便地融合语言知识。最后进一步讨论了将条件随机场应用到汉语语块分析之中。提出了未来关于应用条件随机场构建汉语词法语块分析模型的初步构想。关键词:汉语词法分析;汉语语块分析;条件随机场;最大熵;序列数据标记;应用条件随机场进行汉语词法分析、语块分析研究AbstractThisdissenationintroducestheresearchoflexicalanalysisandsymaxparsingisimportant,cmcialand向ndamentalintheresearchofnat

3、urallanguageunderstanding.Accordingpresentlythetendencyofmethodsthatintegratestatistics-basedandmle_basemethods,thispaperintmducestherulesofMaximumEntropya11dthesigni矗canceofitonnatufal1anguageunderstandjngresearch.Furthermore,thisdissertationdiscussesthedefi

4、nitionandparameterestimateofConditionRandomFieldsCRFsarepmbabiljsticmodelsforsegmemingandlabelingsequencedataandheaVilymotivatedbytheprincipleofmaximumentropyThenthisdissertationpresentsaunifiedapproachforChinese1exicalanalysisusingConditjonalRandomFieldsPrec

5、iousapplicationsappIyingconditionalrandomfieIdstoChinesewordssegmentationconve『tsegmemationtochamcter-basedBegin仃nsidetaggingThisdissertationpresemsusingthewordslatticeasthefundamentalsequencetobetaggedtoachieveChineselexicalanalysisThenthe1exiconcanbeusedeff

6、iciently:andlanguageknowledgecanbeintegratedeasilyinfeaturetemplateselectingThisdisseftationalsodiscussesapplyingConditionalRand。mFieldstoChineseChunkParsingandour如tureworksKeywords:Chjneselexicalanalysis;ChineseChunkParsing;CondhionalRandomFields;ⅣraximumEnt

7、ropyiLabelingSequentiaIData;II硕士学位沦文插图索引图1l词图示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯5图l2依存树示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯10图31线性链CRFs示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯19图32隐马模型示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯21图3.3标记偏见问题示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯25图34CRFs结构示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯26Ⅲ

8、应用条件随机场进行汉语词法分析、语块分析研究附表索引表41CRFs词法分析特征框架表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯32表5lCRFs语块分析特征框架表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯34兰州理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。