基于依存分析语义角色标注的研究

基于依存分析语义角色标注的研究

ID:32247798

大小:2.60 MB

页数:70页

时间:2019-02-02

基于依存分析语义角色标注的研究_第1页
基于依存分析语义角色标注的研究_第2页
基于依存分析语义角色标注的研究_第3页
基于依存分析语义角色标注的研究_第4页
基于依存分析语义角色标注的研究_第5页
资源描述:

《基于依存分析语义角色标注的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于依存分析的语义角色标注研究中文摘要语义分析是自然语言理解的根本性问题,也是研究的重大难题。语义角色标注(SemanticRoleLabeling,SRL)是语义分析的一种简化形式,因具有定义清晰、评测容易等特点而成为目前的研究热点。目前主流的语义角色标注研究都是基于短语结构句法分析,并取得一定的成功。自动句法分析性能对基于短语结构句法分析的语义角色标注性能起着主导作用,是现阶段语义角色标注的瓶颈。而另一方面,基于依存的句法分析由于其自身的特点日趋成为研究的热点。因此,本文从依存分析出发,实现了基于依存分析的语义角色标注,研究内容主要包括以下

2、几个方面:首先,探索了谓词的自动识别和谓词词义识别。由于语义角色标注是以谓词为驱动,这使得谓词自动标注是语义角色标注面向实际应用的前提。本文实现了基于机器学习方法的谓词识别和谓词词义识别。实验表明,在CoNLL2008测试集上谓词识别和谓词词义消歧的性能F1值分别达到了89.9%和82.1%,’是目前已报告的在相同数据集上取得的最好性能。其次,研究了基于依存分析的语义角色标注。将语义角色标注分为以下三步实现:剪枝、角色识别和角色分类。重点探索和分析了剪枝策略、特征选择对系统性能的影响。同时,分析了自动依存句法分析和自动谓词标注对语义角色标注性能

3、的影响。使用CoNLL2008的数据集,基于自动依存树和自动谓词标注,取得的语义角色标注性能F1值为80.94%,与CoNLL2008评测的最优性能相当。最后,首次尝试和探索了基于依存分析的中文语义角色标注。在将英文语义角色标注方法移植于中文时,重点分析了中文的语言特点,探索有利于中文语义角色标注的特征集,取得了较好的性能。作为基于中文语料的初次探索,为以后的研究打下了基础。关键词:语义角色标注,依存分析,最大熵模型,谓词标注作者:汪红林指导老师:周国栋王红玲AbstractResearchonDependency-basedSemanticR

4、oleLabelingResearchonDependency--basedSemanticRoleLabelingSemanticparsingisafundamentalaswellasatoughissuetonaturallanguageunderstanding.Duetothedifficultyinsemanticparsing,thewell-definedandeasily—evaluatedsemanticrolelabeling(SRL)mapsanaturallanguagesentenceintoaformalrepr

5、esentationofitsmeaningandhasbeendrawingmoreandmoreattentions.MostpreviousworkonSRLfocusedonconstituent—basedparsingtreesandachievedgoodperformance.However,automaticparsingiscrucialtotheperformanceofSRLandmakesitabottlenecktOconstituent-basedSRL.Meanwhile,dependencyparsingrec

6、eivesmoreandmoreattentionduetoitscharacteristic.Therefore,thispaperfocuses0111"researchondependency—basedSRLbyusingdependencyparsetrees.Thecontributionofthisworkincludes:Firstly,thispaperhasaddressedtheissueofpredicateidentification(PI)andsenseclassification(sc).Sincepredomi

7、natedSRLsystemsarepredicate—driven,itmakespredicatelabelingasanessentialcomponentinrealSRLapplications.Thispaperproposesamachinelearning—basedmethodtoresolvePIandSC.TheexperimentsonCoNLL2008testdatasetshowourbestsystemcanachieveF1scoreof89.9%and82.1%forPIandSCrespectively.To

8、ourknowledge,itisthebestachievedperformancebyusingthesamedataset.Secondly,t

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。