欢迎来到天天文库
浏览记录
ID:46603743
大小:431.43 KB
页数:7页
时间:2019-11-26
《引入层次成分分析的依存句法分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第34卷第1S2017年2月沈阳航空航天大学学报Jou—rn—alof—S—henyangAerospaceUniversityV01.34NO.1Feb.2017文章编号:2095—1248(2017)Ol一0076—07引入层次成分分析的依存句法分析张丹,周俏丽,张桂平(沈阳航空航天大学人机智能中心,沈阳110136)摘要:长距离依存分析准确率低是依存句法分析中很重要的问题,针对该问题,提出了一种引入层次成分分析的依存句法分析方法,在依存分析之前进行包括非核心成分和核心成分的成分识别,对成分
2、内部和成分之间进行依存分析,该方法能避免产生长距离依存关系。同时,针对不同成分训练不同模型。在CoNLL2009评测语料中,UAS值在develop数据集上提升了2.53%,在test数据集上提升了1.39%。实验结果表明,结合语言学知识,引入层次成分分析,能够有效地改善依存分析效果。关键词:层次成分分析;成分识别;依存句法分析中图分类号:TP391.1文献标志码:Adoi:10.3969/j.issn.2095—1248.2017.01.012Usinghierarchicalcomponen
3、tanalysisfordependencyparsingZHANGDan,ZHOUQiao—li,ZHANGGui—ping(ResearchCenterforHuman—computerIntelligence,ShenyangAerospaceUniversity,Shenyang110136,China)Abstract:Atpresent,thelowaccuracyoflong—distancedependencyanalysisisavitalproblemindependen—c
4、yparsing.Toaddressthisproblem,thispaperproposesahierarchicalcomponentanalysismethodforde—pendencyparsing.Thismethodperformedcomponentidentificationbeforetheprocessofdependencyanaly—sis.Thecomponentsincludedcorecomponentsandnon-corecomponents.Thedepen
5、dencyanalysiswasper—formedwithincomponentsandamongcomponents.Inthiscontext,themethodcanavoidgeneratingthelong-distancedependencyrelationships.Atthesametime,differentmodelsweretrainedfordifferentcompo—nents.OnCoNLL2009’Sevaluationcorpus,theUASisincrea
6、sedby2.53%onthedevelopdatasetandby1.39%onthetestdataset.Experimentalresultsshowthatusinghierarchicalcomponentanalysisbasedonlinguisticknowledgecanimprovethedependencyparsingperformanceeffectively.Keywords:hierarchicalcomponentanalysis;componentidenti
7、fication;dependencyparsing近年来,依存句法分析一直是自然语言处理领域的热点和难点问题之一,受到了越来越多的关注,目前主流的依存句法分析技术是基于依存树库的统计依存句法分析。但统计的依存句法分析存在数据稀疏、长距离分析准确率低等问题,因此,针对汉语句子的句法结构,利用语法、语义、语用等语言学知识对其进行多方面、多角度的分析已成为汉语语言学界的共识。层次分析法是分析句子结构的一种方法,层次分析法认为任何一个复杂的语言单位都是由较收稿日期:2016—1l一28基金项目:国家自
8、然科学基金项目(项目编号:691403262);教育部社科青年基金项目(项目编号:14YJC740216)作者简介:张丹(1992一),女,辽宁葫芦岛人,硕士研究生,主要研究方向:知识工程与知识管理,E-mail:630029794@qq.com;张桂平(1962一),女,辽宁本溪人,教授,主要研究方向:自然语言处理、机器翻译,E。mail:zgp@ge。soft.com。第1期张丹,等:引入层次成分分析的依存句法分析77小的语言单位组成的,但不是一次组成的,而是由小到大逐层组织起来的⋯。而依存
此文档下载收益归作者所有