实体关系抽取的技术方法综述

实体关系抽取的技术方法综述

ID:36749307

大小:372.69 KB

页数:6页

时间:2019-05-14

实体关系抽取的技术方法综述_第1页
实体关系抽取的技术方法综述_第2页
实体关系抽取的技术方法综述_第3页
实体关系抽取的技术方法综述_第4页
实体关系抽取的技术方法综述_第5页
资源描述:

《实体关系抽取的技术方法综述》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、《现代图书情报技术》版权所有,欢迎下载引用!请注明引用地址:实体关系抽取的技术方法综述[J],现代图书情报技术,2008(8):18-23.专题实体关系抽取的技术方法综述1,2,311徐健张智雄吴振新1(中国科学院国家科学图书馆北京100190)2(中国科学院研究生院北京100049)3(中山大学资讯管理系广州510275)【摘要】对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技

2、术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。【关键词】实体关系抽取信息抽取关系抽取方法【分类号】G250.73ReviewonTechniquesofEntityRelationExtraction1,2,311XuJianZhangZhixiongWuZhenxin1(NationalScienceLibrary,ChineseAcademyofSciences,Beijing100190,China)2(GraduateUniversity

3、oftheChineseAcademyofSciences,Beijing100049,China)3(DepartmentofInformationManagement,SunYat-SenUniversity,Guangzhou510275,China)【Abstract】Entityrelationextractionisaveryimportanttaskintextinformationextractiondomain.ItfirstsummarizesthedevelopmentofentityrelationextractionrelatedtoMUCandACE

4、,andthenpointsoutthatmaindifficultiesexistintheprocessofrelationextractionareacquisitionoftrainingdataset,acquisitionoftemplates,andco-referenceresolution.Basedontheanalysisofrecentrelatedliteratures,systemsandprojects,itconcludestheentityrelationextractionmethodsasfollows:templatesmethod,le

5、xicondrivenmethod,machinelearningmethod,Ontologydrivenmethod,andhybridmethod.Theanalysisofthesemethodscanhelptobuildmoreefficiententityrelationextractionsysteminfurtherstep.【Keywords】EntityrelationextractionInformationextractionRelationextractionmethods1引言随着数字资源和万维网上的文本信息的飞速增长,从文本中自动抽取知识的技术越

6、来越被关注。具体而言,知识抽取系统从特定领域的文本文档中识别相关知识要素(通常是预先定义的类型),并将它们以结构化形式存储。知识抽取任务在细节和可靠性上有不同的选择,但一般都包括两个普遍存在并且紧密关联的子任务:实体识别和关系抽取。实体识别通过实体抽取技术抽取各个知识要素。抽取出的知识要素以离散的形式存在,只能反映出文本中包含哪些实体,例如人、机构、地点等,却不能反映出知识要素之间的关系,例如机构与人之间的雇用关系、机构与地点之间的位置关系等,而关系抽取则是要解决这一难题。收稿日期:2008-06-16本文系国家社会科学基金项目“从数字信息资源中实现知识抽取的理论和方法研究”

7、(项目编号:05BTQ006)的研究成果之一。18现代图书情报技术总第168期2008年第8期不同的研究者对关系抽取任务的表述不尽相同。信息抽取系统的评测。只有参加信息抽取系统评测的[1]AlexanderSchutz等人认为关系抽取是自动识别由一单位才被允许参加MUC会议。在每次MUC会议前,对概念和联系这对概念的关系构成的相关三元组。组织者首先向各参加者提供样例消息文本和有关抽取[2]SophiaKatrenko等人则从关系抽取的基本过程角度任务的说明,然后各参加者开发能够处理这种消息文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。