资源描述:
《一种基于本体约束的知识抽取方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、ComputerScienceandApplication计算机科学与应用,2011,1,91-96doi:10.4236/csa.2011.13019PublishedOnlineDecember2011(http://www.hanspub.org/journal/csa)AnApproachofKnowledgeExtractionRestrainedbyOntology*GuojieLi,DengfengXuDalianHengyiTechnologyIncorporatedCompany
2、,DalianEmail:ligj@hengyi.ln.cnReceived:Sep.1st,2011;revised:Sep.25th,2011;accepted:Oct.9th,2011.Abstract:Intermsofknowledgeview,anapproachofknowledgeextractionrestrainedbyontologyispro-posedinthispaper.Atfirst,translateadomainontologyintoamodelexpress
3、edbyAlloylanguageandusetheformofsolutionspacetoexpresstherecognizedentitiesandtherecognizedentity-relationswhichcanbegotwhenapplyingnamedentityrecognitiontechnologyandentityrelationextractiontechnologytocoarsetextblockinturn.Andthentranslateeverysolut
4、ionofsolutionspaceintoanassertionsentencewhichwillbeincludedinAlloymodel.Next,reducesolutionspacebyapplyingAlloyanalyzertotheAlloymodel.Atlast,awholeknowledgeinstancewillbeobtained.Keywords:KnowledgeExtraction;Ontology;Alloy一种基于本体约束的知识抽取方法*李国杰,许登峰大连恒宜
5、科技有限公司,大连Email:ligj@hengyi.ln.cn收稿日期:2011年9月1日;修回日期:2011年9月25日;录用日期:2011年10月9日摘要:从知识的角度出发,提出一种基于本体约束的知识抽取方法:将领域本体中蕴含的逻辑信息转换为一个Alloy语言表示的模型,将命名实体识别和实体关系抽取的成果映射为解空间,接着将解空间里的每一个解转化为Alloy语言表示的断言语句,然后使用Alloy分析器来约简解空间,最终得到一个具有明确语义的完整知识实例。关键词:知识抽取;本体;Alloy1.
6、引言足同一或具有包含关系抽取规则时无法确定信息项类型的问题。在信息抽取领域,命名实体识别方法可以为实体本体是共享的、规范化的概念模型,是对某一领赋予正确的语义,实体关系抽取则可以明确两个实体域中知识结构的系统描述,因此从知识的角度来看,间的关系语义。但从知识的角度来看,无论是命名实领域本体是知识抽取最有效的工具之一。但从目前来体识别还是实体关系抽取都属于“小粒度”(知识片段)看,基于本体信息抽取和知识抽取的研究工作对领域的抽取,抽取结果并非独立完整的知识实例。命名实本体的利用非常有限,且主要集中在
7、一些信息本身格体识别和实体关系抽取的成果只有经过知识合成才能式和信息上下文格式的利用;而领域本体中蕴含的逻成为独立完整的知识实例。但由于知识体系的复杂性辑知识以及推理能力很少被利用,因此这类方法在抽和多样性,合成“知识片段”往往是非常困难的。此取结构比较复杂的知识时抽取效果就明显下降了。外,传统的信息抽取主要采用基于规则的方法,这种本文研究的思路是:将领域本体中蕴含的逻辑知方法会导致在抽取信息时因无法克服不同的信息项满识转换为一个Alloy语言表示的模型,在完成命名实Copyright©2011H
8、anspubCSA92李国杰等一种基于本体约束的知识抽取方法体识别和实体关系抽取的基础上,使用约束逻辑求解2.2.相关概念方法(Alloy分析器)来对领域内的信息进行更为精确首先我们给出同问题描述相关的几个概念。的定位,最终得到一个具有明确语义的知识实例。本定义1:本体O是一个五元组,文的组织如下,第二节给出两个引例,明确本文要解Co[1]O={C,R,H,Rel,A},其中C是概念的集合;R是决的问题;第三节介绍相关的概念;第四节是本文的C非分类关系的集合;H⊆C×C是分类关系