dbpedia知识库本体分析

dbpedia知识库本体分析

ID:26278499

大小:188.84 KB

页数:12页

时间:2018-11-25

dbpedia知识库本体分析_第1页
dbpedia知识库本体分析_第2页
dbpedia知识库本体分析_第3页
dbpedia知识库本体分析_第4页
dbpedia知识库本体分析_第5页
资源描述:

《dbpedia知识库本体分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、DBpedia知识库本体分析[摘要]在现有的语义网项目架构中,基于关联数据形式的知识库项目往往处于整个语义网络的核心,如何对于这些知识库的知识内容进行组织、储存和查找就成为了决定整个语义网络运行效率的关键因素。在目前的关联数据知识库项目中,DBpedia是较为典型且成熟的一个,DBpedia网站使用本体的方法来对其条目内容进行组织和存储,本文旨在通过对DBpedia现有本体结构的分析来说明知识库的本体结构对于知识库的组织、存储和查找有着怎样的影响,并试图从该例中分析归纳得出类似网站知识库内容的本体构建的一般要点。[关键词]DBpe

2、dia关联数据本体本体构建1.概述及相关简介1998年,WWW网络的发明者Berners-Lee提出了语义网的概念。这一概念的核心在于致力提高万维网络及其互联的资源的可用性和有效性,使得下一代的互联网更加智能和高效,能够有效处理目前网络中的大量信息内容。这一概念和其具体的技术实现几经波折,从一开始的基于本体的构想到2006年Berners-Lee提出的关联数据概念,在目前的语义网构想中,关联数据成为了其技术实现的核心概念。关联数据是一种推荐的最佳实践,用来在与以往中使用URI和RDF发布、分享、连接各类数据、信息和只是,发布和部署

3、实例数据和类数据,从而通过HTTP协议解释并获取这些数据同时强调数据的相互关联、相互联系以及有益于人际理解的语境信息。在目前的具体实践中,数据往往以RDF文件的形式发布到互联网络上,存储在关联数据知识库中。而大多数需要使用这些关联数据的网站可以直接从在线关联数据知识库的数据接口获取RDF文件并提取其中的相关信息反馈给用户,从而实现信息和数据的跨网站共享。从上面不难看出,在线关联数据知识库在当前的关联数据语义网构想中占据着核心位置。DBpedia就是这样一个在线关联数据知识库项目。它从维基百科的词条中抽取结构化数据,以提供更准确和直

4、接的维基百科搜索,并在其他数据集和维基百科之间创建连接,并进一步将这些数据以关联数据的形式发布到互联网上,提供给需要这些关联数据的在线网络应用、社交网站或者其他在线关联数据知识库。同时,与一些同时期的关联数据知识库项目不同,DBpedia提供的关联数据知识内容并不受限于某一较小的专业或学科领域,到2012年为止,DBpedia知识库项目已有超过3640000个条目,这些条目涉及人名、地名、音乐专辑、电影、组织、种族等等多个类目。在大数量和宽范围的前提下,DBpedia知识库的条目组织就成为决定其运行效率的关键因素。DBpedia知

5、识库以构建本体的形式对条目进行组织,起到了一定的效果。本体一词是指对客观世界存在的事物的系统描述,在信息科学的领域中,1991年Neches等人最早给出的定义是:给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成,规定这些词汇外延规则。1993年Gruber将其定义表述为“概念模型的明确的规范说明”。1997年Borst进一步完善了该本体的定义,表述为“共享概念模型的形式化规范说明”,增加了“共享”和“形式化”两个限定语。1998年Studer等人在对Gruber和Borst的定义进行了深入研究后,将本体进一步表述为

6、“共享概念模型的明确的形式化规范说明”并从此形成了目前信息学界对本体概念比较一致的看法。本文以DBpedia的本体结构为实例,从类与条目属性以及本体结构两个方面,分析DBpedia本体的构建思路。1.DBpedia本体的类和条目属性分析如前所述,本体是对共享概念模型的明确的形式化规范说明。根据斯坦福大学医学院发本体的构建七步法,构建本体有如下七个步骤:(1)确定本体的专业领域与范畴(2)考察复用现有本体的可能性(3)列出本体中的重要术语(4)定义类和类的等级关系(5)定义类的属性(6)定义属性的分面(7)创建实例但以上所述的七步法

7、仅适用于某一专业或学科领域本体的构建。在DBpedia知识库一例中,由于所需要构建本体的是维基百科条目,因此其专业领域与范畴无法简单确定,因此在DBpedia的本体构建中,采用了类似于以叙词表为基础的自动化本体转换的方式。但同样的,维基百科的词条表并非规范的叙词表,其类目划分也无法简单归于某一专业分类之下,词语的专指度不可避免的出现不足,因此,在DBpedia的本体构建中,类目划分和定义基本是人工完成,之后的条目转换才使用了自动转换的方式。2.1DBpedia类共有属性分析本体的体系结构主要包括3个要素:核心元素集、元素间的交互作

8、用以及这些元素到规范语义间的映射关系。对于本体的一般构造过程,可以用以下公式进行表示:本体=概念(Concept)+属性(Property)+公理(Axiom)+取值(Value)+名义(Nominal)从以上的一般公式中,我们还可以归纳出本体当中

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。