知识图谱-8.知识的存储与检索

知识图谱-8.知识的存储与检索

ID:37302103

大小:2.05 MB

页数:110页

时间:2019-05-21

知识图谱-8.知识的存储与检索_第1页
知识图谱-8.知识的存储与检索_第2页
知识图谱-8.知识的存储与检索_第3页
知识图谱-8.知识的存储与检索_第4页
知识图谱-8.知识的存储与检索_第5页
资源描述:

《知识图谱-8.知识的存储与检索》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2017-2018学年-秋季学期:知识图谱导论第9章知识图谱的存储与检索王泉中国科学院信息工程研究所中国科学院大学网络空间安全学院提纲概述知识图谱的存储基于表结构的存储基于图结构的存储知识图谱的检索关系数据库查询:SQL语言图数据库查询:SPARQL语言本章小结提纲概述知识图谱的存储基于表结构的存储基于图结构的存储知识图谱的检索关系数据库查询:SQL语言图数据库查询:SPARQL语言本章小结知识图谱知识图谱是一种有向图结构,描述了现实世界中存在的实体、事件或者概

2、念以及它们之间的相关关系。实体:CristianoRonaldo,JosDinisAveiro,RealMadridCF、马赛约等实体类型:人物、国家、城市、组织机构等属性:人物有姓名、性别、出生日期、兴趣爱好、职业等属性;国家有国庆日、国家代码、货币、时区、等属性关系:人物和人物间的同事关系、人物和国家间的国籍关系、城市和国家间的属于关系等知识图谱中的知识表示知识图谱中的知识是通过RDF的结构进行表示的,其基本构成单元是事实,每个事实被表示为一个形如

3、e,object>的三元组。subject:主体(也称主语),其取值通常是实体、事件或者概念中的任何一个predicate:谓词(也称谓语),其取值通常是关系或者属性object:客体(也称宾语),其取值既可以是实体、事件、概念,也可以是普通的值(如数字、字符串等)知识图谱中的知识表示知识图谱中的知识是通过RDF的结构进行表示的,其基本构成单元是事实,每个事实被表示为一个形如的三元组。实体:Pepe,RealMadridCF、Mace

4、io属性:gender,height,dateofbirth,capacity,shortname,creationdate,area,elevation,postalcode属性值:male,1.88m,1983/02/26,81,044,RM,1902/03/06,511km²,7m,57000-000关系:team,placeofbirth知识图谱中的知识表示知识图谱中的知识是通过RDF的结构进行表示的,其基本构成单元是事实,每个事实被表示为一个形如

5、te,object>的三元组。知识图谱的目标是构建一个能够刻画现实世界的知识库,为自动问答、信息检索等应用提供支撑。因此,对知识的持久化存储并提供对目标知识的高效检索是合格的知识图谱必须具备的基本功能。提纲概述知识图谱的存储基于表结构的存储基于图结构的存储知识图谱的检索关系数据库查询:SQL语言图数据库查询:SPARQL语言本章小结知识图谱的存储按照存储方式的不同,知识图谱的存储可以分为基于表结构的存储和基于图结构的存储。基于表结构的存储:利用二维的数据表对知识图谱中的数据进

6、行存储•三元组表、类型表、关系数据库基于图结构的存储:利用图的方式对知识图谱中的数据进行存储•图数据库提纲概述知识图谱的存储基于表结构的存储基于图结构的存储知识图谱的检索关系数据库查询:SQL语言图数据库查询:SPARQL语言本章小结三元组表知识图谱中的事实是一个个的三元组,一种最简单直接的存储方式是设计一张三元组表用于存储知识图谱中所有的事实。三元组表特性基于三元组表的存储方式的优点是简单直接,易于理解;然而缺点也非常明显,主要有以下两点:整个知识图谱都存储在一张表中,

7、导致单表的规模太大。对大表进行查询、插入、删除、修改等操作的开销很大,这将导致知识图谱的实用性大打折扣。复杂查询在这种存储结构上的开销巨大。由于数据表只包括三个字段,因此复杂的查询只能拆分成若干简单查询的复合操作,大大降低了查询的效率。例如,查询“佩佩的身高和性别是什么?”需要拆分为“佩佩的身高是多少?”和“佩佩的性别是什么?”类型表为每种类型构建一张表,同一类型的实例存放在相同的表中。表的每一列表示该类实体的一个属性,每一行存储该类实体的一个实例。类型表的不足大量数据字段的冗余存储。假设

8、知识图谱中既有“演员”也有“歌手”,那么同属于这两个类别的实例将会同时被存储在这两个表中,其中它们共有的属性会被重复存储。大量的数据列为空值。通常知识图谱中并非每个实体在所有属性或关系上都有值,这种存储方式会导致表中存在大量的空值。考虑层级关系的类型表构建数据表时,将知识图谱的类别体系考虑进来。具体来说,每个类型的数据表只记录属于该类型的特有属性,不同类别的公共属性保存在上一级类型对应的数据表中,下级表继承上级表的所有属性。类型表特性类型表克服了三元组表面临的单表过大和结构简单的问题,但是

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。