图数据库在标签系统中的应用研究.pdf

图数据库在标签系统中的应用研究.pdf

ID:55610095

大小:1.84 MB

页数:7页

时间:2020-05-18

图数据库在标签系统中的应用研究.pdf_第1页
图数据库在标签系统中的应用研究.pdf_第2页
图数据库在标签系统中的应用研究.pdf_第3页
图数据库在标签系统中的应用研究.pdf_第4页
图数据库在标签系统中的应用研究.pdf_第5页
资源描述:

《图数据库在标签系统中的应用研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、·知识组织·图数据库在标签系统中的应用研究王慧孜,范炜(四川大学公共管理学院信息管理技术系,成都610064)摘要:图数据库是LNoSQL技术之·,其图数据结构适合用于标签系统的数据存储与检索。本文分析了标签系统的数据存储方式,比较了图数据库与传统关系型数据库,基于“用户-标签.资源”三者关系构建了图数据模型。通过FlickrAPI采集到的图片数据,以图数据,~-Neo4j作为应用环境构建了小型的标签系统,使用图数据库语法可以构造出多维度的检索分析,得到直观的可视化网络图。图数据库对于处理呈现出复杂网络结构

2、的标签系统有着明显优于关系型数据库的优势和实用价值。关键词:图数据库;标签系统;数据管理中图分类号:G254DoI:10.37720.issn.1673-2286.2015.04.0041标签系统的数据管理概述与标签的图形优化问题。鲁晓明[3对社会性标签系统中的复杂网络特性进行了分析,就标签系统中的用户、信标签(Tagging)是通过用户提供的关键词进行信息和标签这三个主体之间的联系进行了探讨。息组织的方法,它正在改变网络上寻找、使用和分享信围绕标签系统的分析,底层的数据存储大多数息的方式。标签就是用户为资

3、源添加的关键词。标签以关系型数据库为支撑,例如sqLServer、Oracle、系统可以被定义成是一系列用户、一系列标签、一些MySQL等。通常,标签系统的相关查询在关系型数资源对象以及在时间维度上三者之间关系的集合。这据库中处理为多个二维表的连接。具体而言,当所需个系统中没有层级结构,所有的条目都属于扁平化的的数据涉及到多张表时,就需要通过SELECT语句对空间。FROM子句中的二维表进行选择和投影等操作,同时标签系统主要由三个基本要素构成:用户、标签与也需要通过WHERE子句对相应的二维表做条件连接资源

4、。三者之间的数据关系呈现出网状的图(Graph)操作。当标签系统中标签、用户与资源三者随着数量增结构。根据此共识,已有较多学者与实践者对标签系加与关联复杂度提高时,关系模型会因为过多的表连统的数据结构进行了研究。Kaikai等将大众分类看成接变得复杂,同时过多的表间连接会降低检索性能,而是一个复杂的网络结构。他们认为大众分类法使得用外键约束也会增加额外的开发和维护的费用,使现有的户去分享他们个人使用的标签。因为在同一个标签下关系型数据库很难满足不断变化的业务需求。用户可以分享不同的内容,同一内容可以被赋予不

5、同的标签,这样标签之间是互相联系的,而资源之问亦是如2图数据库简介此。这样的特征使得大众分类很容易表示成一个标签和内容的网络。Yin等[2将Web资源对象的分类问题看随着NoSQL技术浪潮的兴起,图数据库(Graph成是资源对象与标签的图形优化问题,并且他们也提出Database)作为NoSQL技术中的一类,以解决社交网络了一个有效的迭代算法被提出来解决这样的资源对象数据管理问题的典型代表。图数据库以图结构作为数2015年第4期(总第131期)21支持语义网事实查询语法标准SPARQL,RDFS++和据模型

6、,具有网状数据的原生存储与检索能力。与传Prolog。它将高效的内存利用与基于磁盘的存储相结统的关系数据库相比,无论是标签系统中过大的数据合,这使得它在保持良好性能的同时还能够负载数以亿集,还是标签系统中复杂的网络连接结构,图数据库不计的RDF。仅能与标签系统的底层数据结构良好契合,直观的查TrinityE~~l是一个以内存云为基础的分布式图系统。询语法支持,以及更富有表现力的数据呈现方式。内存云是全球范围内可寻址的,内存中的键值对存储在图数据库在国内的相关研究主要集中在图数据库机器集群中。通过分布式的内存

7、存储,Trinity提供对大中匹配以及查询算法优化、图结构及其数据模型、图数据集的快速随机数据存取,这使得Trinity成为了天数据库技术特性等3方面。沈思、苏新宁【4分析了面向然的大图处理平台。因为Trinity具有快速图探测和分知识服务的分类表结构,并针对关系数据库的数据机布式并行计算的能力,对于包含上亿节点的大图它既能器存储方式在分类表知识更新、删除、添加上存在的支持低延迟的在线查询处理又能支持高吞吐率的离线弊端,给出了分类表的图数据库存储方式以及具体的分析。检索案例。王余蓝l5认为在成熟度、安全性等

8、方面虽Neo4jDi]是一款由NeoTechnology所支持的开源然图数据库要劣于关系数据库,但在处理复杂数据图形数据库。有以下特点:直观性,用图模型来表现数关联方面远优于关系数据库,适合存储关联关系复据;可靠性,兼容ACID事务特性;持久和快速性,使用杂、关系动态变化等社交性数据。高劲松等f6针对传统基于磁盘的本地存储引擎;高度扩展性,有着多达数以的关系.对象模型实现文献知识元存储的不足,提出以亿计的节点、关

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。