大规模rdf图数据的子图匹配查询研究

大规模rdf图数据的子图匹配查询研究

ID:35073113

大小:3.16 MB

页数:48页

时间:2019-03-17

大规模rdf图数据的子图匹配查询研究_第1页
大规模rdf图数据的子图匹配查询研究_第2页
大规模rdf图数据的子图匹配查询研究_第3页
大规模rdf图数据的子图匹配查询研究_第4页
大规模rdf图数据的子图匹配查询研究_第5页
资源描述:

《大规模rdf图数据的子图匹配查询研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、大大大规规规模模模RDF图图图数数数据据据的的的子子子图图图匹匹匹配配配查查查询询询研研研究究究TheResearchofSubgraphMatchingonLarge-ScaleRDFGraph学科专业:计算机科学与技术作者姓名:吕雪栋指导教师:冯志勇教授天津大学计算机科学与技术学院二零一五年十二月摘要子图匹配(BasicSubgraphPatternMatching)是RDF图数据管理中的一种基本查询类型,又称子图同构(SubgraphIsomorphism),是一个NP-Complete问题。随着语义网的发展和开放链接数据运动的发展,越来越多的数据通过R

2、DF格式发布出来。高时间复杂度和巨大的数据规模给RDF图数据的管理带来了巨大挑战。目前的单机查询算法由于受限与子图匹配问题的特性,往往会引入大量的连接操作,效率较低;基于MapReduce的分布式查询方案受限于MapReduce的迭代机制,查询效率很难提升。因此,如何高效地在大规模的RDF图数据上解决子图匹配问题,成为一个具有挑战性的工作。本文提出了集中式和分布式两种RDF图数据查询方案。在集中式查询方案中,数据图根据顶点度数的大小拆分成星状的小规模子图,并将这每个子图编码成一个二进制串。将子图匹配的部分操作转换成二进制位的“与”和“或”操作。使用该二进制串来

3、过滤出可能的子结果。然后将子结果拼接成完整的查询结果。该方案避免了大多数的连接操作,使得每次访问索引获得一条三元组信息优化到每次访问索引获得一组三元组信息。这种查询方案提高了每次查询获得的信息量,大大减少了连接操作数量。在分布式查询方案中,将RDF图中的每个顶点都视为可执行计算的单元,将整个图映射成可互相传递消息的顶点集。这种模型基于BSP计算模型设计,充分利用了图的特点,使用消息传递的方式逐步完善查询图,逐一减少变量数量,最终得到查询结果,避免了迭代的MapReduce计算模型在解决图计算问题时存在的很多限制,查询效率明显提高。本文设计的实验从索引的空间代价

4、和查询响应时间等方面对上述两种方法做了评价,集中式查询方案在查询响应时间上优于目前性能最好的通用RDF集中式查询引擎RDF-3X和gStore,分布式查询方案也较MapReduce框架下实现的查询方案有较大的性能提升。综上所述,本文针对RDF图数据上的子图匹配问题提出了单机集中式查询和集群分布式查询两种查询方案,在索引结构、数据编码、查询算法等方面提出了具体解决方案。有效地降低了查询时间复杂度。关关关键键键词词词:::图数据,资源描述框架,子图匹配IABSTRACTBasicSubgraphPatternMatchingisaNP-completeproble

5、m,alsoknownassubgraphisomorphism.WiththedevelopmentoftheSemanticWebandLinkedOpenData,moreandmoredataispublishedinRDF.ThehightimecomplexityofsubgraphisomorphismandlargescaleofRDFdatahavemadeabigchallengetothemanagement.Themaincontributionsofthisdissertationcontaintwoparts.Wepresentas

6、tand-alonequeryingmethod,inwhichwedecomposeadatagraphintoasetofstar-likesubgraphsandencodethemintobinarybit-strings.ConvertingjoinoperationstobinarybitwiseORorANDoperationsdecreasesthecomplexityofqueryprocessing.Thebit-stringisusedtofilteroutfalseresults.Thismethodavoidslotsofexpensi

7、veself-joinoperations.Ascarefullydesignedindices,wecanfetchasubgraphratherthanasingletriplebyoneaccesstotheindices.Forthedistributedsolution,wedropMapReduceframeworkandturntoBSPframework.Themessagepassingmechanismfitssolvingcomputationongraph.Wepassaqueryfromonevertextoanother.Inthep

8、assingprocedure,var

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。