大规模rdf图数据的并行推理关键技术研究

大规模rdf图数据的并行推理关键技术研究

ID:35073118

大小:2.85 MB

页数:52页

时间:2019-03-17

大规模rdf图数据的并行推理关键技术研究_第1页
大规模rdf图数据的并行推理关键技术研究_第2页
大规模rdf图数据的并行推理关键技术研究_第3页
大规模rdf图数据的并行推理关键技术研究_第4页
大规模rdf图数据的并行推理关键技术研究_第5页
资源描述:

《大规模rdf图数据的并行推理关键技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、大规模RDF图数据的并行推理关键技术研究ResearchonKeyTechnologyofParallelInferenceonLarge-ScaleRDFGraph学科专业:计算机科学与技术作者姓名:吕小玲指导教师:许光全副教授天津大学计算机科学与技术学院二零一五年十一月摘要随着语义Web的快速发展,行业应用数据越来越多地选用RDF格式进行发布,RDF语义数据规模呈现爆炸性增长趋势,三元组条数已经远远超过百亿。RDF数据规模的急剧增大加深了语义数据管理工作的复杂性,也对语义数据的推理工作提出了新的挑战。如何能够高效解决大规

2、模RDF数据的推理问题成为许多研究工作的焦点。当前大多语义推理引擎执行时间较长,难以适应大规模语义数据推理工作的需求。针对这一问题,本文基于消息传递机制提出一种新的RDFS并行推理方案。该方案充分利用RDF数据的图结构特征,根据推理规则的特点,建立不同的RDFS推理过程的图上“加边模型”。该“加边模型”将由条件得到结论的推理过程抽象成在图上两个顶点之间添加新边的过程。同时,深入分析RDFS推理规则之间的依赖关系,优化RDFS推理规则的执行顺序,减少并行推理过程中的迭代次数。整个并行推理计算过程以图上的顶点为计算中心,根据已经

3、建立的不同的推理模型,向其他相关顶点传递推理消息。计算过程由该推理消息进行驱动,通过分析接收到的推理消息内容,完成推理任务。当所有推导出的新三元组以新边的形式加入到原RDF图中时,整个推理过程结束。最后,根据建立的推理模型,以消息传递机制的Pregel模型为基础,合理设计并行推理算法。在开源框架Giraph上,实现了基于消息传递机制的RDFS并行推理框架MPPIE,并进行大量的性能评估和对比实验,验证所提方案的正确性和高效性。在执行性能上,较当前性能最好的并行推理引擎平均快30倍以上。本文基于消息传递机制提出一种新的并行推理

4、框架MPPIE,实验结果与分析表明,基于消息传递机制的RDFS并行推理方式具有显著的性能优势。在标准数据集LUBM和真实数据集DBpedia上,所提推理方法的执行速度均比当前性能最好的语义推理引擎WebPIE快一个数量级,且展现了良好的可扩展性。关键词:RDFS推理,消息传递,Pregel,并行推理IABSTRACTLargevolumesofRDFdatahavebeenpublishedwiththerapiddevelopmentoftheSemanticWeb.RDFdataofeachresearchareapre

5、sentsageometricexplosivegrowth.Thenumberoftripleshasbeenfarmorethanascaleoftenbillion.Large-scaleRDFdatanotonlyincreasesthecomplexityofmanagement,butalsoposesanenormouschallengetoreasoningoversemanticdata.HowtoreasononRDFdataefficientlybecomesthefocusofmostresearch

6、work.Mostcurrentsemanticinferenceenginesaredifficulttoadapttothereasoningrequirementsoflarge-scalesemanticdata,sincetheexecutionprocessistimeconsuming.Tosolvethisproblem,thispaperproposesanRDFSparallelinferenceframeworkbasedonmessagepassingmechanism.Thegraphstructu

7、reofRDFdataisexploitedtoabstractinferenceprocesstoan“edgeadditionmodel”accordingtothecharacteristicsofRDFSrules.WemaptheprocessofacquiringderivationsofrulesintotheprocessofaddingnewedgesofRDFgraphin“edgeadditionmodel”.Atthesametime,toreducethenumberofiterationsofpa

8、rallelreasoningprocess,weanalyzethedependenciesofRDFSrulestoarrangetheoptimalexecutionorder.Thewholecalculationprocedureisvertexcentric.Verticese

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。