基于rdf的云制造资源数据存储及检索方法的研究与实现

基于rdf的云制造资源数据存储及检索方法的研究与实现

ID:33676669

大小:5.08 MB

页数:51页

时间:2019-02-28

基于rdf的云制造资源数据存储及检索方法的研究与实现_第1页
基于rdf的云制造资源数据存储及检索方法的研究与实现_第2页
基于rdf的云制造资源数据存储及检索方法的研究与实现_第3页
基于rdf的云制造资源数据存储及检索方法的研究与实现_第4页
基于rdf的云制造资源数据存储及检索方法的研究与实现_第5页
资源描述:

《基于rdf的云制造资源数据存储及检索方法的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、于以上两点,需要把企业提供的制造业资源数据进行规范化,首先建立领域内本体,各个企业的数据依照该本体使用RDF来进行描述,这样不仅为制造业内杂乱的数据提供了统一的描述标准,而且使用RDF来描述数据,可以对数据进行基于语义的查询。本文研究内容包括RDF数据在HBase中的存储方案,一个好的存储方案有利于数据的管理,有利于数据的更新,同时能够为上层的查询方案提供更好的支持。利用SPARQL搜索HBase中制造资源数据的查询逻辑以及SPARQL查询的语义扩充,一个好的查询方案可以提高信息检索的效率,减少用户的等待时间,而语义扩充可以允许

2、用户输入较模糊的关键词却得到完善的检索信息。结合HADOOP平台下的MapReduee算法实现HBase的并行查询以及HBase中数据上层索引机制的建立,这两者的研究都是为了提高查询效率,使应用平台的用户拥有更好的用户体验。1.3国内外相关工作研究现状1.3.1关于RDF数据存储的研究当前对RDF数据存储的研究主要集中于使用不同类型的数据库对RDF进行存储,以及在该类数据库中采用怎样的表格式存储RDF数据。目前研究主要集中于使用三类数据库进行RDF的存储,分别为关系型数据库,NOSQL数据库以及面向对象的数据库,在下面的三节中将

3、对其进行介绍。1.3.1.1RDF数据在关系数据库中的存储Lilix【l】,Dass【21提出使用关系型数据库存储RDF数据,为了解决RDF数据的半结构化特性,在关系型数据库中往往使用多表分级结构来进行RDF的存储。在当前研究中主要提出了使用关系数据库存储RDF数据的四套方案:1)三元组存储方案。2)垂直存储方案。3)平行存储方案。4)模式生成存储方案。三元组存储方案是指RDF数据以三元组表示,在表中设置三列,-N依次为主语,属性,属性值,将RDF三元组按照顺序依次填入其中。使用三元组存储方案优势是可以只使用一张表存储所有的RD

4、F三元组,不必分成多张表,从而不用进行复杂的表连接操作。但同时由于RDF三元组存在大量的同一主语对应某一属性有多个属性值的情况,因此该模式会产生数量巨大的冗余列,既浪费存储空间,又影响查询效率。垂直存储方案是依据属性名对三元组进行划分,将拥有相同属性名的三元组存储到同一张表中,每个表中设置两列,一列存放主语,-Yd存放属性值。由于一个领域内本体一般拥有十至二十个属性名,则将数据全部放入数据库后将建立数十张表,查询时表与表之间大量的连接操作将会影响到查询效率。水平存储方案是将垂直存储方案依照关键字进行内联,从而形成一张表,这种表结

5、构存在大量空值,极大的浪费存储资源。模式生成存储方案是对水平表进行混合切分,可以垂直切分,可以水平切分,形成多个表,这样切分后的各个表内空值较少。由于制造业内数据本身的杂乱无序特性,模式生成的方案将会十分复杂。综上,使用关系型数据库存储RDF数据,虽然由于关系数据库本身已经十分完善的索引机制对查询效率有所帮助,但总体来说会造成存储资源的较大浪费,更由于制造业资源数据规模较为庞大,不适合使用不易于扩展的关系型数据库进行存储。1.3.1.2RDF数据在NOSQL数据库中的存储AbrahamJ【3J提出了使用HBase存储RDF数据,

6、并给出了三表的存储方案即:ToP表,TsP表,Tps表。其中ToP表以RDF三元组中的属性值为RowKey,以属性作为列名,以主语作为cell中的值;TsP表以主语作为RowKey,以属性作为列名,以属性值作为cell中的值;TPs表以属性作为RowKey,以主语作为列名,以属性值作为cell中的值。FrankeC【4J改进了HBase的存储方案,由于TSP表中由属性作为RowKey,由主语作为列名,因此会造成一张表只有十几行,但却包含大量列的情况。由此提出了使用两表模式来存储RDF数据,即ToP表与TsP表,放弃使用TPs表。

7、FrankeCtl】在研究中使用LUBM标准数据集生成十个大小不同的数据集,并使用LUBM提供的14个标准SPARQL查询,对使用HBase进行RDF数据的存储与使用Mysql进行RDF数据的存储进行了对比试验,实验结果表明,对于大部分查询,HBase的效率要高于Mysql。另外,RozsnyaiSE51,Mi-YoungC【61,vonderWeth[7】Konstantinou,i[81均提出了使用NOSQL数据库来进行RDF数据的管理。本文所研究的存储方案就是在上文提到的存储方案基础之上进行改进优化,使其更适合于制造业资源

8、数据的存储。1.3.1.3RDF数据在面向对象数据库中的存储Batzios“9】提出了使用面向对象数据库来存储RDF数据,其提出一种面向对象的存储系统—d_b40WL,在db40WL中,存储的不再是RDF的三元组格式,而是将整个图直接放入数据库中,存入的元素包括

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。