大规模语义数据的分析存储方案研究

大规模语义数据的分析存储方案研究

ID:35073139

大小:2.76 MB

页数:51页

时间:2019-03-17

大规模语义数据的分析存储方案研究_第1页
大规模语义数据的分析存储方案研究_第2页
大规模语义数据的分析存储方案研究_第3页
大规模语义数据的分析存储方案研究_第4页
大规模语义数据的分析存储方案研究_第5页
资源描述:

《大规模语义数据的分析存储方案研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、大规模语义数据的分析存储方案研究TheResearchofAnalysisandStorageonLarge-ScaleSemanticData学科专业:计算机科学与技术作者姓名:李致远指导教师:孙达志副教授天津大学计算机科学与技术学院二零一五年十一月摘要随着语义Web和LinkedData运动的发展,语义数据规模变得越来越庞大、涉及的领域也越来越宽广,并且有的数据集已经出现多个版本的演变,这就使得大规模语义数据的分析和存储面临着巨大的挑战。一方面,本体的规模增长和版本的更新需要一种简单有效的分析方法,帮助人们认识本体内部的变化情况,简化维护

2、和管理本体的过程。另一方面,语义数据海量的增长使得传统的基于HDD的存储策略的读写速度难以满足人们的需求,需要更加有效的存储策略提升原有数据存储系统的读写速度,进而满足RDF数据的快速存放和高效查询。本文首先提出一种基于本体指标的本体版本演变分析方法。该方法使用一种图结构转化规则,将本体的描述与公理转化为一张有向图,利用这张图的结构描述已有的Ontology层和Class层指标,并设计Property层上的4个指标。而后抽象出分析本体版本演变规律的过程,提出一个本体版本演变分析算法,选用版本更新较为完整的OpenGALEN和OpenCyc本体

3、作为数据集,对多个版本下的本体指标进行度量。同时,针对大规模RDF数据的存储提出了一种基于SSD和HDD的动态混合存储方案。在本方案中,首先分析系统中数据模型的生成和操作方式,将原有数据模型按照加载顺序分置在SSD和HDD之上,以支持数据的快速读写,而后采用改进的最近最少使用策略,结合数据模型原有的分片技术,周期性地扫描并将使用最少的数据模型置换出SSD,进而优化原有系统的I/O性能,最大限度的利用SSD和HDD的特性。通过分析和讨论实验结果,证明利用本体指标分析本体内部结构变化,能够发现本体指标变化所表现出的本体版本演变的规律,简化了人工观

4、察分析本体的过程。同时,在同等硬件和数据集的情况下,本文提出的混合存储策略具有良好的数据加载和查询性能,相比传统的单独存放于HDD的数据存储策略性能提高约20%到25%。关键词:本体指标,本体版本演变,RDF,混合存储IABSTRACTWiththedevelopmentoftheSemanticWebandLinked-Data,anincreasingnumberoflarge-scalesemanticdataarebeingdevelopedinvariousfields,whichmakeslarge-scalesemanticda

5、taanalysisandstoragebecomesdifficult.Ontheonehand,asthenumberofontologyincreases,weneedfindasimpleandeffectivewaytoanalyzingtheirevolution,simplifyingtheprocessofontologymaintenanceandontologymanagement.Ontheotherhand,themassivegrowthofsemanticdatarequiresmoreefficientstrat

6、egiestoenhancetheliteracyrateofthestoragesystem,andimplementtherapidRDFdatastorageandefficientquery.Inthispaper,inspiredbythestructuralfeaturesofontology,weproposeanapproachtoanalyzingtheontologyversioningevolutionbasedonontologymetrics.Basedonthetranslationrulesofgraphstru

7、cturetoanalyzeanddesignontologymetrics,presentedfourontologymetricsonOWLProperties.ThenproposedaanalysisalgorithmofontologyversioningevolutionanddidexperimentsusinglargeontologiesOpenGALENandOpenCyc.Meanwhile,weproposeaSSD/HDDdynamichybridstoragestrategyforlarge-scaleRDFdat

8、a,sothatweanalyzetheoperationofdatamodelandmakedatamodelsarestoredonSSDandHDDinloa

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。