基于结构相似性的RDF数据聚类分割-论文.pdf

基于结构相似性的RDF数据聚类分割-论文.pdf

ID:53029314

大小:820.71 KB

页数:4页

时间:2020-04-14

基于结构相似性的RDF数据聚类分割-论文.pdf_第1页
基于结构相似性的RDF数据聚类分割-论文.pdf_第2页
基于结构相似性的RDF数据聚类分割-论文.pdf_第3页
基于结构相似性的RDF数据聚类分割-论文.pdf_第4页
资源描述:

《基于结构相似性的RDF数据聚类分割-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2015牟第6期文章编号:1009—2552(2015)06—0063-03DOI:10.13274/j.cnki.hdzj.2015.06.016基于结构相似性的RDF数据聚类分割冷泳林,鲁富宇(1.渤海大学信息科学与技术学院,辽宁锦州121001;2.渤海大学教务处,辽宁锦州121000)摘要:随着语义网的快速发展,RDF数据呈现出海量的增长特征,单机的RDF数据管理系统的可扩展性成为RDF数据发展的瓶颈,分布式的存储是解决这一难题的有效方法。而在数据的分布式存储中,数据分割是其中一个关键问题。文中根据RDF数据可以用有向图来描述特性,利用P—Ran

2、k基于结构的节点相似性度量方式计算图结点间的相似度,使用AP聚类算法对度量结果进行聚类,实现RDF数据的有效分割。实验结果表明,该方法能够有效地完成RDF数据的分割,使得类间相似度较小,而类内相似度较大。关键词:RDF;有向图;P—Rank;AP聚类中图分类号:TP311文献标识码:AClusteringpartitionofRDFbasedonstructuralsimilarityLENGYong.1in.LUFu.vu(1.SchoolofInformationScienceandTechnology,BohaiUniversity,Jinzhou

3、121001,LiaoningProvince,China;2.OficeofAcademicAfairs,BohaiUniversity,Jinzhon121000,LiaoningProvince,China)Abstract:Withtherapiddevelopmentofsemanticweb,RDFdatapresentthecharacteristicsofgrowthquickly.ThescalabilityofsingledatamanagementsystembecomesthebottleneckofdevelopmentofRD

4、Fdata.Distributedstorageisaneffectivemethodtosolvethisproblem.Thekeyofdistributedisdatapartition.Inthispaper,P—Rankalgorithmisusedtomeasurestructuresimilaritybetweennodes,themeasurementresultsareclusteredusingAPclusteringalgorithm,torealizetheeffectivepartitionofRDFdata.Theexperi

5、mentalresultsshowthat,thismethodcancompletetheRDFdatapartitioneffectively,makestheintra-clustersimilaritybesmaller,andthela~ertheinter—clustersimilarity.Keywords:RDF;directedgraph;P-Rank;APclustering0引言的元组上都有很高的性能,但随着RDF数据量规模RDF(ResourceDescriptionFramework)资源描述的不断扩大,将整个数据集存储在单个机

6、器上并要框架用于表达资源的元数据信息,如页面标题、作达到很高的访问性能已经不可能。因此,对RDF数者、摘要、修改时间等,RDF已经成为W3C的推荐据采用分布式组织存储,建立高效分布式的RDF数标准。RDF数据有两种表述方式,一种是使用元组据库处理系统变得越来越重要J。实现RDF数据的形式,该元组表示主的分布式存储需要解决的关键问题是根据某种策略语(subject)属性(predicate)的值是(object);第二种对RDF数据进行分割。由于RDF数据实质是一个表示形式是使用图的模式表示,每一个sub

7、ject和有向连接图,因此本文利用P—Rank(Penetratingobject都是图中的顶点,而predicate表示由subject收稿日期:2014—06—17指向object的有向边¨。基金项目:辽宁省自然科学基金(2013020014);中国高等职业技术目前对高性能的单机RDF数据管理系统,如教育研究会规划课题(GZYGH1213036;GZYGH1213035)Sesame、Jena、3store和RDFSuite等的研究已经取得作者简介:冷泳林(1978一),女,博士研究生,讲师,研究方向为大数据、数据库。了很大的进步,这些系统在处理数百

8、万甚至数十亿一63—Rank)基于结构的节点相似度度量方式计算图结点①如果两个对

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。