欢迎来到天天文库
浏览记录
ID:53028889
大小:409.99 KB
页数:7页
时间:2020-04-14
《基于并行计算的空间co-location模式挖掘-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、云南师范大学学报(自然科学版)JournalofYunnanNormalUniversity2015年7月35卷4期(Vol_35No.4)DOI:10.7699/j.ynnu.rlS一2015—053基于并行计算的空间co-location模式挖掘和凤珍,贾志洋,张丹丹(云南大学旅游文化学院,云南丽江674100)摘要:提出适合并行计算的空间数据分区算法,并在此基础上提出基于并行计算的空间co-lo—cation挖掘算法.在三类数据集上做了大量的实验.实验结果表明,基于并行计算的算法在很大程度上提高了挖掘的效率,为进行空间大数据的挖掘提供了有效且快速的方法.
2、关键词:空间co-location模式挖掘;数据分区;并行计算;并行算法中图分类号:TP311.13文献标志码:A文章编号:1007—9793(2015)04~0056—07空间CO—location模式挖掘可以应用在很多浪费很多的时间.为了确保划分的高效性,提出基领域中_1],它是从空间数据库中发现实例频繁关于中位数的横中轴划分与纵中轴划分两种.联的模式的过程,这些模式是一组空问特征的子定义1(横中轴线/纵中轴线)过实例集Y坐标集.目前,空间CO—location模式挖掘算法都是串的中位数且平行于x轴的线段称为横中轴线;相行的数据挖掘方法¨4.本文主要研究基
3、于并行应的过X轴的中位数且平行于Y轴的中轴线称为计算l】]的空间CO—location模式挖掘.纵中轴线.定义2(左区/右区)把空间数据分成实例数相1空间数据分区等的左右两个分块.左边由左边界到横中轴线向右平移d/2(为邻近关系R的距离阈值)的区域在并行数据挖掘中,为了提高挖掘效率,数据组成,并称之为左区,简记D;右边由横中轴线向需要合理分割,否则会因处理机等待而影响算法左平移d/2到右边界的区域组成,并称之为右区,执行的效率.中位数是一组数据中最中间的那一简记D,.个,按照实例集横坐标或纵坐标的中位数对数据基于中轴线的划分法:①求出空间数据集X进行分割就可以
4、保证负载的均衡.基于距离的空轴坐标的中位数;②求出空间数据集Y轴坐标的间CO—location模式挖掘方法就是挖掘出满足邻中位数;③求出左右距纵中轴线均为d/2的区域近关系R的CO—location模式l5J,但在基于中位数内的实例数();④求出上下距横中轴线均为的划分中有些满足邻近关系R的模式会分割到d/2区域内的实例数();⑤如果大于,则横不同的区域,从而导致结果不具备完整性.为了避中轴划分数据,否则纵中轴划分数据.免这种情况,在分割空间数据时,区与区之间划出纵中轴划分:由纵中轴线把实例空间分为左距离为距离阈值的一半(d/2)的交叉区域.这样区与右区的划分
5、称为纵中轴划分,如图l所示.横保证了模式实例的不丢失,但中位数两边距离阈中轴划分:由横中轴线把实例空间分为上区与下值的一半(d/2)的距离内的实例就会出现重复计区的划分称为横中轴划分,如图2所示.算的情况,如果中位数的两边实例分布很稠密会*收稿日期:2014—1124基金项目:国家自然科学基金资助项目(F020508);云南省教育厅科学研究基金重点资助项目(2012Z143C)作者简介:和风珍(1988),女,云南丽江人,硕士研究生,助教,主要从事空间数据挖掘与分析方面研究.通信作者:和风珍.第4期和风珍,等:基于并行计算的空间co-location模式挖掘·
6、57·yy图1纵中轴划分图图2横中轴划分图Fig.1MidverticalaxispartitiongraphFig.2Midhorizonta1axispartitiongraph基于以上分析,数据分区算法设计如下:算法1:数据划分(divdomain)算法2并行CO—location模式挖掘算法输入:2.1并行计算机处理机互连方式空间特征集合:featureSet[];空间实例集采用TCP/IP通信协议来实现主机与辅机之合:escampleSetEra3.,一输出:D(D-一),D(D).一问的通信.其中,主机采用服务器端编程方式,而辅机采用客户端编程的方
7、式.变量:一.:2.1.1服务器端编程,:实例集z坐标的集合;I:实例集坐标的一.~一为了使用TCP/IP来实现各主机间的通信,集合;X:实例集z坐标的中位数;y:实例集y使用C#编程时,引用了TCP/IP通信接口类。..坐标的中位数;m.:.37轴方向上的中位数左右d“...一一usingSystem.Net.Sockets”.服务器端编程包距离内的实例数;:.轴方向上的中位数上下括以下步骤:定义相关变量;定义监听函数;启动d距离内的实一例。.数;D.(D.:)~一一:左(上)区;监听程序;接收并处理客户端信息.D,(D):右(下)区;dis—thresho
8、ld:距离阈值.2.1.2客户端编程。
此文档下载收益归作者所有