欢迎来到天天文库
浏览记录
ID:31368692
大小:109.00 KB
页数:7页
时间:2019-01-09
《时空同现挖掘算法及应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、时空同现挖掘算法及应用研究 摘要:在隐藏于历史轨迹数据集的众多模式中,同现模式的挖掘尤其引人关注。文章将时空同现的数据挖掘算法与Hadoop平台相结合,实现了并行处理,对轨迹数据进行预处理,并设计了时空同现模式挖掘算法。实验结果表明,该算法能够挖掘乘客集中地,为出租车司机提供合理有效的载客路径。 关键词:时空同现;并行处理;出租车轨迹数据;数据挖掘 中图分类号:TP311文献标志码:A文章编号:1006-8228(2016)11-05-02 Spatiotemporalco-occurrenceminingalgorithmandtheapplication ZhangYi1,Zha
2、ngYongmei2,GuoSha2,JiangAilian3,WuXiaoyan2 (1.CollegeofSoftware,TaiyuanUniversityofTechnology,Shanxi,Taiyuan030600,China;2.CollegeofComputer,NorthChinaUniversityofTechnology;3.CollegeofComputerScienceandTechnology,TaiyuanUniversityofTechnology) Abstract:Amongthemanymodeshiddeninthehistoricaltrajec
3、torydataset,miningtheco-occurrencemodesisparticularlyconcerned.Inthispaper,combiningthe7spatiotemporalco-occurrencedataminingalgorithmwithHadoopplatform,theparallelprocessingisrealizedtopre-processthetrajectorydata,andthespatiotemporalco-occurrenceminingalgorithmisdesigned.Theexperimentresultsshowth
4、atthealgorithmcanminingconcentratedareasofpassengers,andprovidereasonableandeffectivepathsfortaxidrivers. Keywords:spatiotemporalco-occurrence;parallelprocessing;taxitrajectorydata;datamining 0引言 时空同现模式就是在时空维度下,不同对象类型子集的实例在一些时间段内,在空间上是相互邻近的,或符合某种空间关系的对象集合。在许多应用领域如:环境监测、抢险救灾、基于位置的服务等,数据都随着时间变化而变化。
5、然而,大多数数据库都不能有效地处理数据的时间维度。当数据发生变化时,无法对数据变化的趋势进行分析,更无法预测未来的趋势。因此,从这些大量的数据中挖掘出有价值的信息变得更加重要,时空同现模式挖掘成为研究热点。 随着移动电话、GPS(GlobalPositioning7System,全球定位系统)等具备定位功能的设备普及,产生了大量基于时间和空间的移动对象历史轨迹数据。在地理信息系统中,移动对象的历史位置信息日益重要,在这一背景下,针对移动对象历史轨迹的数据挖掘研究成为当前研究热点之一[1-2]。与传统事务性数据集相比,从空间数据集中识别感兴趣的模式更为困难和复杂,因为空间数据集具有复杂的数据类
6、型和关系,而且数据总量庞大。在隐藏于历史轨迹数据集的众多模式中,同现模式的挖掘尤其引人关注。空间数据集的同现模式直观地反映了移动过程中移动对象之间相互接触的情况,所以快速准确地挖掘时空数据中的同现模式有利于推动众多领域的研究,如生态、电力系统故障分析、军事等。 虽然时空同现模式挖掘已经取得了一些令人欣慰的研究成果,但总体来说还处于起步阶段。随着空间数据采集效率的提高,空间数据逐渐增大。在时空同现模式挖掘研究领域中,MeteCelik等人提出的混合驱动的时空同现模式挖掘最具有代表性。为了挖掘时空同现模式,他们提出了混合时空同现模式挖掘算法。该挖掘算法是基于连接操作的,会消耗大量时间生成候选模式
7、集,随着对象类型的增多,需要生成的候选模式集数量呈指数级增长,这意味着需要消耗的计算时间迅速增长,计算效率无法随着对象类型的增加而迅速增长,不能处理庞大的时空数据;同时该算法是基于内存的,无法处理大量时空数据[3-5]。本文对出租车轨迹数据进行分析与挖掘,将时空同现的数据挖掘算法与Hadoop平台相结合,可以有效解决数据存储和运行慢的问题,同时又能高效获取潜在信息。 1时空同现挖掘算法的设计及实
此文档下载收益归作者所有