基于周期表的时空关联规则挖掘方法与实验

基于周期表的时空关联规则挖掘方法与实验

ID:32371720

大小:1.95 MB

页数:10页

时间:2019-02-03

基于周期表的时空关联规则挖掘方法与实验_第1页
基于周期表的时空关联规则挖掘方法与实验_第2页
基于周期表的时空关联规则挖掘方法与实验_第3页
基于周期表的时空关联规则挖掘方法与实验_第4页
基于周期表的时空关联规则挖掘方法与实验_第5页
资源描述:

《基于周期表的时空关联规则挖掘方法与实验》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第13卷第4期地球信息科学学报Vol13,No42011年8月JOURNALOFGEO-INFORMATIONSCIENCEAug,2011基于周期表的时空关联规则挖掘方法与实验1,211柴思跃,苏奋振,周成虎(1中国科学院地理科学与资源研究所资源与信息系统国家重点实验室,北京100101;2中国科学院研究生院,北京100049)摘要:地理现象的周期性往往掩盖了许多地学规律,这也是地学数据挖掘的一个主要内容。本文以周期表设计了一种时空层次关联规则挖掘方法PRules-Miner。模型利用周期表的表现形式

2、对时空数据进行组织,并通过两步挖掘过程发现具有遥相关地理事物间的变化模式。模型算法分为3个步骤:(1)过滤周期表内无序数据:逐行地提取多周期内时空状态的频繁项,生成新的时空频繁状态表;(2)基于向下闭合引理,对时空频繁状态表中的对象进行时空拓扑匹配,得到时空关联规则候选集;(3)对于候选数据集进行时空拓扑验证,得到时空关联规则集。为证明模型算法的可靠性,应用PO.DAAC提供的20年AVHRRProduct016海表面温度遥感反演数据集和国家气象科学院提供的南京地区降水逐日数据资料,研究大洋暖池与南京降水间的时空关

3、联规则。实践表明,这种挖掘方法具有以下特点:(1)算法基于面向对象思想,对地理对象状态进行独立描述。因此,所得时空关联规则与时空粒度无关,并能够挖掘出时空粒度不一致的地物间的关联关系。(2)算法使用笛卡尔积得到在时空拓扑阈值内匹配的时空候选集,并可以发现时域、空域均不邻接的事物间的时空关联规则,即时延不确定的地理现象的相互关联。关键词:数据挖掘;关联规则;时空数据;层次挖掘;周期表DOI:103724/SPJ10472011004551引言时空关联规则中,时间是首先被考虑的问题。这里引用Li等文中的实例来证

4、明时间对于规则的时空数据是地理现象在时空维度上的采样,包重要性。存在煎蛋咖啡(支持度=3%,置信度含时间、空间、属性3个基本特征,是地理信息系统=80%)的规则,这说明3%的消费者同时购买煎蛋(GIS)的基本成分。由于缺少强有力的数据处理工和咖啡,并且买了煎蛋的消费者中有80%的人同时具理解历史数据,近年来遥感和GIS技术的广泛使购买了咖啡。然而,在现实数据中,煎蛋咖啡用所积累的大量时空数据并不能被现有GIS系统消费模式大部分出现在早上7点至上午11点的时有效利用,因此,数据挖掘技术被引入到地理学领间段内。在

5、这段时间内,规则具有40%以上的支持域,旨在从海量地学数据中发现其中隐含的模式与度。然而在其他时间段,该规则的支持度小于[3]知识。关联规则挖掘作为数据挖掘技术的重要组0005%。可以看出,时间范围的界定有助于提成部分,从地理数据向真实世界反馈IF-THEN形高规则被发现的概率。同理,空间范围在规则挖掘式的知识。而时空关联规则挖掘,是关联规则的子中同样具有限定功能。领域,能够寻找包含了时间-空间拓扑关系的关联规然而,现有关联规则挖掘方法大都将时间数据则。规则形如生活在加拿大西北部的驯鹿群大部与空间数据割裂开进行处

6、理,这些方法或只能挖掘[1]分时间不迁徙,仅在一定区域内活动,规则也可序列规则或只局限于利用事物空间关系挖掘静态形如若台湾东北部海域的盐度从015psu上升至空间关联,对于时空关联规则却无能为力。目前,025psu,则下个月台湾东北部海域的海水温度将对于统一时间与空间维度的联合数据挖掘方法的[2][4-7]从0上升至12。时空关联规则的表述是研究尚不成熟。多样的,其复杂性由现实世界中已知的或所需的知另一方面,在地理现象中,存在具有远距离相识所决定。互关联的模式。尤其是大气科学中,遥相关收稿日期:20

7、10-11-16;修回日期:2011-06-07.作者简介:柴思跃(1985-),男,北京人,硕士,研究方向:时空数据挖掘。E-mail:chaisy@lreis.ac.cn456地球信息科学学报2011年(Teleconnection)被定义为描述不同地区间大气异则挖掘,大都考虑局限于利用Allen提出的时间拓[21]常环流的相关的概念(反相位或同相位),是大气环扑关系作为挖掘约束条件。时间规则挖掘算法[8]流的重要模态之一。例如,厄尔尼诺与南方涛动中,Ozden等利用事物的周期

8、重复特点设计的周期之间存在典型的遥相关关系。因此,广义角度上,表挖掘方法可以显著提升规则支持度,从而发现更[3,22-23]遥相关是存在一定距离的地物间可能存在的系隐蔽的规则,例如,规则购买火鸡的顾客会[9]统性相关关系。同时购买南瓜饼会出现于11月80%的天数中。目前,在数据挖掘领域,对于这类具有遥相空间关联规则挖掘研

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。