空间数据挖掘及技术(综述)

空间数据挖掘及技术(综述)

ID:6148886

大小:256.00 KB

页数:33页

时间:2017-11-14

空间数据挖掘及技术(综述)_第1页
空间数据挖掘及技术(综述)_第2页
空间数据挖掘及技术(综述)_第3页
空间数据挖掘及技术(综述)_第4页
空间数据挖掘及技术(综述)_第5页
资源描述:

《空间数据挖掘及技术(综述)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、空间数据挖掘技术及应用中国地质大学(武汉)计算机学院空间数据挖掘技术及应用1.1空间数据挖掘的产生与发展1.2空间数据挖掘方法及应用1.3GIS中数据挖掘的过程1.4GIS与空间数据挖掘的集成模式1.5空间数据库挖掘的研究趋势1.1空间数据挖掘的产生与发展1.1.1空间数据挖掘的概念1.1.2空间数据挖掘的特点1.1.3空间数据挖掘的产生1.1.4空间数据挖掘的发展现状1.1.1空间数据挖掘的概念空间数据挖掘(SpatialDataMining,SDM),是指从空间数据库中提取隐含的、用户感兴趣的空间和非空间的模式和普遍特征、空间数据与非空间数据之间

2、的普遍关系的过程。1.1.2空间数据挖掘的特点与传统数据挖掘的不同:(1)传统数据挖掘处理的是数字和类别,而空间数据则是一些更为复杂的数据类型,例如:点、线、多边形等对象;(2)传统数据挖掘通常具有显式的输入,而空间数据挖掘的输入则常常是隐式的;(3)在传统数据挖掘中,有一个至关重要的前提假设:数据样品是独立生成的。而这一假设在空间分析中是不成立的。事实上,空间数据之间是高度自关联的。1.1.3空间数据挖掘的产生产生空间数据挖掘的推动力:(1)空间信息正在逐步成为各种信息系统的主体和基础。它有着比一般关系数据库和事务数据库更加丰富和复杂的语义信息,包

3、含着更丰富的知识。(2)在地学领域,随着卫星和遥感技术的广泛应用,日益丰富的空间和非空间数据收集和存储在大空间数据库中,海量的地理数据在一定程度上已经超过了人们处理能力,同时传统地学分析难以胜任从这些海量的数据中提取和发现地学知识。因此,迫切需要增强GIS分析功能,提高GIS解决地学问题的能力。数据挖掘与知识发现的出现很好地满足了地球空间数据处理的需要,推动了传统地学空间分析的发展。1.1.4空间数据挖掘的发展现状武汉大学李德仁教授最早(1994年)关注到从GIS数据库中发现知识的问题,提出从GIS数据库可以发现包括普遍的几何知识、空间分布规律、空间

4、关联规则、空间聚类规则、空间特征规则、空间区分规则、空间演变规则和面向对象的知识。目前,国际上最著名且有代表性的通用SDM系统有:GeoMiner,Descartes和ArcViewGIS的S_PLUS接口。以上SDM系统的共同优点是把传统DM与地图可视化结合起来,提供聚类、分类等多种挖掘模式,但它们在空间数据的操作上实现方式不尽相同。Descartes是专门的空间数据可视化工具,它和DM工具Kepler两者联合在一起才能完成SDM任务。GeoMiner是在MapInfo平台上进行二次开发而成,系统庞大,造成较大的资源浪费。S_PLUS的局限在于,它

5、是用一种解释性语言(Script),功能的实现比用C和C++直接实现要慢得多,所以只能使用于非常小的数据库应用。1.2空间数据挖掘方法及应用1.2.1空间关联分析1.2.2聚类分析1.2.3分类方法1.2.4统计方法1.2.5趋势分析1.2.1空间关联分析即空间关联规则发现:形式:A=》B[s%,c%]A和B是空间和非空间谓词的集合,s%表示规则的支持度,c%表示规则的可信度。例:is_a(X,”school”)∧close_to(X,”sports_center”)=>close_to(X,”park”)[0.5%,80%]此规则表明80%靠近体育

6、中心的学校同时也靠近公园,并且有0.5%的数据符合这一规则。构成空间关联规则的谓词:距离信息:close_to(临近)、far_away(远离)拓扑关系:intersect(交)、overlap(重叠)、disjoin(分离)空间方位:left_of(左边)、west_of(西部)空间关联规则的挖掘需要在大量的空间对象中计算多种空间关系,代价极高。所以应采用逐步求精的挖掘优化方法(Koperski):(1)通过空间查询从初始空间数据库中获得和任务相关的空间数据库;(2)使用一些有效空间挖掘算法计算对象之间的空间联接,从而获得一个候选谓词集合;(3)对

7、(2)中所得到的谓词集合中的每一个谓词计算其支持度,并且将那些支持度小于最小支持度的谓词删除;(4)对谓词集合进行进一步精化以决定准确的空间关系;(5)以(4)所得的候选集作为输入,生成空间关联规则。前期采用的粗略挖掘算法必须满足超级覆盖特性(supersetcoverageproperty):即它保持了潜在的答案。允许假正测试(falsepositivetest),即可以包括一些不属于结果集的数据集;不允许假负测试(falsenegativetest),即不能排除一些潜在的答案。例如,挖掘与空间谓词close_to有关的空间关联规则:(1)使用一定

8、的近似空间计算算法:如用最小边界矩形结构(仅涉及两个空间点);(2)计算放宽后的空间谓词,如g_close_

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。