空间数据挖掘

空间数据挖掘

ID:22342354

大小:62.24 KB

页数:11页

时间:2018-10-28

空间数据挖掘_第1页
空间数据挖掘_第2页
空间数据挖掘_第3页
空间数据挖掘_第4页
空间数据挖掘_第5页
资源描述:

《空间数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、空间数据挖掘技术与算法作者:周桐学号:09012117指导老师:王芸完成时间:2014年10月17日11【内容摘要】空间数据具有海量、非线性、多尺度、高维和模糊性等复杂性特点,空间数据挖掘技术是对空间数据中非显性的知识、空间关系等模式的自动提取。空间数据挖掘是数据挖掘与空间数据库相结合的产物,由于空间数据的复杂性特点使得空间数据挖掘比一般数据挖掘要复杂得多。本文从挖掘任务和挖掘方法的角度,阐述了空间数据挖掘研究的背景及意义,空间数据挖掘与经典数据挖掘的区别,重点介绍了用于空间多维位置相关规则的挖掘算法SMARBIA。【关键词】空间数据空间规则空间趋势预测SMARM模型SMA

2、RBIA算法【正文】一、空间数据挖掘简介1、背景介绍随着空间信息获取技术的快速发展,空间信息爆炸性增长与空间知识贫乏的矛盾日益突出。如何从海量的空间数据中提取出人们感兴趣的模式、模型,进而将其变为有用的信息和知识已成为科学家们研究的重点。空间数据挖掘就是针对"空间数据爆炸但知识贫乏"这一现象而提出的。空间数据挖掘是在空间数据库的基础上,综合利用统计学方法、模式识别技术、人工智能方法、神经网络技术、模糊数学、机器学习、专家系统和相关信息技术等,按照一定的度量值和临界值抽取空间知识及与之相关的预处理、空间抽样和数据变换的一个多步骤相互链接、反复进行的人机交互过程。可以归纳为数据

3、准备(了解应用领域的先验知识、生成目标数据集、数据清理、数据简化与投影)、数据挖掘和知识发现(数据挖掘功能和算法的选取,在空间的关联、特征、分类、回归、聚类、函数依赖等特定的规则中搜索感兴趣的知识)以及数据挖掘后处理(知识的解释、评价和应用)三部分。目前国内外对空间数据挖掘技术无论是在理论研究、相关软件原型的研制方面,还是在理论方法的应用示范等方面都有了很大的发展,并取得了一定成果。2、空间数据挖掘的定义空间数据挖掘是指从空间数据中抽取隐含的知识、空间关系或非显式地存储在空间数据中的其他模式。它可以用来理解或重组空间数据,发现空间和非空间的数据间的关系,构建空间知识库,优化

4、查询等。3、空间数据挖掘与经典数据挖掘的区别(1)11空间数据比经典数据复杂。空间数据包含扩展的对象,如点、线、面等。有着比一般关系数据库和事务数据库更加丰富和复杂的语义信息,包含着更丰富的知识。空间数据包含空间属性和非空间属性。空间属性用来描述空间特征,包括经纬度、实体形状、空间方位关系等;非空间属性描述非空间特征,包括地名、人口、温度、气压等。(1)空间数据存在于连续的数据空间,而经典数据通常都是离散的。(2)空间模式是基于局部的,而传统的模式是基于全局的。(3)空间关系是不明确的,如叠加、相交等拓扑关系,东、西、南、北等方位关系。经典数据关系是明确的,如数学关系、逻辑

5、关系等。(4)空间数据存在空间自相关。空间对象的观察不是独立的,空间特征存在空间自相关,地理学家把它作为第一定律:每件事物都与其他事物相关,但近邻事物间的相关性比距离较远的事物的相关性要大得多。经典数据分析通常假设数据采样是独立的,但在空间数据中是不成立的。(5)空间数据是海量的。空间数据库中存储的数据具有多源、多维、时态性的特点。(6)空间数据存储与存取的复杂性。空间对象用空间数据类型和对象的空间关系表示;空间数据库有许多不同于关系数据库的特征。一、空间数据挖掘技术的主要方法1.基于概率论的方法这是一种通过计算不确定性属性的概率来挖掘空间知识的方法,所发现的知识通常被表示

6、成给定条件下某一假设为真的条件概率。在用误差矩阵描述遥感分类结果的不确定性时,可以用这种条件概率作为背景知识来表示不确定性的置信度。2.空间分析方法指采用综合属性数据分析、拓扑分析、缓冲区分析、密度分析、距离分析、叠置分析、网络分析、地形分析、趋势面分析、预测分析等在内的分析模型和方法,用以发现目标在空间上的相连、相邻和共生等关联规则,或挖掘出目标之间的最短路径、最优路径等知识。目前常用的空间分析方法包括探测性的数据分析、空间相邻关系挖掘算法、探测性空间分析方法、探测性归纳学习方法、图像分析方法等。3.统计分析方法指利用空间对象的有限信息和/或不确定性信息进行统计分析,进而

7、评估、预测空间对象属性的特征、统计规律等知识的方法。它主要运用空间自协方差结构、变异函数或与其相关的自协变量或局部变量值的相似程度实现包含不确定性的空间数据挖掘。4.归纳学习方法即在一定的知识背景下,对数据进行概括和综合,在空间数据库(数据仓库)中搜索和挖掘一般的规则和模式的方法。归纳学习的算法很多,如由Quinlan提出的著名的C5.0决策树算法、HanJiawei教授等提出的面向属性的归纳方法、裴健等人提出的基于空间属性的归纳方法等。5.空间关联规则挖掘方法11即在空间数据库(数据仓库)中搜索和挖掘空间对象(及

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。