空间数据挖掘的常用方法

空间数据挖掘的常用方法

ID:5859284

大小:29.50 KB

页数:2页

时间:2017-12-26

空间数据挖掘的常用方法_第1页
空间数据挖掘的常用方法_第2页
资源描述:

《空间数据挖掘的常用方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、4.1  空间分析方法空间分析是指利用GIS的各种空间分析模型和空间操作对空间数据库中的数据进行深加工,从而产生新的信息和知识,其结果取决于被分析对象的位置,可采用拓扑结构分析、空间缓冲区及距离分析、叠置分析等方法,旨在发现目标在空间上的相连、相邻和共生等关联关系。这些技术不仅需要获取对象的位置,还需要知道对象的属性。GIS数据库中的空间数据提供了空间分析所需要的位置,非空间数据提供了对象的属性数据,因此GIS数据库提供了空间分析所需要的各种数据,可以进行空间分析。空间分析的主要目的是从空间关系中开发数据,以得到空间的内部关系并加以理解。例如空间分析中的探测性空间分析方法不仅可以

2、揭示空间数据库中许多非直观的内容,如空间异常点、层次关系、时域变化及空间交互模型,还可以揭示用传统的地图不能辨明的数据模式和趋势。为了达到此目的,空间分析应利用和开发GIS及其数字环境。在这种数字环境中,数据的比例尺寸能够很方便地改变,能放下层次间的不连续性,还能将不同的数据媒介如文字、声音、图形和影像联结在一起。此外,数字环境要能提供物体间更广泛的联系,因为地图上只是表明了物体空间上的接近及邻近关系,而不能提供物体间的相互作用,以及文化、贸易和社会网络的联系。在面向对象的环境中,属性和空间数据统一在一个对象中存储和管理,以上这些想法相对而言更易于实现。从现实来看,地理位置与地形

3、、土壤、植被及气候等要素是紧密相关的,相互制约的。所以说属性与空间数据是一对矛盾统一体,如果能找到属性形成与空间分布的对应关系,那么若已知某一对象的属性则可知道其相应的空间分布,若已知其空间分布情况,则也可以根据其对应关系知道其相应的属性。4.2  统计的方法统计的方法一直是DM中最主要的方法,有着较强的理论基础,拥有大量的算法,可有效地处理数字型数据,在AI领域的关系数据库中它已经得到了充分的利用,它还可以用于空间数据库中。这类方法有时需要数据满足统计不相关假设,但很多情况下这种假设在空间数据库中难以满足,另外,统计方法还难以处理字符型数据。应用统计方法需要有领域知识和统计知识

4、,一般由具有统计经验的领域专家来完成。如在遥感影像分析中,对影像进行监督分类和非监督分类,都是利用统计的方法得出影像模式后,再按此模式对影像分类。实际上,遥感影像的计算机自动分类也可算是较简单的DM过程,只是其数据为一些以栅格方式存储的影像数据,而不是像关系数据库中的数据那样以关系元组的方式存储。4.3  归纳和演绎的方法归纳方法是一种逻辑方法,是从数据库中获取知识的最基本的方法,即从多个已存在的事实中归纳出规则。在GIS中,无论是属性数据还是空间拓扑关系,若进行抽象和概括时,均可用到此方法。大部分算法归纳学习的算法来源于机器学习领域,有很多算法:如Michaski等的AQ11、

5、AQ15,洪家荣等的AE1、AE9,lHunt的CLS,Quinlan的ID3、C5.0等,其中最著名的是Quinlan提出的C5.0决策树算法。归纳法一般需要背景知识,常以概念树的形式给出。在GIS数据库中,可有属性概念树和空间关系概念树两类。背景知识由用户提供,在有些情况下也可以作为知识发现任务的一部分自动获取。如在对游牧民族地区草资源调查中,通过相邻分析,便可归纳出只要有蒙古包,其周围都有草地,且附近必有淡水湖泊。这样的规则完全可以从GIS数据库中发现,并用于以后的遥感调查和建立新的GIS。4.4  聚类与分类的方法聚类和分类方法按一定的距离或相似性系数将数据分成一系列相互

6、区分的组。分类和聚类都是对目标进行空间划分,划分的标准是类内差别最小而类间差别最大。分类和聚类的区别在于分类事先知道类别数和各类的典型特征,而聚类则事先不知道。聚类分析方法按一定的距离或相似性测度将数据分成一系列相互区分的组,它与归纳法不同之处在于不需要背景知识而直接发现一些有意义的结构与模式。经典统计学中的聚类分析方法对属性数据库中的大数据量存在速度慢、效率低的问题,对图形数据库应发展空间聚类方法。常用的经典聚类方法有Kmean、Kmeriod和ISODATA等。4.5  探测性的数据分析李德仁、邸凯昌等提出的探测性的数据分析,简称EDA,采用动态统计图形和动态链接窗口技术将数

7、据及其统计特征显示出来,可发现数据中非直观的数据特征及异常数据。EDA与空间分析相结合,构成探测性的空间分析(简称ESA)。EDA和ESA技术在知识发现中用于选取感兴趣的数据子集,即数据聚焦,并可初步发现隐含在数据中的某些特征和规律。4.6  粗集(Rough集)方法粗集理论是波兰华沙大学Z.Pawlak教授在1982年提出的一种智能数据决策分析工具,被广泛研究并应用于不精确、不确定、不完全的信息的分类分析和知识获取。粗集理论为GIS的属性分析和知识发现开辟了一条新途径,可用于G

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。