资源描述:
《矢量空间数据库中关联规则的挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第24卷第8期计算机应用Vol.24No.82004年8月ComputerApplicationsAug.2004文章编号:1001-9081(2004)08-0047-03矢量空间数据库中关联规则的挖掘算法研究1,221厍向阳,许五弟,薛惠锋(1.西北工业大学自动化学院,陕西西安710072;2.西安建筑科技大学建筑勘测研究所,陕西西安710055)(xiangyangshe@sohu.com)摘 要:按照矢量空间数据的特点和空间数据挖掘的要求,以GIS的空间分析和空间数据处理为工具,探讨了矢量空间数据库中关联规则挖掘的数据处理方法,提出了关联规则的挖掘算法。最后,通过
2、实例进行了验证。关键词:矢量数据模型;GIS;空间数据挖掘;关联规则中图分类号:TP393.3文献标识码:AMiningalgorithmsforassociationrulesinspatialdatabaseofvectordatamodel1,221SHEXiang2yang,XUWu2di,XUEHui2feng(1.CollegeofAutomation,NorthwestPolytechnicUniversity,Xi’anShaanxi710072,China;2.InstituteofSurveyingandMapping,Xi’anUniversityo
3、fArchitecture&Technology,Xi’anShaanxi710055,China)Abstract:Accordingtofeaturesofvectorspatialdataandthedemandofspatialdatamining,thedataprocessingmethodandminingalgorithmofassociationrulesinvectorspatialdatabasewereproposed,byspatialanalysisandspatialdatamanagementinGIS.Experimentsverifie
4、ditseffect.Keywords:vectordatamodel;GIS;spatialdatamining;associationrules[3~6]内外已展开了相应的研究工作。在矢量空间数据库中,0 引言把空间对象抽象为点、线和多边形这三种类型,每个空间对象在当前空间数据挖掘和知识发现领域,存在着如下倾向:代表的空间区域或空间范围是不同的,假设3)与此不符。本1)忽视了GIS在空间知识发现过程中的作用。GIS是空间数文以矢量空间数据库为数据挖掘对象,以GIS的空间数据处据采集、管理、处理、分析、建模和可视化的工具。空间数据处理和空间分析为工具,首先探讨了空间知识
5、发现过程中的数理、空间分析是GIS特有的功能。尽管人们研究和建立空间据选择、预处理和转换方法;其次,提出了矢量空间数据库中数据库的初衷与空间数据挖掘的目标截然不同,但是在空间关联规则的挖掘算法;最后以某一地区生态空间数据库为例,知识发现的过程中,同样需要GIS和空间数据库技术的支挖掘与土壤侵蚀相关的关联规则。持。2)大多数空间据挖掘算法是由一般数据挖掘算法直接移植过来的,未考虑空间数据存储、处理及数据本身的特点。不1 面向空间数据挖掘的数据准备同于关系数据库,空间数据带有拓扑、方向和距离等空间信1.1 矢量空间数据的组织息,通常用复杂的、多维的空间索引结构组织数据,有特有
6、的空间数据访问方法。目前大多数GIS空间数据库以矢量和GIS管理和存储空间数据的方法是将它们抽象为带有分栅格两种数据模型及相应的数据结构来组织和管理空间数类属性的几何对象,以层(Layer)为概念组织、存储、修改和显据。关系型数据采掘的算法往往假定数据是独立的,而在空示它们。空间数据组织有两个前提条件:1)同一层中的对象间数据库中一个对象可能受其邻近若干个对象的影响,数据具有相同的空间维数,如:点、线、面的一种;2)GIS层中的对之间相互依赖。因此,必须扩展传统的数据采掘技术,以便更象一般都是同一地形或地物类型,整个层构成了具有某一地好地分析复杂的空间现象和空间对象。理性
7、质的专题地图。以Arc/info基于矢量数据模型的系统为关联规则是KDD研究中一个重要的研究课题。它由R.例,为了将空间数据存入计算机,首先,从逻辑上将空间数据Agrawal等人提出,目的是要在交易数据库中发现各项目之[1,2]抽象为不同的专题或层,如:土地利用、地形、道路、居民区、土间的关系,最著名的算法是Apriori算法。其他大多数算壤单元、森林分布等,一个专题层包含区域内地理要素的位置法都是在该算法的基础上加以改进或扩展,基本框架没有变化。它隐含如下假设:1)数据库中各项目具有相同的性质和和属性数据。其次,将一个专题层