欢迎来到天天文库
浏览记录
ID:36777243
大小:267.80 KB
页数:4页
时间:2019-05-15
《基于小波变换的栅格数据聚类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、维普资讯http://www.cqvip.com第24卷第4期地理与地理信息科学Vo1.24No.42008年7月GeographyandGeo—InformationScienceJuly2008基于小波变换的栅格数据聚类杨春成,陈双军,何列松,谢鹏,周校东(1.西安测绘研究所,陕西西安710054;2.郑州测绘学院,河南郑州450052)摘要:为了提高K均值聚类算法的质量与收敛速度,提出一种基于小波变换的栅格数据聚类新算法。该算法利用小波分析塔式算法得到的顶层栅格数据,既较好地保留原始数据的特征信息,又大幅减小了数据量,在保证聚类质量前提下
2、,提高了算法的收敛速度;针对分解后的低频数据应用K均值算法,得到后续迭代所需的聚类中心初值,避免了初值选择的盲目性。试验表明,该算法具有计算效率高、稳定性好、聚类质量有保证等优点。关键词:空间聚类;小波变换;栅格数据中图分类号:TP751.1文献标识码:A文章编号:1672~O5O4(2OO8)O4一OO36一O3法[2,5-7](K—meansAlgorithm)。对K—means算法深0引言入分析发现:算法的聚类质量受聚类中心初值的影地理空间概念是人们在对现实世界地理空间认响较大,初值选取好,聚类质量高;收敛速度与栅格知的过程中形成的,例如
3、基于域和基于对象的认知数据量相关,数据量大,收敛慢,反之,收敛快。为了模型,按照计算机能够识别和处理的方式转化为人解决上述问题,提出基于小波变换的栅格聚类算法,们常用的栅格数据模型和矢量数据模型E¨。栅格数在保证聚类质量的前提下,提高算法的收敛速度,避据是按照栅格数据模型组织的地理空间数据,具有免初值选择的盲目性。数据量大、数据结构简单、容易实现多元数据的叠合1基于K—means算法的栅格数据聚类分析操作、便于与遥感数据及扫描输入数据相匹配建库和使用等特点L2],是某些地理实体和现象必不可少1.1K—means算法的表示方法,如表面实体、DEM
4、等。栅格数据是除Kmeans算法是一种常用的划分聚类方法。设在矢量数据外空间数据的主要存在形式,其数据来源n维实数空问中有m个对象{,,⋯,}和聚类最广泛、最丰富。空问数据的快速增长主要是指栅数k,要求出中k个聚类中心{cl,,⋯,ck),使得每格数据的快速增长,如各类遥感卫星返回的影像数个对象到其最近聚类中心的“距离”和最小。即满足:据的快速增长等,针对栅格数据进行聚类分析具有rainrain一cI(1)...l重要的理论和现实意义。c,⋯。cki1l1,⋯,聚类分析可以减少待处理的数据量L3]。以式中:I是定义在上的范数。式(1)是求一系L
5、andsat4影像数据为例,其包含7个波段,每个波列凸函数的最小值问题,是一类难以求解的优化问段数字影像为7000×7000像素。聚类前数据量为题。如果引入“选择”变量ti,可简化该问题。7000×7000×1×7字节,聚类后数据量为7000×引理1L8]设aftR,则有:kk7000×1+256×7字节。可见,聚类后数据量成倍rain{al}rain{∑tiaII∑tI一1,ti≥O,1--1,⋯,k>(2)1≤《ktl,⋯,tL1=1l=1缩减。聚类分析可用于影像分割L4等实际应用中,由引理1可将式(1)改写为:其出发点是将图像分割问题转化
6、成聚类分析问题。min∑1∑k-1tiI×ffxj—cf,lc栅格数据聚类分析可用于土地利用与规划中,不同,tiI的坡度、坡向对作物的生长与收成等影响较大,将土∑1tiI一1,til≥O,i:1,⋯,in,l一1,⋯,k(3)地利用数据按坡度、坡向聚类分级,找出适合具体土由式(3)得到K—means算法如下:地应用目的的区域,具有较大应用价值。算法1Kmeans()栅格数据聚类分析的核心是聚类算法的设计,步骤1:任意选择k个对象作为初始簇中心;步鉴于此,不同学者从不同角度提出了许多针对栅格骤2:循环,循环次数为j;步骤3:对象分配,将对象数据的
7、聚类算法,其中最典型的是K均值聚类算Xi(i一1,⋯,m)赋予聚类l(i),使得cl(i),J与xl最相收稿日期:2OO7—_12—-11;修订日期:2OO8—04—28作者简介:杨春成(1966一),男,博士,研究员,主要研究方向为空间数据库与数据挖掘。E—mail:ycc_3000一vlp_ycc@163.com维普资讯http://www.cqvip.com第4期杨春成等:基于小波变换的栅格数据聚类第37页似;步骤4:聚类中心更新,将聚类中心Cj+(1—1,⋯,k)重新设置为所有属于cl(i),J州的Xi平均值;步骤5:当Chj—cI'i
8、州(1—1,⋯,k)时,停止循环。1.2基于K—means算法的坡度和坡向数据聚类坡度和坡向是反映地形地貌的微观地形因子。对微观地形因子聚类分析时,既
此文档下载收益归作者所有