基于决策树的多源遥感数据分类.pdf

基于决策树的多源遥感数据分类.pdf

ID:55399219

大小:613.59 KB

页数:5页

时间:2020-05-15

上传者:山楂树
基于决策树的多源遥感数据分类.pdf_第1页
基于决策树的多源遥感数据分类.pdf_第2页
基于决策树的多源遥感数据分类.pdf_第3页
基于决策树的多源遥感数据分类.pdf_第4页
基于决策树的多源遥感数据分类.pdf_第5页
资源描述:

《基于决策树的多源遥感数据分类.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

第3O卷第2期西南科技大学学报Vo1.30No.22015年6月JournalofSouthwestUniversityofScienceandTechnologyJune2015基于决策树的多源遥感数据分类曾特林吴彩燕曾晓丽(西南科技大学环境与资源学院四川绵阳621010)摘要:遥感影像是获取土地覆盖信息的重要手段。分析了影响决策树分类的特征因子,并根据这些因子构建分类决策树。结合中分辨率多源遥感数据,对贡嘎山区进行土地覆盖分类,通过与最大似然法分析对比,基于决策树的多源数据分类对试验区的分类精度(总体精度85.71%,Kappa系数0.83)远高于基于像素的最大似然法监督分类(总体精度63.56%,Kappa系数0.58)。关键词:决策树分类多源数据贡嘎山区中分辨率遥感分类中图分类号:P237文献标志码:A文章编号:1671—8755(2015)02—0041—05Multi-$oln3eeIt_emoteSensingDataClassificationMethodBasedonI}t~isionTreeZENGTe—ling,WUCai—yan,ZENGXiao—li(SchoolofEnvironmentalEngineeringandResources,SouthwestUniversityofScienceandTechnology,Mianyang621010,Swhuan,China)Abstract:Sinceitisanimportantapproachtogetlandcoverinformation,remotesensingprovidesservicestoresourcesurveys,environmentalmonitoring,etc.,thestudyofremotesensingimageclassificationissignificant.Thispaperanalyzesthefactorsafectingthecharacteristicsofdecisiontreeclassification.andthenthedecisiontreetoclassifytheimagewasbuiltbasedonthesefactors.Combinedwithmediumreso-lutionmulti—sourceremotesensingdata,takingGonggaMountainforinstance,thecomparisonstothemaximumlikelihoodmethodwereperformedforthevalidation.Theresultdemonstratesthattheclassifica—tionaccuracyofthetestarea(overallaccuracy85.71%,Kappacoefficientof0.83)ismuchhigherthanthepixel—basedmaximumlikelihoodclassification(overallaccuracyof63.56%,kappacoefficientof0.58),showingtheadvantagesandprospectsoftheobject—basedmulti—sourcedatadecisiontreeclas—sification.Keywords:Muhi—sourcedata;Decisiontree;GonggaMountain;ModerateResolution;Remotesensingc1assi矗cati0n自2O世纪9O年代以来,国内外对土地覆盖的决策树分类方法得到诸多应用。韩涛等利用单时相遥感分类方法主要为基于传统的统计模式的分类方的MODIS数据构建决策树进行自动分类2,赵慧等法,如最大似然分类法、最小距离分类法、等距离混研究了影响分类精度的因素J,杨曦光等使用决策合法、ISODATA等。近年来,传统统计模式的分类树方法对海岛土地利用进行了分类研究j。这些方法已经不能满足地物类别的判读精度,因此出现研究结果都肯定了决策树分类方法在遥感影像分类了越来越多的人工智能分类方法,其中面向对象的中的显著效果,但对影像分辨率要求都比较高。基收稿日期:2014—12—27基金项目:国家自然科学基金(41301587)。作者简介:曾特林(1989一),女,硕士研究生。E—mail:zengteling@126.com.通讯作者:吴彩燕(1976一),女,副教授,研究方向为地质灾害评价与防治、地理信息系统的应用与开发。E—mail:wucaiyan@Swtlst.edu.cn 42西南科技大学学报第30卷于决策树的多源遥感影像分类方法不同于基于像数据集逐级往下细分,以确定决策树的各个分支,分元、亚像元的分类方法,是一种结合多源数据的面向类时,地物可根据决策树逐级决策,最终得到详细的对象的分类法,本文通过结合多源数据的影像分割划分(图1)。分类的导人数据除了TM各个波段建立决策树进行分类,并与传统的分类方法监督分(由于热红外波段不在研究范围之列,因此移除了类(最大似然法)的分类结果进行对比分析。TM6和HJ—A/B4个波段数据)之外,还加入了AS.TERDEM以及坡度、坡向数据。决策树分类主要包1研究方法括4个步骤:(1)影像特征分析;(2)影像分割;(3)建立决策树分类法的原理是按照一定的规则把遥感决策树规则;(4)影像特征提取。遥感影像辅助数据上尺度因子、形状因影像几何校正、数据格式转换、光谱、形状、纹理、子、紧致度因子多源数据配准多源数据配准大小特征分析Il1L【影像分割J学习样本}—◆决策树规则建立hL——I}__测试样本决策树规则测试_J【优化决策树】·【分类与精度评定]图1决策树分类流程Fig.1Decisiontreeclassificationprocess2基于决策树的多源数据分类方法2008年12月16日的TM影像以及环境与灾害监测预报小卫星星座HJ~1A2010年3月2013CCD影2.1研究区概况像、HJ一1B2011年6月5日的CCD影像、HJ~1A贡嘎山(101。40~102。15E,29。20~2010年12月1313的CCD影像。空间几何数据为30。10N)位于青藏高原东南缘,地处四川盆地向青空间分辨率为30m的ASTERDEM,投影为藏高原过渡的大雪山的中段,主峰海拔7514m,是UTM/W—GS84。DEM产生的坡度、坡向图提供了我国典型海洋季风型冰川的分布区,也是植被垂直研究中会用到的影像对象中的地形因子。用于确定带谱非常明显的地区。该地区森林植被覆盖率高,研究区域的是1:400万的基础地理数据,用于评价植物种类较丰富。其海拔高差较大,植被垂直带谱精度的是野外采集的照片和GPS采样点。复杂多样。研究区自上而下囊括了亚热带、暖温带、数据处理平台为ERDASIMAGINE9.2、ENVI4.5寒温带、亚寒带、寒带、寒冷带、冰雪带7个气候区,专业遥感图像处理系统、ARCGIS9.2地理信息系统植被类型包括了常绿阔叶林带(1000~2200m)、软件以及德国Definiensimaging公司的Definiens针阔叶混交林带(2200—2500m)、针叶林带Developer的面向对象分类软件。(2500—3600m)、灌丛草甸带(3600~4600m)、数据预处理包括:几何校正、边界裁剪、投影转高山流石滩稀疏植被带(4600~5000m)、永久冰换从而产生研究区域的各子数据集。影像的几何校雪带(5000m以上)。2.2多源数据与数据处理平台正采用三阶多项式纠正模型进行控制点的选取、用研究区域内的多源遥感影像数据是Landsat最邻近插值法重采样,利用从1:50000地形图 第2期曾特林,等:基于决策树的多源遥感数据分类43(高斯一克吕格1980年西安坐标系投影)上选择的指数法,归一化植被指数(NDVI—NormalDiffer-25个地面控制点纠正得到的均方根误差小于0.5。entVegetationIndex)的计算公式:子数据集就是根据行政边界和贡嘎山的范围划定研NDVI=(NIR—R)/(NIR+R)究区域后,再根据这个区域对遥感影像、DEM等数其中NIR为近红外波段,R为红波段,通过多次设据进行裁剪,并使用线性拉伸使图像信息得到增强定阈值,本研究区的NDVI值取0.15区分植被和非并且将投影统一为UTM—WGS84—48N的遥感图植被。像和DEM图像。林、灌以及其他难以区分的植被,通过使用均值2.3决策树分类统计方法,结合二维空间散点图与特征分布图,确定2.1.1影像特征分析决策树规则中的变量]。根据表2,结合试验分影像既有光谱特征,也有空间特征。分析影像析,最终采用TM4取35.8,提取出针叶林与阔叶林特征旨在甄选出用于构造决策树规则的特征指标。植被的光谱特征。在影像上可以大致看出:植被的光谱特征在影像识2.3.2影像分割别上占主要作用,而其它非植被类型如居民地、耕影像分割是指一副影像分割成影像对象,以作地、河流等主要受空间特征影响,水体的光谱特征也为进一步结合灰度和空间分类的基础。根据边缘检比较强,利用波段组合可以起到一定的作用(表1)。测法的分割方法,遥感影像分割结果的效果受到表1TM2+TM3一(TM4+TM5)的样点值与均值分割尺度、紧致度因子、形状因子以及波段权重等的Table1ThesamplevaluesandmPAlnvaluesof影响。图像中每一个像素点都有其灰度尺度和空间TM2+TM3一(TM4+TM5)尺度(Ahuja,1996),灰度尺度就是该像素点在被分割成的所在对象区域与周围区域的差异,而空间尺度是该点与对象区域边缘的最短距离“J。影像对象既有空间异质性,又有光谱异质性,它们构成了影像对象的异质性,由信息权重、异质性值和用户自表2针叶林与阔叶林特征值统计表定义的权重决定。eCognition软件可以设置分割的Table2TheeigenvaluestatisticsofNeedle尺度值和各因子的权重值。影像的像素决定了它的leafForestsandBroadleafForests尺度参数,形状因子影响的是影像对象的边缘平滑程度和对象的紧致度,这些因子的确定最终将影像对象互相区别开来。实验对不同尺度和不同影响因子分别做了研究,最终确定的参数是分割尺度为6,形状因子为0.1,紧致度因子为0.5,TM波段权重全为1,而其他波段权重为0。2.3.3建立决策树规则根据贡嘎山植被群落的结构和其他地物的特征,参照国家土地利用分类标准,实验研究区域最终被分为12类。张彤等钊对决策树的形式算法做了比较详细的阐述,建立决策树实际上就是根据逻辑判别式,不断从父节点分叉产生根节点,直至停止分叉的一个过程。决策树分类规则的建立是基于影像分割及其特征。首先,由决策树的各个节点来建立一个逻辑结构,在此过程中会产生一些中间类,它们在分类过程中起到缓存的作用,最终将被一一归到分类系统目前应用最广泛的植被提取方法是归一化植被中。自动分类的决策树包含了分割、分类、指数三大 西南科技大学学报第3O卷部分。由于影像特征的交叉性较强、混合像元无可3结果与讨论避免,规则条件不可能完全将影像对象分成界限绝对清晰的两类,所以分类的部分还包括了适当修剪基于决策树的多源遥感数据分类与基于像元的的部分。分类逻辑结构是一个由多条规则构成的系最大似然算法监督分类的精度评价结果见表3,分统,一条规则由一个或多个逻辑语句构成,规则之间类结果图见图2。基于决策树的多源遥感数据分不能交换顺序,否则有可能使分类结果混乱。规则类,比基于像素的最大似然法监督分类具有更高的里需要使用的变量放在决策树的指数部分。决策树分类精度(总体精度高出22.15%,Kappa系数提高的生长与修剪是一个无法分割的过程,为了得到更了0.25%)。这表明,基于决策树的多源遥感数据加稳定的分类树,实验采用事后修剪,最终只有少部分类为类似贡嘎山区这样土地覆盖复杂的区域提供分的冰雪被误分到裸地和稀疏植被中。了一种较好的土地利用分类方法。此分类法有效地2.3.4影像特征提取处理了“同谱异物”现象,例如光谱信息相似的居民规则通常是由好几个特征参数和好几个逻辑语地和冰川积雪;改善“同物异谱”现象,例如同为耕句共同构成的,如利用NDVI,MNDWI,TM4,DEM地;有效改善了“椒盐现象”;充分利用了辅助数据值来共同构建一条得出的NDVI与云量较少的和多时相遥感信息来参与分类,使分类结果的精度HJ3,4波段计算得出的NDVI的差值。这是因为两不受影像分辨率严格控制。因此,本次研究的结果种影像分别是植被生长期和植被落叶期的影像,利显示出在缺乏高分辨率的土地类型复杂的山区,基用二者之间的差值,可以有效提取落叶与常绿的灌于决策树的多源遥感数据分类方法的显著优势和实木;在冰川积雪、河流、湖泊、裸地、居民地的提取过用性。程中,根据DEM和TM4确定出冰雪区,但是这个过表3两种分类方法的精度评价结果对比Table3Theaccuracyoftwoelassifleationmethods程中产生了中间类,而这个中间类囊括了所有非植evaluati0nresultscontrast被中的非冰雪区,而河流可直接利用海拔高度和TM2+TM3一TM4一TM5的范围值提取,在提取河流时产生的中间类,可结合海拔与坡度等因子,将湖泊分出,但这时中间类并未完全消失,因为它包含了裸地与居民地,要提取这两种地物,需充分利用NDBI、坡度及DEM值来处理。当几个特征都在待选之列裸地10010060.8372.55时,可借助二维特征空问图提取信息。河流10010o72.3751.722.3.5精度评价湖泊1006785.7153.93传统的基于像素的分类使用的是最大似然算法居民地10010053.755O.35分类。为了确保一致性,实验时在这l2个分类范围冰雪888889.8498.29内选取了5O个与多源数据决策树分类方法的训练阔叶林10010052.9347.89针叶林8O9585.5153.93样本基本一致的代表区域来进行分类,最终这些区常绿灌928652.0376.73域的像元都分别被分到了概率最高的各类别当中。落叶灌84594J4.oo64.58利用分层采样法,通过分类结果图中的类别和草地638854.7552.40野外采样分布中对应的类别进行对照,进行精度评稀疏植被1001OO71.4354.66价,采用混淆矩阵来表示,并采用用户精度、生产者耕地10010074.0364.74精度、总体分类精度及Kappa系数评价分类图精度。总体精度85.71%63.56%贡嘎山区的土地覆盖类型分布不均,若采用随机采Kappa系数0.830.5820样法不能保证每个类别的样本数量,在选择样本的时候,考虑到了空间相关性。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭