《决策树分类》word版

《决策树分类》word版

ID:29025565

大小:267.53 KB

页数:10页

时间:2018-12-16

《决策树分类》word版_第1页
《决策树分类》word版_第2页
《决策树分类》word版_第3页
《决策树分类》word版_第4页
《决策树分类》word版_第5页
资源描述:

《《决策树分类》word版》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、基于专家知识的决策树分类概述  基于知识的决策树分类是基于遥感影像数据及其他空间数据,通过专家经验总结、简单的数学统计和归纳方法等,获得分类规则并进行遥感分类。分类规则易于理解,分类过程也符合人的认知过程,最大的特点是利用的多源数据。  如图1所示,影像+DEM就能区分缓坡和陡坡的植被信息,如果添加其他数据,如区域图、道路图土地利用图等,就能进一步划分出那些是自然生长的植被,那些是公园植被。图1.JPG图1 专家知识决策树分类器说明图  专家知识决策树分类的步骤大体上可分为四步:知识(规则)定义、规则输入、决策树运行和分类后处理。1

2、.知识(规则)定义      规则的定义是讲知识用数学语言表达的过程,可以通过一些算法获取,也可以通过经验总结获得。2.规则输入     将分类规则录入分类器中,不同的平台有着不同规则录入界面。3.决策树运行      运行分类器或者是算法程序。4.分类后处理  这步骤与监督/非监督分类的分类后处理类似。知识(规则)定义    分类规则获取的途径比较灵活,如从经验中获得,坡度小于20度,就认为是缓坡,等等。也可以从样本中利用算法来获取,这里要讲述的就是C4.5算法。    利用C4.5算法获取规则可分为以下几个步骤:  (1)多元文

3、件的的构建:遥感数据经过几何校正、辐射校正处理后,进行波段运算,得到一些植被指数,连同影像一起输入空间数据库;其他空间数据经过矢量化、格式转换、地理配准,组成一个或多个多波段文件。  (2)提取样本,构建样本库:在遥感图像处理软件或者GIS软件支持下,选取合适的图层,采用计算机自动选点、人工解译影像选点等方法采集样本。  (3)分类规则挖掘与评价:在样本库的基础上采用适当的数据挖掘方法挖掘分类规则,后基于评价样本集对分类规则进行评价,并对分类规则做出适当的调整和筛选。这里就是C4.5算法。  4.5算法的基本思路基于信息熵来“修枝剪

4、叶”,基本思路如下:  从树的根节点处的所有训练样本D0开始,离散化连续条件属性。计算增益比率,取GainRatio(C0)的最大值作为划分点V0,将样本分为两个部分D11和D12。对属性C0的每一个值产生一个分支,分支属性值的相应样本子集被移到新生成的子节点上,如果得到的样本都属于同一个类,那么直接得到叶子结点。相应地将此方法应用于每个子节点上,直到节点的所有样本都分区到某个类中。到达决策树的叶节点的每条路径表示一条分类规则,利用叶列表及指向父结点的指针就可以生成规则表。图2.JPG图2 规则挖掘基本思路算法描述如下:算法:从空间

5、数据集(多波段文件)中挖掘分类规则输入:训练样本输出:分类规则表方法:一、读取数据集名字二、读取所有的训练样本A、读取属性信息C、原始类E、样本值A,并将样本划分为训练样本(2/3)和评价样本(1/3)。B、属性信息C可以是连续(DISCRETE)或离散(CONTINUOUS)的,分别将属性注上这两种标记;若属性是DISCERTE,读取其可能取得值,并都存储在一个列表中;每一个属性都有一个标记,一个给定的属性编号及初始化的取值列表均存储于一个属性的数据结构中,并将数据结构存储在一个哈希表中。C、原始类E当作一个附加属性信息储存在属性

6、列表中。D、以增量方式读取每一个样本A,将所有的样本储存在一个表中,每一行代表一个样本。三、利用数据集构建树A、离散化连续条件属性CDISCRETE,获得的分割点集T(t1,t2……)作为条件属性C的新的取值。B、分别计算所有条件属性的增益比率GainRatio(C),取增益比率值最大的条件属性作为树的划分节点,其值或范围作为划分值V(v1,v2……)来生成树的分枝。C、判断该层与每一个等价子集的原始类类别是否一致。若一致,生成叶子结点。否则,继续计算增益比率GainRatio(C)和选择条件属性C,得到树的节点和划分值V,直至所有

7、的样本已分类完毕。四、测试生成树将测试样本C′带入树中,当某一测试样本的分类预测错误时,记录分类错误的计数,并将测试样本添加到训练样本中,转向步骤三,重新构建树。否则,输出分类树五、抽取分类规则到达树的叶节点的每条路径表示一条分类规则从树中抽取分类规则,打印规则和分类的详细信息C4.5网上有源代码下载,vc和c++版本都能获得。DecisionTree的使用一、规则获取  选取LandsatTM5影像和这个地区对应的DEM数据,影像和DEM经过了精确配准。规则如下描述:Class1(朝北缓坡植被):NDVI>0.3,slope<20

8、,aspect<90andaspect>270Class2(非朝北缓坡植被):NDVI>0.3,slope<20,90<=aspect<=270Class3(陡坡植被):NDVI>0.3,slope>=20,Class4(水体):ND

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。