资源描述:
《遥感图像分类的主动支持向量机的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、遥感图像分类的主动支持向量机的研究与实现引言遥感图像分类[1]一直被从事遥感图像处理的广大科技人员所重视。随着计算机技术和数学理论的发展,已有越来越多的算法被提出,用来实现对遥感图分类,然后再利用分类结果进行自动识别。20世纪90年代以来,人工神经X络模型在遥感图像分类中的应用取得了很大的进展,但神经X络算法有其固有的缺点,如X络结构的确定尚无可靠的规则,易陷入局部极小等。为了提高遥感图像分类精度,还必须寻找一些新的学习算法来改进上面的缺点,使其功能更加完善。SVM[2]是在统计学习理论基础上提出的一种新的学习算法,能较好地解
2、决小样本、非线性、高维数据和局部极小等实际问题,因其易用、稳定和具有相对较高的精度在遥感图像分类中得到广泛的应用。该方法从样本集中选择一组特征子集,使得对于特征子集的划分等价于对整个样本集的分割,这组特征子集称为支持向量(SV)。支持向量分布在每一类样本的边缘,数量相对比较少,SV尽管数量少,但却包含了分类所需的信息。如果所有的样本参加训练,训练速度会比较慢,特别像大幅高分辨率的遥感图像,数据样本庞大,图像中还可能存在相当多的噪音、孤立点、交叉点等杂点,从而势必影响支持向量机的训练速度及泛化能力。所以本文在支持向量机的基础上引
3、入主动学习策略,通过主动学习选择一些样本子集,使样本子集中尽可能多的包含SV,并尽可能地排除训练样本中的非支持向量及杂点,最后在这些子集上训练得到的分类器与普通SVM方法相比,具有同样好的泛化能力,同时提高了分类的训练速度及准确率,这种新的分类方法我们称为主动支持向量机(ASVM)。1.支持向量机(SVM)支持向量机(SVM)是一种基于结构风险最小化原理的学习方法。在最简单的情形中,线性SVM通过学习得到一个超平面,该超平面以最大分类间隔将正样本集与负样本集分离开,如图1所示。图1最优分类超平面而求最优分类超平面的问题最终是通
4、过构造Lagrange函数将原问题转化为其ercer条件的核函数代替上式中的,也就是通过一个非线性映射在一个高维特征空间给出一个最优分类超平面。选择不同形式的核函数就可以生成不同的支持向量机,常用的有以下几种:(1)多项式SVM(时候为线性核):(2)径向基函数SVM:(3)二层神经X络SVM:2.主动支持向量机(ASVM)主动学习是一个循环反复的过程,其基本思想是:首先,候选样本集中所有的样本未带类别标注,根据先验知识或者随机地从候选样本集中选择少量样本并标注它们的类别,构造初始训练样本集,确保初始训练样本集中至少包含有一个
5、正样本和一个负样本,并训练一个初分类器,在该分类器下,采用某种算法,从候选样本集中选择最有利于分类器性能的样本,标注类别并加入到训练样本集中,重新训练分类器,重复此过程,直到候选样本集为空或达到某种指标。主动学习与SVM结合工作的基本思想是从候选样本集中选出最不确定的未标识样本向用户进行询问来对分类超平面进行改进[3]。在学习过程中,分类器根据什么策略从未标识样本集中选择下一个要标识的样本是ASVM的一个关键问题。现在的做法大都是选择对其类别最不确定的一个样本[4],也就是选择距离当前超平面最近的一个样本,这种规则简单直观。如
6、果把样本类别的不确定性作为选择的唯一依据,分类器很容易受到图像样本中的噪音、孤立点的影响,因为分类器无法区分这些点[5]。所以本文在选择要询问的样本时,除了考虑未标识样本到超平面的距离外,再通过计算未标识样本同训练样本的余弦相似度来度量其差异性来保持样本的多样性和除去部分杂点。假设样本、,其在映射空间分别表示为、,则样本和在映射空间的余弦相似度利用核函数可表示为:余弦相似度算法是将未标注的样本和当前标识的样本集之间的角度定义为样本到集合中任一样本之间的最大的角度,这个角度衡量了样本被选为样本后样本集的多样性。由于杂点一般都远离
7、所属样本,与样本的余弦相似度小,所以通过此方法可以有效克服杂点对训练器的影响。由于本文采用的是径向基核函数所以上式可以写成:综上,本文引入了参数()来平衡这两部分:到分类超平面的距离和余弦相似度。最终未标注样本包含的信息可以表示为:式中为到超平面的距离,为与的余弦相似度,为未标识样本集,为标识样本集。本文算法的分类示意图如图2:图2本文算法的分类模型示意图3实验与讨论本文以卫星遥感影像土地利用识别为例,进行比较实验。选用的遥感资料为某地Landsat一TM3、TM4、TM5三波段合成影像,大小为220*200遥感彩色图像,在原
8、始图像上通过目视判读,将其分为道路(road)、城区(city)、农田(field)、园地(green)、林地(hill)、水域(eanaccuracy/%road78100000.78000.8301city569000230.6970field001000001.0000