基于支持向量机的合成孔径雷达图像分割

基于支持向量机的合成孔径雷达图像分割

ID:32294966

大小:8.46 MB

页数:54页

时间:2019-02-02

上传者:U-22107
基于支持向量机的合成孔径雷达图像分割_第1页
基于支持向量机的合成孔径雷达图像分割_第2页
基于支持向量机的合成孔径雷达图像分割_第3页
基于支持向量机的合成孔径雷达图像分割_第4页
基于支持向量机的合成孔径雷达图像分割_第5页
资源描述:

《基于支持向量机的合成孔径雷达图像分割》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

论文题目:基于支持向量机的合成孔径雷达图像分割专业:计算机应用技术硕士生:王红艳(签名)指导教师:付燕(签名)摘要合成孔径雷达(SAR)图像分割是SAR图像应用中非常重要的一个环节,但由于SAR图像中相干斑噪声的存在和特征选择不当,使得传统方法不能很好的对SAR图像进行分割。因此,将机器学习领域中新的研究成果应用到SAR图像分割中并构造有效的分类器具有重要的意义。本文基于支持向量机(SVM)对SAR图像的特征提取和分割方法进行了较为深入的研究。主要内容如下:首先,对SAR图像分割的背景及意义进行了介绍,分析了SAR图像分割的研究现状与发展趋势;对统计学习理论与支持向量机的基本理论进行了阐述;对合成孔径雷达和其中存在的相干斑噪声进行了研究,为图像处理提供了理论依据。其次,本文结合小波变换在提取纹理特征、图像去噪方面的显著效果和支持向量机分类方法的优势,实现了一种基于支持向量机的单目标SAR图像分割方法。该方法先利用小波变换提取样本点周围的纹理特征,再对图像进行去噪处理;用小波能量特征及其加权平均值、去噪后样本点的灰度值和它的八邻域灰度值共同构成样本点的综合特征,利用归一化后的特征向量来训练SVM;然后利用训练得到的SVM对图像的每个像素点进行分类,从而实现SAR图像的单目标分割。实验表明,该方法对于单目标SAR图像进行分割,具有较好的分割效果。最后,探索了一种基于支持向量机的多目标SAR图像分割方法。在人工提取样本后,将综合特征作为特征向量来训练得到多类支持向量机,利用该SVM实现多目标SAR图像的分割。其中,在由两类分类推广到多类分类时采用改进的“一对一方法”。对一幅含有多目标的SAR图像进行分割实验,结果表明该方法相对传统的分割方法能取得较好的分割结果。关键词:图像分割;支持向量机;特征提取;小波变换;小波能量特征研究类型:应用研究 Subject:SegmentationofSyntheticApertureRadarImageBasedonSupportVectorMachineSpecialty:ComputerApplicationTechnologyName:WangHongyan(Signature)Instructor:FuYan(Signature)ABSTRACTImagesegmentationisakeystepintheapplicationofsyntheticapertureradar(SAR)image.However,becauseoftheexistingofspecklesandunsuitablefeatureextraction,SARimagecannotbesegmentalizedwellbyusingtraditionalmethods.SoitisimportanttoapplythenewresearchofmachinelearningtheorytoSARimagesegmentationandconstructtheeffectiveclassifier.ThemethodofSARimagefeatureextractionandsegmentation,whichisbasedonsupportvectormachine(SVM),isresearcheddeeplyinthisthesis.Themaincontentsandcontributionsareasfollows:Firstly,thestudybackground,significance,researchstatusanddevelopmenttrendofSARimagesegmentationareintroduced.Andthestatisticallearningtheory,supportvectormachines,syntheticapertureradarandspecklenoiseinSARimagearestudied.Thisprovidestheoreticalbasisforimageprocessing.Secondly,accordingtotheremarkableresultsofwavelettransformontexturefeatureextractionandimagefiltrationaswellastheadvantagesofSVMclassification,anewsingle-targetSARimagesegmentationmethodbasedonsupportvectormachineisproposed.Theproceduresofthemethodisasfollow:First,texturefeatureofsamplepointsisextractedbywavelettransformmethod.Second,imagepreprocessingisperformedbyusingwaveletfilteringmethod.Third,thecomprehensivefeatureofsamplepointsisconstructedbywaveletenergyfeatures,weightedmeanvalueofwaveletenergyfeatures,thegrayvaluesofthesamplepointswhichisdenoising,andthegrayvaluesofeight-neighborhood.Fourth,aSVMclassifierisdesignedandtrainedbyusingnormalizedfeaturevectors.Atlast,thetestingsetsofSARimagearesortedbytrainedSVMsothatthesingle-targetSARimagecanbesegmentalized.Withtheexperimentresult,themethodisprovedanefficientoneof single-targetSARimagesegmentation.Finally,anewmulti-targetSARimagesegmentationmethodbasedonsupportvectormachineisproposed.Samplesobtainingisprocessedbyartificialchoice,thencomprehensivecharacteristicsisregardedascharacteristicvectortotrainsupportvectormachine,thisobtainedSVMisusedtorealizemulti-targetSARimagesegmentation.Amongthem,“one-against-onemethod”isadoptedintheprocessoftwokindsclassificationextendtovariouskindsclassification.Eventually,throughamulti-targetSARimagesegmentationexperiment,theproposedmethodoutperformstheprevioustraditionalalgorithm.Keywords:ImageSegmentationSupportVectorMachineFeatureExtractionWaveletTransformWaveletEnergyFeatureThesis:ApplicationResearch 1绪论1绪论合成孔径雷达(SyntheticApertureRadar,简称SAR)是一种工作在微波波段的相干成像雷达。它以其高分辨率、全天候、全天时、大面积的数据获取能力成为世界各国普遍重视的对地观测技术,尤其对传统的光学传感器成像困难的地区有着特别的意义。在其40多年的发展历程中,从单波段、单极化成像雷达到多波段、多极化、多平台、多级分辨率的成像雷达,再到干涉雷达和新型极化雷达的出现,SAR充分显示出在对地观测领域中的重要作用和应用潜力,在固体地球科学、生态科学、水文科学、海洋科学等领域正发挥着越来越重要的作用并不断扩展其应用范围,成为遥感信息获取技术不可或缺的[1]重要分支。1.1选题背景及研究意义在SAR的应用日益广泛的今天,有必要尽快发展SAR成像后的图像处理技术,以便从观测到的数据中获取大量的实时信息。SAR图像处理技术主要有:SAR图像去噪处理;SAR图像边缘检测处理;SAR图像分割处理;SAR图像特征信息提取;SAR图像目标检测与识别等。SAR图像的信息表达方式与光学图像有很大的差异,不同的地形特征会在图像中呈现一些特殊的现象。与光学图像相比,SAR图像视觉可读性较差,并且受到相干斑噪声及阴影、透视收缩、迎坡缩短、顶底倒置等几何形变的影响,使得SAR图像信息处理变得更加困难。目前,SAR侦察系统的信息获取技术明显超前于信息处理技术。因此,如何对SAR图像数据做出快速而准确地解译,是当前迫切需要解决的一个世界性难题。所谓图像分割就是将图像表示为物理上有意义的连通区域的集合,即这些区域有某些相同或相似的属性。图像分割在不同的领域有时也用其它名称,比如目标轮廓技术、阈值化技术、图像区分或求差技术、目标检测技术、目标识别技术、目标跟踪技术等,[2]这些技术本身或核心部分实际上都是图像分割技术。图像分割是图像处理和计算机视觉的经典研究课题,在国防及国民经济中都起着重要的作用。它是图像分类、理解、目标识别等的关键技术,具有重要的研究意义和应用价值。关于图像分割的研究已经有几十年的历史,图像分割的技术和算法也层出不穷,借助各种理论至今已提出了上千种不同类型的分割算法。目前,人们使用的所有图像分割技术都只是利用了图像的部分信息,如灰度、梯度、频率等等。因此,任何一种图像分割技术都是具有局限性的。在开发一个图像分割系统的过程中,必须结合所需处理的[3-5]图像特点以及我们对图像进行处理的目的进行开发。SAR图像分割的目的是分离出感兴趣的区域或目标,通常是SAR图像目标提取与1 西安科技大学硕士学位论文[6][7]识别等后续应用的重要基础。但由于受到相干斑噪声(Speckle)的干扰,这类问题一直是SAR图像处理与分析中的难点问题。常规的图像分割技术应用于SAR图像时,效果往往比较差。近年来,很多研究人员致力于SAR图像分割研究,提出了一些分割方法,但现有分割方法中,大都是基于图像的部分特征或以一定的阈值为标准对图像进行分割,因此,存在一定的局限性。支持向量机(SupportVectorMachine,简称SVM)是一类新型机器学习方法,表现出很多优于已有方法的性能,被看作是对传统学习分类方法的一个好的替代,特别在小训练样本、高维情况下,具有较好的泛化性能。由于其出色的学习性能,该技术已经成为机器学习界的研究热点,将其与合成孔径雷达图像处理方面的研究相结合,具有良好的应用前景和效益。因此,将支持向量机应用于SAR图像的分割中具有非常重要的研究[8]意义。1.2研究现状及发展趋势1.2.1SAR图像分割研究现状自从二十世纪70年代以来,英美各国就开始进行SAR图像的自动处理研究,从SAR图像中提取一些有意义的特征,如区域分割、边界提取和目标检测等。二十世纪80年[9]代开始,美国就投入大量资金进行SAR数据的获取以及后续的处理研究。相比之下,我国于二十世纪70年代中期开展对合成孔径成像雷达的研究。经过近三十年的发展,我国在SAR方面的研究实现了从单一波段到L、S、X、Ku波段的系列发展,目前拟进一步拓展到其它波段,从单极化到多极化分辨率、从最初的几十米发展到国际先进水平,目前仍在开展更高分辨率的研究。从单一条带模式发展到多条带、聚束、扫描等模式,已完成几代实时成像处理器的研制和实际应用,完全具备处理高分辨率的能力,值得一提的是所有的软硬件都是自主研发的,完成了干涉合成孔径雷达的研制和试验飞行,实现了我国雷达图像从二维到三维的跨越,测绘带宽度从几公里发展到几十公里,并能保证长时间连续大面积的成像。2002年12月在国家自然科学基金委主持下,国家自然科学基金重大项目“高分辨率机载合成孔径雷达实时成像系统”通过项目验收和成果鉴定。机载飞行实测表明,该系统当分辨率为1m时,可持续、稳定地实时成像、实时记录、实时显示,成像质量好,并同时完成初步地学分析,成功地解决了系统对实时性的要求。由电子科技集团第十四所研制的KLC-9型机载合成孔径雷达具有重量和体积的优势,而且可以实现对目标的多分辨率(分别为1m和0.5m)成像,具有空中实时处理数据的能力。然而和发达国家相比,我国在对SAR图像处理方面的研究[10]进展则相对缓慢,在很大程度上阻碍了SAR数据的应用。在SAR图像分割方面,人们一直给予高度重视,至今已提出上千种分割算法。总2 1绪论的来说分割算法可以分为:①基于分类的分割方法(包括阈值分割方法:比较成熟的如文献[11]所述方法,它用直方图来估计阈值,通过Gamma分布对SAR图像进行建模,在模型直方图的波谷处估计阈值);②边缘检测分割方法(包括对数似然值检测方法、均值差分算法和Ratio算法等等);③区域分裂合并的分割方法;④基于马尔可夫随机场(MarkovRandomFields,简称MRF)模型的分割方法以及混合方法。随着雷达技术的不断发展,许多新的图像处理方法被提出和完善。例如:R.Cook提出了基于矩特征的区[12][13]域融合分割方法;Y.Dong、B.C.Forster等利用MRF完成了雷达图像的分割;[14]C.Lemarechal研究了基于形态学的SAR图像分割;R.W.Ives提出了SAR图像的像素[15][16]分割方法;H.Derin提出了基于复信号的SAR图像分割方法;V.Venkatachalam、[17]H.Choi.提出了基于子波域的隐马尔可夫模型的SAR图像分割方法等。近年来随着统计学习理论的发展,将支持向量机方法应用于SAR图像分割领域成为新的研究热点。1.2.2支持向量机研究现状目前,支持向量机已经广泛应用于各个领域,包括模式识别、回归分析、密度估计和时间序列预测等。其中,模式识别是支持向量机当前最主要和最成熟的应用。具体表[18]现在以下方面:(1)文本分类文本分类的任务是将自然文本(超文本)文件根据内容分为预先定义的几个类别。目前在互联网上有很多领域都有这样的应用,如邮件过滤、网页搜索、办公自动化、主题索引和新闻故事的分类等。(2)二维图像分类目前的二维图像分类,主要是针对自然景物的分类。例如以彩色直方图为输入特征,利用SVM对Corel数据库中的自然景物图像进行分类。(3)手写数字识别支持向量机在现实世界应用的第一个例子就是关于手写数字识别的问题。这个问题通常用作分类器的测试平台,最初是为了满足美国邮政服务局使用手写邮政编码自动分类邮件的需要而提出的。SVM的不同模型在两个数字集上做过测试,这两个数字集分别由USPS(美国邮政服务局)和NIST(国家标准技术局)公开提供。USPS数据集包括7291个训练样本,2007个测试样本,用256维的向量(16×16矩阵)表示,每个点的灰度值从0到255。NIST数据集是为了做测试平台用的,包括60000个训练样本和10000个测试样本,图像用20×20的矩阵表示,其中各项也是灰度值。Vapnik和他的合作者处理过这个问题,实验结果在Vapnik、Burges、Comes等学者的论文做了总结。(4)三维物体识别三维物体识别是模式识别的重要应用领域,包括从人脸识别(FaceRecognition)到自3 西安科技大学硕士学位论文动目标识别(AutomaticTargetRecognition,ATR)的各个领域。(5)其他应用除了上述应用领域外,SVM还被广泛用于时序预测、函数优化与回归、生物信息学等领域中。随着支持向量机应用范围逐步扩大,与支持向量机有关的算法方面的研究也不断深入。90年代中期,Vapnik和他的AT&TBell实验室小组提出了支持向量机(SVM)算法,进一步丰富和发展了统计学习理论,使抽象的学习理论能够转化为通用的实际预测算法。使其不仅是一种理论分析工具,还可以作为一种能构造具体有多维预测功能的预测学习算法的工具。在此基础上,Osuna在1997年提出了解决SVM中的二次规划问题的一种策略——分解算法,并且在理论上证明了该算法的收敛性。此算法避免了支持向量机在训练过程中由内存对训练样本数量的限制,具有很好的实用价值。Platt在1998年实现了支持向量机的序列最小优化算法(SequentialMinimalOptimization,简称SMO),该算法是目前在处理样本个数比较多、用支持向量机构建模式识别系统的主要方法。由于其具有易于实现和收敛速度快等特点,从而极大地推动了支持向量机在各个领域的应用。近年来许多研究者还提出了其他一些算法,例如:张学工提出的CSVM算法,将每类训练样本集进行聚类分成若干子集,用子集中心组成新的训练样本集训练SVM;Keerthi提出的修改算法NPA最近点算法,在一定程度上提高了算法的收敛速度。这些算法都为支持向量机的应用起到了推动作用。与现有的学习机如神经网络、模糊学习机、遗传算法、人工智能等相比,支持向量机具有更坚实的理论基础和更好的推广能力并且具备强大的非线性和高维处理能力。可以预计,在今后相当长的一段时间内,关于这方面的研究将会进一步掀起一个持续发展的热潮。1.2.3发展趋势随着神经网络、遗传算法、统计学理论、模糊集理论、形态学理论、小波理论以及[19]分形理论等在图像分割中的广泛应用,图像分割技术呈现出以下的发展趋势:(1)多种特征的融合除了利用图像的原始灰度特征外,还可利用图像的梯度特征、几何空间特征(形态、坐标、距离、方向、曲率等)、变换特征(傅立叶谱、小波特征、分形特征等)及统计特征(纹理、不变矩、灰度均值等)等高层次特征,对每个待分割的像素,将所提取的特征值组成一个多维特征矢量,再进行多维特征分析。通过多种特征的融合,图像像素能被全面描述,从而可以获得更好的分割结果。(2)多种分割方法的结合由于目标的多样性以及目标成像的不确定性,单一的分割方法难以对含复杂目标的4 1绪论图像取得令人满意的分割结果。在这种情况下,除需要利用多种特征的融合外,还需要将多种分割方法进行结合,使各种方法充分发挥各自的优势,避免各自的缺点。采用什么方式结合以获得好的分割结果是该方法研究的重点。(3)新理论与新方法从前面的综述可以看出,图像分割方法目前还远没有达到完美的程度。图像分割的广泛应用促使人们去寻找新的理论和方法来提高图像分割的效果,从而满足生产的需要。近几年发展起来的基于统计学习理论的支持向量机方法就是新理论与新方法的一个代表。1.3研究内容和组织结构本论文依托陕西省自然科学基金项目“基于支持向量机的SAR图像分割和目标识别”(基金编号:No.2006D17)。在参考大量国内外最新相关文献的基础上,重点对支持向量机的相关理论进行研究,并将其应用于SAR图像分割领域。主要研究内容如下:①由于原始SAR图像中存在相干斑噪声,所以在图像分割前要研究如何对SAR图像进行一定的预处理,在去噪方面,本文选用小波变换来实现;②由于特征提取的好坏直接影响到分割效果,所以应选择合适的特征作为特征值,通过参考大量文献,研究了现有方法中的特征选择以及它们的优缺点后,本文决定采用综合特征——即由纹理特征和灰度特征相结合来作为特征值进行图像分割,同时研究了纹理特征和灰度特征的选择;③研究支持向量机基本理论,使用支持向量机方法对单目标SAR图像进行分割;④由于支持向量机最初是针对两类问题提出的,所以研究了如何将两类分类推广到多类分类的问题。当前主要采用的推广策略有“一对多”和“一对一”两种方法,通过研究发现“一对一方法”在样本维数不高和样本数量不多的情况下效果更好,但传统的“一对一方法”会存在不可分区域,故本文采用徐海祥的改进的“一对一方法”将两类SVM推广到多类SVM;⑤研究使用支持向量机方法对多目标SAR图像进行分割;⑥使用VC++6.0开发基于支持向量机的SAR图像分割程序。本论文共分为六章,具体安排如下:第一章:绪论。主要介绍了本论文的选题背景、研究意义、研究的现状与发展趋势,并对本论文的研究内容和组织结构给予说明。第二章:统计学习理论与支持向量机。首先介绍了统计学习理论与支持向量机的基本思想,然后列举了从两类支持向量机到多类支持向量机的常用推广方法,最后总结了支持向量机的一些特点。第三章:合成孔径雷达及相干斑噪声抑制。首先简单描述了SAR成像的基本原理5 西安科技大学硕士学位论文以及它成像的目标特性,为后面的图像处理提供了理论依据;然后研究了常见的几种SAR图像斑点噪声抑制方法。在本文中选用基于小波的滤波方法,对小波滤波的一些基本理论予以介绍,并给出本文中所采用的具体滤波算法和处理结果。第四章:基于支持向量机的单目标SAR图像分割。从样本获取到特征提取再到具体的分割步骤都给出了详细的介绍,重点研究了特征提取,为了提高分割效果,在特征提取方面综合考虑纹理特征和灰度特征相结合,纹理特征选用小波能量特征以及它们的加权平均值,灰度特征也不是单一的考虑当前样本点的灰度值,而是考虑了它的八邻域灰度值,这就使它具有了一定的抗噪性,最后结合一幅实际的SAR图像进行分割,得出实验结论。第五章:基于支持向量机的多目标SAR图像分割。研究了由两类支持向量机向多类支持向量机推广的具体实现,通过样本获取、特征提取、图像分割等步骤完成了基于支持向量机的多目标SAR图像分割,并用一个具体的实验进行验证,得出实验结论。第六章:结论。总结全文,并对未来的研究工作进行展望。6 2统计学习理论与支持向量机2统计学习理论与支持向量机统计学习理论是一种专门研究小样本的理论,能较好地解决小样本学习问题。目前统计学习理论已经成为国际上机器学习领域新的研究热点。基于数据的机器学习是现代智能技术中十分重要的一个方面,主要研究如何从一些观测数据(样本)出发得出目前尚不能通过原理分析得到的规律,利用这些规律去分析客观对象,对未来数据或无法观测的数据进行预测。统计是面对数据而又缺乏理论模型时最基本的(也是唯一的)分析手段,传统统计学所研究的是渐进理论,即当样本数目趋向于无穷大时的极限特性,但在实际应用中,这种前提条件却往往得不到满足,当问题处在高维空间时尤其如此。2.1统计学习理论的基本思想2.1.1推广性的界统计学习理论系统地研究了对于各种类型的函数集,经验风险和实际风险之间的关[20]系,即推广性的界。这些界是分析学习机器性能和发展新的学习算法的重要基础。对于学习机器,已知训练样本数为l,经验风险用R(w)表示,期望风险用Rw()emp表示。则经验风险和期望风险之间以至少Rw()£R(w)+f(lh)的概率满足如下关系:empBeæ4Remp(w)öRw()£Remp(w)+ç1+1+÷(2.1)2çBe÷èø可以简化以上公式,表达为:æölRw()£Remp(w)+fç÷(2.2)èøh从式(2.2)可以看出,学习机器的实际风险由两部分组成:一部分为经验风险(训练误差);另一部分称作置信范围,它与学习机器的VC维和训练样本数有关。通过进一步分析可以发现,当lh比较小时,置信范围较大,用经验风险近似真实风险就有较大的误差,用经验风险最小化取得的最优解可能具有较差的推广性;如果样本数较多,lh较大,则置信范围就会很小,经验风险最小化的最优解就接近实际的最优解。另一方面,对于一个特定的问题,其样本数是固定的,此时学习机器(分类器)的VC维越高(即复杂性越高),则置信范围就越大,导致真实风险与经验风险之间可能的差就越大。因此在设计分类器时,不但要使经验风险最小化,还要使VC维尽量小,从而缩小置信范围,使期望风险最小。这就是为什么在一般情况下选用过于复杂的分类器如神经网络等往往得不到好的效果的原因。7 西安科技大学硕士学位论文2.1.2VC维为了研究学习过程一致收敛的速度和推广性,统计学习理论定义了一系列有关函数集学习性能的指标,其中最重要的是VC维(VapnikChervonenkisDimension)。模式识别方法中VC维的直观定义是:对一个指示函数集,如果存在h个样本能够被函数集中的h函数按所有可能的2种形式分开,则称函数集能够把h个样本打散,函数集的VC维就是它能够打散的最大样本数目h。若对任意数目的样本都有函数能将它们打散,则函数集的VC维是无穷大。有界实函数的VC维可以通过用一定的阈值将它转化成指示函数[21]来定义。作为一个具体的例子,假定模式空间是二维平面,所要考察的函数是由带方向的直线组成。直线的方向由其法线方向表示,法线的箭头所指的一面标记为1,另一面标记为0。这样,该直线就可以看作一个学习机器(分类器)。图2.1表明,平面中的直线可以将三个任意给定的点按所有可能的方式(8种)划分。图2.1平面中的三个点可以被一条直线以任意方式划分但是对于平面上的四个点,如图2.2所示,用上述的直线分类器就无法将它们按照图中所示的方式进行划分。图2.2平面中的四个点无法被一条直线以任意方式划分因此平面中的一条直线分类器最多可以将三个点完全划分,按照VC维的定义,二维平面中直线(分类器)的VC维是3。一般,对于n维空间R中的m个点,如果从中任意去掉一个点,而剩余的所有点都n8 2统计学习理论与支持向量机能保持线性独立关系,则这m个点能被一个超平面完全划分。由于R空间中最多只能n有n个点是线性独立的,因此R空间中的超平面的VC维是n+1。n对于非线性学习机器而言,VC维与独立参数的个数之间并没有明确的对应关系,非但如此,在非线性情况下学习机器的VC维通常是无法计算的。所以对于给定的学习函数集,如何用理论或实验的方法来计算其VC维是当前统计学习理论中还有待解决的问题之一。2.1.3结构风险最小化传统机器学习方法中普遍采用的经验风险最小化原则在样本数目有限时是不合理的,因为需要同时最小化经验风险和置信范围。统计学习理论提出了一种新的策略,即把函数集构造为一个函数子集序列,使各个子集按照维的大小排列,在每个子集中寻找[22]最小经验风险,在子集间折衷考虑经验风险和置信范围,取得实际风险的最小。如图2.3所示。S1S2S3SÌSÌS123h£h£h123图2.3结构风险最小化示意图这种思想称作结构风险最小化(StructuralRiskMinimization,简称SRM),或有序风险最小化,即SRM准则。统计学习理论还给出了合理的函数子集结构应满足的条件及在SRM准则下实际风险收敛的性质。实现SRM原则可以有两种思路,一是在每个子集中求最小经验风险,然后选择使最小经验风险和置信范围之和最小的子集。显然这种方法比较费时,当子集数目很大甚至是无穷时不可行。因此有第二种思路,即设计函数集的某种结构使每个子集中都能取得最小的经验风险(如使训练误差为0),然后只需选择适当的子集使置信范围最小,则这个子集中使经验风险最小的函数就是最优函数。支持向量机方法实际上就是这种思想的具体实现。9 西安科技大学硕士学位论文2.2支持向量机的基本思想支持向量机方法是Vapnik等人根据统计学习理论提出的一种新的机器学习方法,它建立在统计学习理论的VC维理论和结构风险最小化原理基础上,通过适当地选择函数子集及其该子集中的判别函数,根据有限样本信息在模型的复杂性和学习能力之间寻求最佳折衷,使学习机器的实际风险达到最小,以期获得最好的泛化性能。它保证了通过有限训练样本得到的小误差分类器,对独立测试集的测试误差仍然较小。因而,它是[23][24]一个具有最优泛化能力的学习机器。2.2.1线性可分的最优分类面线性可分情况下的广义最优分类面的基本思想可以用图2.4来说明。该广义最优分类面在一维空间中是最优分类点,在二维空间中是最优分类直线,在三维空间中是最优[25][26]分类平面,在高维空间中是最优分类超平面。H1HH2图2.4线性可分情况下的广义最优分类面图2.4中,实心点和空心点分别代表两类样本,H为将两类样本正确分开的分类面,H1和H2分别为过各类样本中离分类面最近的样本且平行于分类面的面,H1和H2之间的距离Δ称作分类间隔(Margin)。当分类面发生变化时,分类间隔Δ也会随之发生变化。反之,给定Δ的值也可以确定相应的分类面(也可能对应着许多分类面,统称为分类面集合)。研究表明,分类间隔与分类面集合的VC维之间满足反比例关系。因此,当训练样本给定时,分类间隔越大,所对应的分类面集合的VC维就越小。所谓最优分类面就是要求分类面不仅能将两类样本正确分开(实现分类错误率为0),而且要使分类间隔最大(实现最优的泛化能力)。根据结构风险最小化原则,前者是保证经验风险最小,而后者则保证了VC维最小,实际上就是使推广性的界中的置信范围最小,从而使真实风险最小。这既确保了分类面问题解的唯一性,又通过最大化两个样本类之间的边缘的训练,得到在测试数据上更好的泛化性能。推广到n维两类线性可分的情况。给定训练样本集:{(xi,yi),i=1,2,…,l},其中10 2统计学习理论与支持向量机TxiÎRn,yiÎ{1,-1}。假设分类面H的方程为w×x+b=0,如果yi=1,则wx+b>0,否则Twx+b<0。根据分类面的性质,任意样本点xi到H的有符号距离为:Twx+bi,i=1,2,L,l(2.3)||w||求解最优分类面的问题实际上就是利用Lagrange优化方法将其转化为对偶问题,即在约束条件:nåyiai=0和ai≥0,i=1,…,n(2.4)i=1下对a求解下列函数的最大值:inn1Qa()=åai-åaayyxxijij(i×j)(2.5)i=12ij,=1n***其中,ai为每个样本的Lagrange乘子。若ai为最优解,则w=åaiyixi,即最优i=1分类面的权系数向量是训练样本向量的线性组合,解中只有很少一部分a不为零,对应i的样本即支持向量。求解上述问题后得到的最优分类函数是:n****f(x)=sgn((w×x)+b)=sgn(åaiyi(xi×x)+b)(2.6)i=12.2.2线性不可分的最优分类面上述的讨论是训练样本线性可分的情况下,在保证全部样本能被正确分类,即经验风险为0的前提下,通过对分类间隔最大化,使分类器获得最好的泛化性能。但在实际问题中,训练样本往往混有噪声或离群点,因此特征空间一般不能做到线性可分(除非使用很强的核,但过强的核容易导致过拟合)。当遇到线性不可分的情形(如图2.5所示)[25][26]时,上述在线性可分情况下的应用就会找不到可行的方法。H1HH2x2x1图2.5线性不可分情况下软间隔分类面Cortes和Vapnik在1995年引入了软间隔分类超平面的概念,当训练样本集是线性不可分、或事先不知道是否线性可分的情况下,可以通过引入非负松弛变量ξi,i=1,2…,l11 西安科技大学硕士学位论文来容许一定数量的错分样本存在。这时约束条件变为:y[(wx)+b]-1+×x³0,i=1,2,L,n(2.7)iii上式中,若ξi=0,则所对应的训练样本被正确地分类;若ξi>0,则所对应的训练样本被错误分类。把容许错分的分类面称为软间隔分类面。为了控制错分样本数(实现对经验风险的控制),且最大化分类软间隔(实现对分类面VC维的控制),引入惩罚因子C。此时的目标函数为:n12Φ(w,ξ)=||w||+C(åξi)(2.8)2i=1其中,C>0是一个自定义的惩罚因子,控制着对错分样本的惩罚程度。C越大,惩罚就越大,对错分样本的约束程度就越高,线性可分的情况相当于C为无穷大。最小化上式第一项相当于最小化分类函数的VC维,从而保证所求的分类函数具有最优的泛化性能;最小化上式的第二项可以控制训练过程中的经验风险,从而保证错分的样本数最少。从上述分析可以看出:支持向量机较好地实现了结构风险最小化原则,在有限训练样本模型的复杂性和学习能力之间寻求了最佳的折衷。参照线性可分情况的处理,为了找到最优分类面的系数,必须解决一个二次规划问题:在约束条件下求目标函数(2.8)式的最小值。其最优分类面的对偶问题与线性可分情况下几乎完全相同,只是约束条件变化为:0+bý(2.12)ïîxSViÎïþ从式(2.12)可以看出,高维特征空间中的判别函数仅涉及变换空间中的内积运算,即,而没有单独的映射f()x出现。因此,甚至没有必要知道非线性映射fiji的具体形式,而只需要它的内积运算即可。只要变换空间中的内积可以用原空间中的变量直接计算得到,则即使变换空间的维数很高,在求解最优分类面时也不会增加多大计算复杂度,从而可以避免维数灾难问题。假定高维特征空间的内积为:¥Kxx(i,)=ågfi(xi),f(x)=(2.13)i=1其中,g>0。称式(2.13)的内积函数Kxx(,)为核函数,它隐式地将输入空间映射ii到高维特征空间,并把高维特征空间的内积运算转化为低维输入空间上的一个简单的函数运算。统计学习理论指出,根据Hilbert-Schmidt原理,只要一种运算满足定理2.1中的Mercer条件,它就可以作为核函数。定理2.1(Mercer条件)为了保证一个连续对称函数Kxx(,)在LC()空间中有一个i2含正系数g>0的展开式:i¥Kxx(i,)=ågfii(xi),fi(x)(2.14)i=1即Kxx(,)是某个特征空间中的内积运算的充分必要条件时,下列条件:i13 西安科技大学硕士学位论文òòKxx(i,)f(xi)f(xdxdx)i>0(2.15)Cn对于所有fÎLC()都成立(C为R的一个紧子集)。2这样,原空间中的对偶优化问题式(2.11)就变为:nnn1Qa()=åai-ååaayyKxxijij(i,j)(2.16)i=12i=1j=1由Mercer条件可知,式(2.16)中的矩阵G=(yyKxx(,)),ij,=1,2,L,n是一个对ijij称的半正定矩阵。因此,式(2.16)是一个凸优化问题,具有唯一的全局最优解,避免了神经网络中可能出现的局部最优解问题。所求得的最优分类判别函数为:ìïüïT**gx()=sgn{wf()x+b}=sgníåayKxxii(i,)+bý(2.17)ïîxSViÎïþ*式(2.17)中的偏移量b可以利用任意支持向量x在约束条件yfx()=1下求得,即:jjj**b=yj-åayKxxii(i,j)(2.18)xSViÎ这样,通过核函数,将输入矢量从输入空间的线性不可分情况变换为特征空间中的线性可分情况。常用的核函数有以下几种:(1)线性核函数(linear)K(x,x)=x×x(2.19)ijij线性核函数在线性可分的模型下具有明显优势,但对于非线性模型不具有推广性。(2)多项式核函数(polynomial)dKxx(,)=[(xx×)+q](2.20)ijij多项式核函数是非线性模型中的最简单形式,但是多项式的阶数不宜过大。(3)径向基核函数(RBF)2-xi-xj2K(x,x)=e/2s(2.21)ij这个核函数由于具有某些良好的性质,表现出较强的学习能力,使用范围较广。(4)二层神经网络核函数(Sigmoidtanh)Kxx(,)=tanh((uxx×)+c)(2.22)ijij又叫做感知机核函数,支持向量对应于感知机的第一层。计算的复杂度较高。2.3多类支持向量机支持向量机是针对两类分类问题提出的,但在实际应用中大多数情况是多类分类问题,例如SAR图像处理中对含有多种目标的图像进行分割等。如何将两类分类的SVM14 2统计学习理论与支持向量机推广到多类分类器,从支持向量机诞生之时起就成为一个研究的热点。现在主要采用将多个两类分类支持向量机组成多类分类支持向量机的结构。常用的[28]组合策略有“一对多”和“一对一”等。(1)一对多的方法(one-against-all)支持向量机多类分类方法最早使用的算法就是“一对多”(one-against-all)方法。要得到多类分类器,通常的方法是构造一系列两类分类器,其中的每一个分类器都把其中的一类同剩下的各类分开。然后据此推断某个输入x的归属。“一对多”方法是对于k类问题构造k个SVM子分类器。在构造第i个SVM子分类器时,将属于第i类别的样本数据标记为正类,不属于i类别的样本数据标记为负类。测试时,对测试数据分别计算各个子分类器的决策函数值,并选取函数值最大时所对应的类别为测试数据的类别。第i个支持向量机需要解决下面的最优化问题:l1iTiimin(w)w+Cåxjiiiwb,,x2j=1Tiiist..(w)f()xj+b³-1xj,ifyj=i,Tiii(w)f()xj+b£--(1xj),ifyj¹i,ix³0,j=1,2,L,lj(2.23)解决了式(2.23)的最优化问题后,就可以得到k个决策函数:T11(w)f(x)+b,M(2.24)Tkk(w)f(x)+b.对于待测样本x,将其输入这k个决策函数中,可以得到k个值,取最大值的函数对应的类别即为该样本所属的类别。通过以上叙述的“一对多”方法的算法过程,可以看到这种方法的一个明显优点是只需要训练k个两类分类SVM,故其所得到的分类函数的个数(k)较少,其分类速度相对较快。这种方法的缺点是每个分类器的训练都是将全部的样本作为训练样本,这样需要求解k个有n个变量的二次规划问题,因为每个支持向量机的训练速度随着训练样本数量的增加急剧减慢,因此,这种方法训练时间较长。另一个缺点是一类对剩余类的这些两类分类问题通常是很不对称的。例如在对从1到10的数字识别中,要建立把“3”这个数字(正类)同其他数字(负类)划分开的决策函数,此时的训练集中负类样本就比正类样本多得多。处理这种不对称,一般通过对不同类别用不同的惩罚因子C来解决。(2)一对一的方法(one-against-one)15 西安科技大学硕士学位论文这种算法是由Knerr提出的,虽然处理的是神经网络问题,但同样可应用于SVM的多分类问题。具体做法是:分别选取2个不同类别构成一个SVM子分类器,这样共有kk(-1)/2个SVM子分类器。在构造类别i和类别j的SVM子分类器时,在样本数据集选取属于类别i、类别j的样本数据作为训练样本数据,并将属于类别i的数据标记为正,将属于类别j的数据标记为负。“一对一”方法需要解决如下的最优化问题:1ijTijijmin(w)w+Cåxtijijijwb,,x2tTijijijst..(w)f()xi+b³-1xt,ifyt=i,(2.25)Tijijij(w)f()xi+b£--(1xt),ifyt=j,ijx³0.t解决这一最优化问题后,即用训练样本进行训练后就可以得到kk(-1)/2个SVM子分类器。在对多类样本进行测试时,用测试数据对kk(-1)/2个SVM子分类器分别进行测试,并累计各类别的得分,选择得分最高者所对应的类别为测试数据的类别。故这种方法又称作投票法。在这种方法中,需要构造多个两类问题的分类器。实际上对k类问题,就有kk(-1)/2个两类分类器。例如k=20,需要构造190个分类器。尽管如此,“一对一”方法的每个分类问题的规模比较小,要学习的问题也比较简单。但是如果k太大,kk(-1)/2就会非常大,这时这个方法就会慢许多。总的来说,这种方法的优点是其训练速度较快,缺点是分类器的数目随类数k急剧增加,导致在决策时速度很慢,且存在不可分区域。除此之外,还有决策有向无环图法、多级支持向量机等方法,虽然它们都能够解决多分类时的不可分区域等问题,但缺点是运算复杂、耗时过长,在样本数有限的情况下,往往会得不偿失。Huang等人的研究表明,“一对一方法”在样本维数不高和样本数量不多的情况下比上述其他方法效果更好。2.4支持向量机的特点通过上述内容,我们可以发现支持向量机方法具有以下几个特点:①支持向量机方法是专门针对有限样本情况的学习方法,其目标是得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优解;②支持向量机方法以统计学习理论的结构风险最小化为基本原则,它通过在最小化经验风险和最大化分类间隔之间进行折衷,以确保实际风险的上界最小,有效地避免了传统学习方法因无法控制分类器的容量而出现的过学习问题,从而确保了所得到的分16 2统计学习理论与支持向量机类器具有较好的泛化性能;③支持向量机方法将原约束条件下的二次规划问题转化为对偶形式的凸二次优化问题,所以找到的最优解一定是全局最优解,从而避免了像神经网络等传统学习方法可能出现的局部最优解问题;④支持向量机方法在解决非线性分类问题时,巧妙地在优化问题的对偶形式中应用了核函数方法,将低维输入空间到高维特征空间的非线性映射以及高维特征空间的向量内积运算隐式地通过核函数在低维输入空间中简单地实现了,即算法复杂度与样本维数无关,从而避免了传统学习分类器在解决非线性高维问题时可能会出现的维数灾难问题;⑤支持向量机方法最终得到的分类函数是由训练样本中拉格朗日乘子不为零的支持向量决定的,而支持向量只占训练样本的一小部分,这使得对偶形式的优化问题具有解的稀疏性这一优良特性(就泛化性而言,较少的支持向量在统计意义上对应好的泛化性能。从计算角度看,小数量的支持向量减少了核形式判别函数的计算量);⑥支持向量机方法是专门针对小样本情况下的学习问题而提出的,它的推理思想是所谓的转导推力(transductiveinference),即从特殊到特殊,而不是传统的归纳推理所采用的从特殊到一般的思想,从而在很大程度上避免了传统学习方法可能出现的不适定(NP)问题;⑦支持向量机方法仅有的自由度是核函数的选择,从而在很大程度上解决了像神经网络等传统学习方法对使用者“技巧”的过分依赖问题;⑧在支持向量机方法中,只要选取不同的核函数,就可以实现多项式逼近、径向基函数(RBF)方法、多层感知器网络等许多现有学习算法。因此,支持向量机方法可以看成是目前大多数学习方法的一个统一框架。2.5本章小结本章主要介绍了统计学习理论的基本思想与支持向量机方法,并对支持向量机方法的特点进行了概述。支持向量机方法是机器学习领域中若干几个标准技术的集大成者。它集成了最大间隔分类面、Mercer核、凸二次规划、稀疏解和松弛变量等多项技术。以往很多困扰机器学习方法的问题,比如模型选择问题、过学习问题、非线性问题、维数灾难问题以及局部最优问题等,在支持向量机方法中都得到了很大程度上的解决。而且,很多传统的机器学习方法都可以看作是支持向量机方法的一种特殊实现,因而,统计学习理论和支持向量机方法己经被视作研究机器学习问题的一个基本框架。17 西安科技大学硕士学位论文3合成孔径雷达及相干斑噪声抑制合成孔径雷达是一种主动式机载或星载传感器。当它工作时,装载其的飞机或卫星在轨道飞行中于不同位置定时对同一地物发射电磁波脉冲信号,同时接收回波信号。在某种意义上可以认为是延伸了雷达天线的长度,从而大大提高了分辨率。自从1978年第一颗合成孔径雷达卫星Seasat成功地实施了对地观测之后,美国、日本及欧洲各国相继开展了利用星载或机载合成孔径雷达技术进行以军事侦察、资源调查、环境监测等为[29]目的的对地观测研究。3.1SAR成像的基本原理合成孔径雷达的工作方式一般是将雷达安装在运动载体(如飞机或卫星)上,以一定的频率不断地发射和接收电磁波脉冲,每发射一次脉冲时的天线位置视为阵列天线的单元振子位置,最后将这些位置上不同时存在的单元振子组合起来,形成一个等效的大孔[30]径天线,从而得到很高的方位分辨率。雷达飞行航线R0R斜距高斜距度直垂目标图3.1SAR图像成像几何模型对条带式正侧视机载合成孔径雷达,SAR成像几何模型可用图3.1表示,目标的某散射点与航线的最近距离为R,设飞机飞行速度为v,则t时刻斜距R为:012242ævtvtö222(3.1)R=[R0+()]vt=Rç1+-+...÷0242R8Rè00ø从原理上说,SAR成像是一个从数据采集到目标图像重构的过程,也可视为不同空间之间的映射。从目标的二维平面散射点出发,根据雷达平台与目标之间的相对运动和两者的几何关系,可得到以系统响应函数表示的信号模型,完成从目标空间到信号数据空间的映射。这种空变统称为距离徙动,它具体包括了线性部分和非线性部分,其中的18 3合成孔径雷达及相干斑噪声抑制线性部分称为距离走动,非线性部分称为距离弯曲。具体可分为如下四种情况:①距离走动和距离弯曲都不考虑,如10m×10m的星载SAR就属于这种情况,可采用距离、方位分维处理的RD算法来处理。②考虑距离走动,不考虑距离弯曲,如3m×3m的X波段机载SAR,可采用RD加距离走动补偿的方法来处理。③距离走动和距离弯曲都考虑,但场景中所有距离单元的弯曲程度相同,如1m×1m的机载SAR,仍可采用RD算法,但需将距离弯曲加以补偿。④距离走动和距离弯曲都考虑,且场景中不同距离单元的弯曲程度不同,如X波段0.5m×0.5m机载SAR等。3.2SAR成像目标特性分析3.2.1SAR图像中不同地物目标的特点合成孔径雷达图像的内容反映了被测地域对无线电波的散射特性。具有相同无线电波散射特性的地域表现为相同的图像灰度,尽管它们的光学反射特性并不相同。和光学图像相比,雷达图像有更多的纹理、地物轮廓更清晰、对比度更好并能呈现更多的细节。此外地物表面的粗糙度、介电特性、目标的角度特征以及微波信号的穿透性都会在SAR[31]图像中得到很好的反映。在雷达图像中,光滑表面表现为暗区域,粗糙表面则呈现为较亮的区域。一般将成像雷达测量的粗糙度分为小尺度、中尺度和大尺度三类。小尺度粗糙度指雷达空间分辨率内的粗糙度,决定了图像灰度的大小;中尺度粗糙度是几个象元大小范围内的粗糙度,它是空间分辨率的函数,是影响图像纹理的主要因素;大尺度粗糙度一般指地形粗糙范围为多个象元大小,是地形坡度和雷达视角的函数。雷达图像上正对着传感器的坡面亮,背对的坡面暗,因此大尺度粗糙度为侧视雷达图像提供了立体效果。表面粗糙度是指在一个雷达分辨单元之内表面的粗糙程度,它与地物的平均高度变化、入射波长、入射角有密切关系,一般也分为三种粗糙度类型:对于光滑表面,平均高度变化比入射波长小得多,地物反射角等于入射角,入射能量绝大部分沿着出射角出射,返回雷达方向的后向散射能量很小,因此在雷达图像中呈现为暗区域;稍粗糙和中等粗糙表面,平均高度变化与入射波长相当;非常粗糙的表面,平均高度变化比入射波长大得多。当地面或水面是粗糙的情况下,就有相当数量的辐射能量向所有方向散射,因此返回雷达的回波信号较强,在图像上显得比较明亮。地物的介电常数对雷达回波也有重要影响,大量的实验结果已经表明,介电常数越大,回波越强,反之越弱,而介电常数与地物的湿度、结构和所用频率等因素有关。垂直表面和水平表面能组合为双面角反射器,如果这两个表面接缝的取向与雷达视19 西安科技大学硕士学位论文线接近垂直的话,这个双平面是高度回射的。对于一个建筑群来说,因彼此互成直角的三个平面表面有许多可能的组合,从而构成像角反射器那样具有高度回射性的目标,在SAR图像上呈现出很多很强的亮点;孤立的建筑物,有较强的回波,故容易识别其外形,而利用阴影长度,还可以测量其高度;而对于桥梁来说,由于其桥墩、跨梁等构件组成的角反射器效应,所以在SAR图像中显示为强目标,特别是在桥梁下面的河流或道路衬托下轮廓更显突出;道路在SAR图像中对应为线性的暗区;机场和停机坪虽然回波很弱,但它们有鲜明的轮廓,如机场跑道呈直线状暗区,所以利于被识别;停放的飞机和车辆都会产生极强的回波,因此在SAR图像中呈现为很亮的目标。图3.2说明了不同表面和相应SAR图像的对应关系。不同表面各种表面平面平面森林森林农田农田山脉山脉粗糙面粗糙面城市城市相对应的相应的SAR图像SAR图3.2SAR图像与相应地物的成像对应示意图综上所述,合成孔径雷达的成像方式造成了SAR图像中不同目标具有各自的特点,这为后期的SAR图像分割等研究提供了理论依据。3.2.2SAR图像数据的统计特性合成孔径雷达利用目标特征对无线电波的散射系数的差别对目标进行检测和成像。在探测和成像过程中,由于存在系统噪声和相干闪烁,使图像质量变差。这里的噪声指雷达接收机噪声,相干闪烁则是由于在同一个分辨单元内,存在许多独立的散射单元的[31]散射波相干叠加所产生,从而在SAR图像上形成相干斑噪声。由于地域回波的噪声20 3合成孔径雷达及相干斑噪声抑制和相干闪烁都是随机变量,因此,SAR图像的分布具有概率统计特征,其回波数据一般用统计模型来表示,常用的统计模型有瑞利分布模型和对数——正态分布模型等。3.3SAR图像斑点噪声抑制的常用方法图像分割是目标自动识别的关键和首要步骤,它的目的是将目标和背景分离,为计算机视觉的后续处理提供依据。但由于SAR图像中包含了由成像界面上大量散射点的相干回波随机干涉造成的相干斑,使SAR图像的分割工作变得相当复杂。因此,对SAR图像进行预处理——消除或减少相干斑噪声是非常必要的。在过去的二十多年中,许多学者已经研究过SAR相干斑噪声抑制方法,并得到了[32]一些比较有效的方法。这些方法基本上可分为两大类。一类是多视处理,它本质上相当于图像的低通滤波。这类方法简单,能够有效抑制斑点噪声,但却降低了图像的空间分辨率、模糊了图像的边缘。另一类是在不损失分辨率的情况下,用滤波方法来抑制噪声。抑制噪声的滤波器一般有以下几种构造方法:(1)传统方法包括中值滤波、均值滤波、局部均值滤波、K邻近滤波、Sigma滤波等,这类方法的缺点是平滑噪声的同时损失了边缘信息。(2)模型方法先假定静态的噪声模型(加性、乘性、独立信号),然后采用相应的滤波器对图像进行处理,如Kalman、Lee滤波器等,由于对噪声的静态假设与信号的实际情况不会完全一致,因此有时滤波效果不好。这些滤波器一般多考虑图像的局部灰度统计特征。(3)局域统计自适应滤波这种方法主要是基于图像局部直方图特征、灰度、均值、方差、梯度等参数来决定参与滤波的领域点的权值,进行自适应滤波,是目前最常用的方法,典型的有Kuan、Frost滤波器等。这些滤波器利用成像处理的视数来决定图像的噪声强度。局域统计自适应滤波能在平滑噪声的同时较有效地保持明显的边缘,而且能够通过参数控制来调整平滑效果和边缘保持效果。(4)几何滤波法把图像的平面坐标加上灰度值考虑为一种三维模型,用各种图像处理方法将图像上的同质区域和边缘分离出来,然后对同质区域进行噪声滤波,其边缘保持能力要优于局域灰度统计滤波,这种滤波器的典型代表是GammaMAP滤波器。(5)基于小波的滤波利用小波理论将图像分成代表不同尺度信息的一系列图像,对代表低频成分的低分辨率图像进行降噪处理,对代表高频成分的高分辨率图像进行适当的域值处理以保留主要的边缘信息,然后再重建图像。这种方法的噪声压制和边缘保持效果都很好,因此本21 西安科技大学硕士学位论文文采用此方法对SAR图像进行噪声抑制。3.4基于小波的滤波方法3.4.1小波变换(1)连续小波变换Ù2设y()t为一平方可积函数,即y()tÎLR(),若其傅立叶变换y()t满足条件:2Ùyw()C=dw<¥(3.2)yòRwy()t称为基小波或母小波,上式即为小波函数的允许条件。母小波y()t经伸缩和平[33]移后,就可以得到一个小波序列:1tb-y()t=y(),ab,ÎRa,¹0(3.3)ab,aa其中a为伸缩因子,b为平移因子,y()t称为小波基函数。ab,2对于任意的函数ft()ÎLR()的连续小波变换为:-1tb-Wab(,)==a2ft()(y)dt(3.4)fab,òRa当所用小波的允许条件成立时,其逆变换存在:11tb-ft()=Wab(,)(y)dadb(3.5)òòR+R2fCaay(2)离散小波变换可通过对公式(3.4)的伸缩因子a和平移因子b取样,得到离散小波变换。如果对a和mmb按如下规律取样:a=a,b=nba,其中a>1,bÎR,则ft()的离散小波变换为:00000m¥2-m(3.6)Wfmn(,)=aft()(yatnbdt-)y0ò00-¥当a=2,b=1时,上式变为二进小波变换:00¥-m-mWfmn(,)=2ft()(2ytndt-)(3.7)yò-¥(3)多分辨率分析1986年,S.Mallat在多尺度逼近的基础上提出了多分辨率分析(Multi-ResolutionAnalysis,简称MRA)的概念,也称多分辨逼近。如果我们把尺度理解为照相机镜头的话,当尺度由大到小变化时,就相当于将照相机镜头由远及近的接近目标。在大尺度空间里,相当于从远处观察目标,只能看到目标大致的概貌;在小尺度空间里,相当于从近处观察目标,可观测到目标的细节部分。因22 3合成孔径雷达及相干斑噪声抑制此,随着尺度由大到小的变化,在各尺度上可以由粗糙到精细地观察目标,这就是多尺[34]度的思想。2小波变换的多分辨率分析是建立在函数空间概念上的理论,是指如果空间LR()中的一列嵌套式闭子空间{V},它满足如下条件:jjZÎ①单调性:对于任意jÎZ,VÌV;jj-12②逼近性:IVj={0,}UVj=LR();jZÎjZÎ③伸缩性:fx()ÎVÛf(2)xÎV,jÎZ;jj+1④Riesz基:存在fÎV,使得{f(tk-)}是V的正交基;0kZÎ0⑤平移不变性:fx()ÎVÛfxn(-)ÎV,jn,ÎZ。jj2那么就称空间系列{V},jÎZ为LR()的一个多分辨率分析,其中f()t为尺度函数。j小波变换的多分辨率分析是将信号按由精细到粗糙的级别进行分解,在第一级分解中,用理想低通滤波器H和理想高通滤波器G将信号频带V分解成两个子空间V和j+1jW,其中V为低频空间,W为高频空间,是V的正交补空间,即V是V和W的直和,jjjjj+1jj可记作V=VÅW;在第二级分解中,同样用H和G将V分解成低频子空间V和高j+1jjjj-1频子空间W,V是V和W的直和,同理可以继续对V,V,K,V分解,得到j-1jj-1j-1j-1j-21不同级别下的低频和高频子空间,最后有V=WÅWÅLÅWÅV,如图3.3所示.j+1jj-100Vj+1VjVj-1…V1V0WjWj-1W1W0图3.3MRA所确定的空间直和分解关系(4)二维Mallat算法[35]小波变换的概念可从一维推广到二维,并有相应的Mallat算法。因为二维小波具有可分离性,所以图像的小波变换可分别在列方向和行方向上进行一维的小波变换,此22时二维尺度函数f(,)xyÎLR()可表示为两个一维尺度函数的乘积:f(,)xy=f()()xfy(3.8)令y()x、y()y分别为与f()x、f()y相对应的一维小波,在j尺度上,二维的二进小波可表示为以下3个可分离的正交基函数:y(,)xy=f()()xyy(3.9)1y(,)xy=y()()xfy(3.10)2y(,)xy=y()()xyy(3.11)32设二维信号fxy(,)ÎV的二维分解为:jj+1jjjjf(,)xy=f(,)xy+w(,)xy+w(,)xy+w(,)xy(3.12)12323 西安科技大学硕士学位论文仿照一维Mallat算法,可求出二维Mallat算法的分解关系式为:jj+1cmn(,)=ååckj,hk-2nlh-2m(3.13)kljj+1dmn1(,)=ååckj,gk-2nlh-2m(3.14)kljj+1dmn2(,)=ååchkj,k-2ngl-2m(3.15)kljj+1dmn3(,)=ååckj,gk-2ngl-2m(3.16)kl3.4.2图像的小波变换图像属于二维信号,因此可用二维Mallat算法对图像进行分解和重构。由于在图像的小波变换过程中分别对行和列进行间隔采样,于是图像每进行一级小波变换,所得的子频带的行和列将变为原来的一半,图像被分解为4个大小是原图尺寸1/4的子频带,即频率范围减半,分辨率降为1/4。将得到的四个子频带分别记为LL、HL、LH和HH,各子频带的位置关系如图3.4(b)所示,每个子频带分别代表原图像不同的频率特性和方[36]向特性:①LL频带表示水平低通、垂直低通后的小波系数分布,是图像内容的缩略图,图像数据能量集中于此频带。②HL频带表示水平高通、垂直低通后的小波系数分布,该频带保存了图像水平方向上的高频边缘信息。③LH频带表示水平低通、垂直高通后的小波系数分布,该频带保存了图像垂直方向上的高频边缘信息。④HH频带表示水平高通、垂直高通后的小波系数分布,该频带保存了图像对角线方向上的高频信息。第二级的小波分解只对上述的LL频带进行,进一步将LL频带分解为LL2、HL2、LH2和HH2四个子频带,频率范围进一步减半,结果如图3.4(c)所示。第三级的小波分解可以此类推。LL2HL2LLHLHLLH2HH2LHHHLHHH(a)原图像(b)一级小波分解(c)二级小波分解图3.4图像小波分解示意图小波变换在时域和频域都具有能够表征信号局部特征的能力,使其在信号处理特别24 3合成孔径雷达及相干斑噪声抑制是图像处理中表现出下列优点:①小波变换的完善重建能力,保证了信号在分解过程中没有任何信息损失、不产生冗余信息。而且小波变换的快速算法——Mallat算法,更促进了小波变换的广泛应用。②小波变换可以覆盖到整个领域。小波变换把图像分解成平滑图像和细节图像之和,它们分别代表了图像的不同结构,因此原始图像的结构信息和细节信息很容易提取。③小波变换的多分辨分析特性使其具有“聚焦”的特性,能在不同的尺度对图像进行分析。④二维小波分解,为图像分析提供了方向性选择,这种方向性选择非常适合于人眼的视觉系统特征。⑤小波变换的选基灵活性,增强了小波变换在不同应用中的适应能力,使图像处理达到更好的效果。因此,小波分析已被广泛应用于信号的瞬态分析、分形信号分析、信号去噪、数据压缩、图像边缘提取、图像融合等领域。3.4.3小波去噪的原理在数学上,小波变换去除噪声的本质是一个函数逼近问题。即如何在由小波母函数伸缩和平移所展成的函数空间中,根据提出的衡量准则,寻找对原信号的最佳逼近,以完成原信号和噪声的区分。可见,小波变换去噪方法也就是寻找从实际信号空间到小波函数空间的最佳映射,以便得到原信号的最佳恢复。从信号学的角度看,小波变换去除噪声是一个信号滤波的问题,而且尽管在很大程度上小波变换去除噪声可以看成是低通滤波,但是由于在去除噪声后,还能成功地保留图像特征,所以在这一点上又优于传统的低通滤波器。由此可见,小波变换去噪实际上是特征提取和低通滤波功能的组合。小波函数在时域频域都具有较好的局部性,其多尺度特性使得小波变换对信号具有一种“集中”的能力。含噪图像经过小波变换后,图像本身的能量主要集中在低频系数和高频一些大的小波系数上,而噪声能量则均匀散布在低频系数和各个高频系数上。在变换域,图像的空间相关性降低,能量更集中,而噪声的能量分布不变。小波去噪方法的基本思想是:利用图像和噪声在小波变换域的不同统计特性,通过各种方法尽可能多[37]地剔除噪声分量,保留信号分量。当采用小波变换的方法对图像进行去噪时,小波基的选取会影响小波系数的分布,进而影响图像的去噪效果。不同小波基的去噪效果与小波基的性质有关:①正交小波基能简化计算过程,尺度内和尺度间的相关性小,但不具备线性相位(Harr小波基除外);双正交小波基则以牺牲部分正交性实现滤波器的线性相位。②小波基的正则性可避免去噪后的图像产生方块效应,但正则性越高一般意味着25 西安科技大学硕士学位论文函数的支集越长。③去噪时一般选择具有紧支性的小波基,支集越小的小波,局部化能力越强,但小波函数的正则性会变差,不利于对平滑性高的图像进行处理。此外,不同小波基去噪效果的差异还与噪声水平高低、图像自身的特点等具体情况有关,从上述小波基性质可以看出有些性质不能同时兼顾,因此在去噪时可根据具体情况选取适合的小波基。小波变换去噪是基于高斯加性噪声假设的,由于SAR图像的相干斑点噪声属于乘性噪声,而小波变换是一种线性变换,无法将具有相乘关系的两个分量分开。通常的解决方法是取对数,对数变换后相干斑噪声模型由乘性噪声转变为加性噪声,而且近似为[38][39]高斯加性噪声。因此,在对SAR图像进行小波变换时,其步骤可概括为以下五步:①对原图像进行对数变换。可采用对数变换公式:'f=ln(f+1)(3.17)'式中,f为待变换的输入值;f为变换后的输出值;用ln(f+1)可避免对零取对数。②对图像进行小波变换,得到不同尺度的小波系数。③对小波系数进行去噪处理,得到新的小波系数。④对新的小波系数进行小波反变换。⑤指数变换并拉伸得到去噪后的图像。对应的指数变换公式为:'f=exp(f)-1(3.18)其中,小波去噪的关键步骤是小波变换后对小波系数的处理。3.5小波滤波算法本文采用的小波滤波方法的基本步骤如下:①对含噪声的SAR图像取对数,取对数前、后的图像分别如图3.5、3.6所示。图3.5含乘性噪声的SAR图像图3.6对含噪图像取对数后②将对数图像采取树型小波分解到二层,结果如图3.7所示,再将小波分解系数取绝对值。26 3合成孔径雷达及相干斑噪声抑制图3.7对数图像进行两次分解后的图像③对细节子图像进行如下处理:a将二次分解后的6个细节子图像分为强部分与弱部分,如果[细节子图像的绝对值]≥T,归为强部分,如果[细节子图像的绝对值]

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
大家都在看
近期热门
关闭