基于底层特征和SVM的图像分类

基于底层特征和SVM的图像分类

ID:74833037

大小:2.38 MB

页数:55页

时间:2023-02-03

上传者:笑似︶ㄣ無奈
基于底层特征和SVM的图像分类_第1页
基于底层特征和SVM的图像分类_第2页
基于底层特征和SVM的图像分类_第3页
基于底层特征和SVM的图像分类_第4页
基于底层特征和SVM的图像分类_第5页
基于底层特征和SVM的图像分类_第6页
基于底层特征和SVM的图像分类_第7页
基于底层特征和SVM的图像分类_第8页
基于底层特征和SVM的图像分类_第9页
基于底层特征和SVM的图像分类_第10页
资源描述:

《基于底层特征和SVM的图像分类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

摘要近年来,随着计算机技术的发展更新以及图像数据库的日益增多,如何从中快速提取视觉信息越来越受到人们的重视,对图像数据库的分类和检索成为获取图像信息的重要研究问题之一。而图像分类能够减小图像检索范围,使检索效果更加明显,因此图像分类有着极其重要的实用价值。图像分类的研究主要集中在以下两个问题:图像特征的提取和利用学习器对特征进行分类。图像的纹理特征具有旋转不变性,而图像的颜色特征具有较强的鲁棒性,它们是图像中较为重要的两种底层特征。Gabor小波变换是在Fourier分析的基础之上发展起来的具有较好的信号和图像处理的方法,它在图像的纹理特征提取中能够达到较好的效果,计算也较为简便。支持向量机(SupportVectorMachine,SVM)是一种基于统计学理论的一种学习机器。它能够将原样本空间中的非线性可分问题,并进一步在线性可分的特征空间中进行分类研究。本文主要基于Gabor小波和SVM完成了两个工作:一是提出了一种彩色Gabor纹理特征和SVM的图像分类方法,在特征提取部分避免了部分颜色纹理的丢失。Gabor小波在对纹理灰度图像特征提取中有较好的表现,然而对于彩色自然图像中的纹理特征提取则容易丢失部分彩色信息,而在图像的RGB三通道中分别提取纹理特征,形成彩色图像的伪彩色纹理特征,用于分类,则能够保留部分彩色图像的彩色信息。利用SVM对自然图像库Corel1000图像库进行学习、分类、实验对比,验证了本文所提方法对自然图像有较好的分类效果。二是提出了一种基于多特征融合和SVM的智能图像分类算法。对于一幅自然图像,其单一的底层特征往往不能较为全面的表示图像的信息,本文先利用每个单独的底层特征训练出一个SVM分类器,然后用粒子群优化(ParticleSwarmOptimization,PSO)来确定每个分类器的权重,找到最优的参数设置,最后进行投票,对彩色图像进行分类。通过对自然图像库Corel1000图像库进行实验对比,验证了本文所提的基于多特征融合和SVM的算法对自然图像有较好的分类效果。关键词:图像分类,Gabor小波,支持向量机,多特征融合,粒子群优化 ABSTRACTInrecentyears,withthedevelopmentofcomputertechnologyandincreasementofimagedatabase,howtoextractvisualinformationfromimageismoreandmoregettingtheattentionofpeople.Classificationandretrievalforimagedatabasehavebecomeanimportanttechnologytogetimageinformation.Andimageclassificationcanreducethescopeofimagedatabase,andmadetheretrievaleffectmoreobvious,sotheimageclassificationhasaveryimportantlypracticalvalue.Imageclassificationresearchfocusesontwoissues:thefeatureextractionofimageandlearningmachine.Thetexturefeatureandcolorfeaturearetheimportantlow-levelfeatureforimages.GaborwaveletstransformisdevelopedonthebasisofFourieranalysis,whichisagoodsignalandimageprocessingmethod.Supportvectormachine(SVM)isakindoflearningMachinebasedonstatisticaltheory.Itcanchangetheoriginalnonlinearinseparableproblemintoalinearseparablefeaturespaceforclassificationstudy.Theworkofthispaperismainlyconcentratedontwothelastaspects:Infirstplace,aimageclassificationmethodbasedoncolorGabortexturefeaturesandSVMisproposed,whichavoidsthelossofcolortextureinfeatureextractionpart.Gaborwavelethasgoodperformanceforgrayimage,butfornaturalcolorimageit’smissingpartofthecolorinformation.SoweextractthetexturefeatureintheimageofRGBthree-channelandformthepseudocolorimagecolortexturefeatureusedforimageclassification.Thiswaycankeeppartofthecolorinformationofcolorimage.WeusetheCorel1000astheimagedatabase,toverifytheproposedmethodinthispaperhasgoodclassificationeffectonnaturalimages.Inthesecondplace,wepresentedakindofintelligentimageclassificationbasedonfeaturefusionandtheSVMalgorithm.Foranaturalimage,thesinglefeaturealwaysdoesn’trepresentalloftheimageinformation,butthemultiplefeaturescanbetterrepresentimageinformation.Inthispaperweusethelow-levelfeaturesofeachindividualtotrainaSVMclassifier,andthenweuseparticleswarmoptimization (PSO)todeterminetheweightofeachclassifierandthenusedforclassifyingcolorimages.ExperimentsbasedonnaturalimageCorel1000provetheproposedalgorithmfornaturalimagehasgoodclassificationeffect.KEYWORDS:imageclassification,Gaborwavelets,supportvectormachine,multi-featurefusion,particleswarmoptimization 目录摘要........................................................................................IABSTRACT................................................................................III第一章绪论..............................................................................11.1研究背景及意义.................................................................11.2图像分类研究现状..............................................................21.3支持向量机......................................................................31.4论文的主要工作和结构安排...................................................3第二章图像的底层特征提取...........................................................52.1图像的纹理特征.................................................................52.2图像的颜色特征................................................................72.3图像的形状特征..............................................................122.4图像的空间位置特征.........................................................12第三章支持向量机理论...............................................................133.1支持向量机(SVM)基础理论背景.........................................133.2SVM二分类...................................................................153.3SVM多分类...................................................................17第四章基于彩色Gabor纹理特征和SVM图像分类...............................194.1Gabor滤波....................................................................194.2图像的彩色纹理特征.........................................................214.3实验及分析....................................................................234.4小结............................................................................28第五章基于SVM的多特征融合图像分类..........................................295.1颜色直方图....................................................................295.2多特征空间学习..............................................................335.3基于粒子群优化算法的参数选择...........................................355.4多特征融合SVM-PSO的图像分类实验结果及分析......................365.5小结............................................................................40总结与展望..............................................................................41参考文献.................................................................................43致谢.....................................................................................47攻读硕士期间参与的科研项目........................................................49 绪论第一章绪论1.1研究背景及意义近年来,随着计算机视觉、多媒体技术、Internet以及数据库技术迅速的发展,数字图像的产生、储存、传输及访问次数急剧增加,从海量的图像数据信息中选择人们所需要的图像信息面临一个严峻的问题。一方面人们希望获得较多的数据图像,以便得到更全面的信息;另一方面,如何从更多图像中准确快速的获取图像信息更加困难。因此如何有效的组织和管理所获得无序的图像数据,并能够从中快速、准确、全面的找到用户所需要的图像已经成为人们急需解决的问题。图像分类作为处理和组织大量图像数据的一种关键技术,可以在很大程度上[1]解决图像数据自身的无序化问题。而且图像分类在基于内容的图像检索、医学图像识别等领域是具有关键性作用的一项工作。在基于图像检索的领域中,由于图像数据库的日益增大,因此图像的底层视觉特征和高层语义特征之间的间隔更大,使得检索效果不很理想。而图像分类可以减小图像数据库规模,减小各个领域内图像的底层视觉特征和高层语义特征间隔,改良检索效果;随着医学成像技术的发展,医学图像在临床诊断时发挥了越来越大的作用,然而传统的医学图像诊断方法是根据医生的个人从业经验进行判断,人的主观性对判断结果有很大的影响,因此,如果利用图像分类技术对医学图像进行分类,能够使得诊断结果更加的客观、准确。图像分类在工业检测中也有应用,随着自动化技术的发展,产品在生产过程中不可避免的产生出次品,仅仅靠人工视觉判断次品,由于人的主观性和体力所限,不可避免的漏掉次品,如果利用实时监测系统采集生产线上的产品,并利用图像分类技术对其进行实时分类,可以较快的检测出残次品。图像分类在遥感图像的处理中也有较多的应用。综上所述,图像分类在生活、科技等方面有着较为重要的应用,因此图像分类的研究具有重要的理论和实际研究意义。1 基于底层特征和SVM的图像分类1.2图像分类研究现状图像分类是根据所提取的图像特征,使用特定的分类技术对图像进行分类。按照图像分类方法的发展时间可以将分类方法分为基于文本和基于内容的图像分类方法。20世纪70年代,出现了基于文本的图像分类方法,其一般过程是对图像进行人工标注,然后根据所标注的文本信息对图像进行分类。然而随着图像数据库的日益庞大,基于文本的图像分类方法的缺陷日趋明显,其缺点主要有以下两点:第一,耗费大量的人力和时间,对大规模的图像库进行人工标注工作量巨大;第二,人工标注准确性较低,这是因为对图像进行人工标注时受人的主观性影响较大,故对图像的标注准确性较差。针对基于文本分类的缺点,20世纪90年代,基于内容的图像分类方法应运而生,基于内容的图像分类,直接针对图像本身进行分类,不需要对图像进行人工标注,节省了标注时间,同时避免了人工标注时的主观影响。其主要流程如下图1-1:图像收集特征提取图像分类图1-1基于内容图像分类方法流程图图像分类常见的方法有两类:一类是基于图像空间域的分类方法;一类是基于图像变换空间的分类方法。基于图像空间域的分类方法一般是利用图像的灰度、颜色、纹理和空间位置等底层特征对图像进行分类,常见的分类方法有基于灰度直方图分类,基于纹理特征的分类,基于纹理边缘颜色直方图特征的分类,用矩阵表示图像,矩阵元素表示图像灰度值,(BP网络分类器等)。这些方法分类精确率一般较高,但是计算复杂度较高,特征提取时间较长。图像分类基于图像变换域的分类方法主要是将图像通过变换,提取变换后图像的系数特征,一般的变换方式有Fourier变换、Gabor小波变换、小波变换和后小波变换。在变换域中处理图像一般是降维,使得图像特征提取的计算复杂度较低,且分类效果与特征提取的关系较大。按照有无监督可以将图像分类方法分为有监督和无监督两类。无监督分类是指在分类过程中没有利用任何先验知识,仅凭图像数据本身对图像进行分类。这2 绪论种分类方法的分类只是对不同类别进行了区分,分类之后才可以知道其属性。无监督分类也可以称为聚类分析,其一般分类步骤是先选取若干样本点作为聚类中心,然后按照一定的相似性度量方法将样本按照聚类中心分类,之后再根据某种聚类准则判断分类是否正确,若不正确则继续进行分类,否则停止分类。无监督分类的学习过程是边学习边分类。有监督分类是利用先验知识训练出各类的特征分布,然后对未知样本进行分类。简单的说就是通过对已知类别样本的学习,训练出分类器,然后利用分类器对未知类别的样本进行分类预测。本文所采取的SVM分类方法就是一种有监督分类方法。近年来,国内外的许多学者对基于内容的图像分类进行了实验研究。[2]Szummer等人在图像的颜色空间中以颜色直方图为特征,利用K-近邻分类器[3]对图像进行了分类;荆晓远等人利用小波变换提取人脸图像特征,然后利用K-近邻分类器对人脸图像进行分类实验。1.3支持向量机[4]近几十年来图像分类技术飞速发展,出现了很多有效的智能分类方法,比如K-近邻分类法,决策树分类法,Boosting方法,神经网络和支持向量机。其中[5]支持向量机(SupportVectorMachine,SVM)是由Vapink等人提出的,SVM是基于统计学习理论建立在结构风险最小化基础上的一种新的机器学习方法,具体强大的非线性处理能力。近年来,SVM已经成为数据挖掘和机器学习领域的较好的处理工具,被广泛应用到数据挖掘、模式识别、智能控制和预测中,是机器[6]学习领域的研究新热点。SVM在图像检索和图像分类中应用中已经较为常见。[7][8]SVM图像分类在雷达图像的目标识别和核磁共振图像的分类中均有应用。[9]Gomez.Moreno等人利用SVM研究了图像边缘问题,其方法是选取边缘和非边缘样板,利用SVM训练得到求解图像边缘和非边缘的分界面,其实也就是二分类问题。1.4论文的主要工作和结构安排本文介绍了基于底层特征及其特征融合的图像分类相关内容,主要介绍了基3 基于底层特征和SVM的图像分类于Gabor纹理特征、多特征融合的图像分类和SVM分类器。提出了一种多特征融合分类方法,在此基础上对Corel1000图像库进行实验并分析了图像分类实验结果。第一章是绪论,主要介绍了本文写作的背景和论文主要结构;第二章是图像特征提取的基础知识介绍。给出了一些常见的特征提取方法,如颜色、纹理和形状特征;第三章介绍了SVM的基础理论知识,及其在图像分类中的基础应用;第四章提出了基于彩色Gabor纹理特征和SVM的图像分类方法。主要通过对彩色图像本身研究给出了本文的方法。首先给出了Gabor滤波器基础知识的介绍。然后给出了彩色纹理特征的SVM图像分类方法,并比较了图像纹理特征和彩色纹理特征对于Corel1000图像库分类效果的优劣;第五章给出了基于多特征融合和SVM的智能图像分类方法,针对单一特征不能够较好的提取图像完整的特征完成图像分类的任务。首先介绍了多视图理论,并通过PSO参数选择方法确定了特征混合的参数;给出了基于图像多特征混合的智能分类方法。最后对全文做出了总结并对图像分类问题做出了展望。第四章和第五章是本文的主要内容。4 第二章图像的底层特征提取第二章图像的底层特征提取基于图像内容的图像分类,其特征的提取是最为基础也是最为重要的第一步。图像特征是对图像本身进行研究得到的区别与其他图像的信息。例如给出一幅苹果和橘子的图像,区分它们的依据就是它们本身具有的不同特征。一般认为图像的内容特征包括两个层次,即:图像的底层特征和高层语义特征。图像的底层特征是图像本身的客观统计特性的表示,其优点是图像的自身内容的表示,没有人的主观理解,但是同时其缺点是不能真正为人的视觉系统所理解;图像的高层语义特征是人们对图像本身内容含义的定义和理解。图像的特征提取是对图像本身像素及像素间关系进行分析,进而得到能够表示图像内容的一系列数字或者表示。一般来说我们要求提取的特征能够较好的区分具有不同内容的图像。本文中主要研究的是基于视觉特征的图像底层特征的提取。常用的图像底层特征为图像纹理特征、颜色特征、形状特征和空间位置关系特征。2.1图像的纹理特征纹理是描述图像的一个重要底层特征,它是一种全局特征,它是物体表面或者图像中描述区域的一种明显特征。图像的纹理特征反应了图像的灰度变化规律,也反映了图像的结构信息和空间分布信息。在分析图像时,人们将灰度变化规律数字化并提取纹理特征,由于人们对纹理的感知与其在图像中几何位置无关,所以纹理特征还具有尺度不变性和旋转不变性。根据分类方式的不同,纹理可以分为不同种类,如按照来源不同可以分为人工纹理和自然纹理;按照纹理自身性质可以分为结构纹理和随机纹理。人工纹理是人为制造的,一般为具有一定规律周期的结构纹理;而自然纹理为自然界自身产生的纹理,一般为结构、周期都不明显的随机纹理。常用的纹理特征提取方法有:统计分析法、结构分析法、频谱分析法和关键点方法。(1)统计分析法统计分析法是纹理描述方法中常用的一种,也是纹理分析中研究较多较早的5 基于底层特征和SVM的图像分类一类方法。统计分析方法通过统计图像的空间频率、边界频率以及空间灰度依赖关系等来分析纹理。一般来讲,纹理的细致和粗糙程度与空间频率有关,细致的纹理有较高的空间频率,而粗糙的纹理一般具有较低的空间频率;单位面积的边界数是度量纹理细致和粗糙程度的一种统计方法,边界频率越高说明纹理越精细,反之,纹理越粗糙,边界频率一般较低;从描述空间灰度依赖关系的角度出发也是分析和描述图像纹理的一种重要方法。常用的统计纹理分析方法有自相关函数(AutocorrelationFeatures)、边界频率(EdgeFrequency)、空间灰度依赖矩阵(theSpatialGreyLevelDependenceMatrix,SGLDM)等。统计分析方法一般计算量较大,分割精度差,抗噪能力弱,然而对于微纹理(Micro-Texture)图像,统计分析方法有较好的效果。(2)结构分析法结构分析法认为纹理是由许多纹理基元组成的,它们按照某种分布规则构成了纹理。即认为图像中复杂的纹理是由一些简单的纹理基元以一定规则或者方式组成的。结构分析方法的重点是以对纹理基元的分析为提前,特别是对于自然界中的自然图像。自然图像具有多种多样的纹理,将这些纹理全部划分成小的纹理基元是非常困难的。但是如果能够将纹理划分成简单的纹理基元就可以克服统计分析方法中计算量较大的问题。纹理基元的分割是一件不容易的事情,只有纹理基元较大且容易分割时候,结构分析方法才比较适合,其一般过程为三步:图像增强、基元提取、提取纹理基元特征。(3)模型分析法模型分析法认为图像的每一个像素与其周围的像素存在一定的相互关系其关系可能是线性的,也可能符合一定的概率关系。常用的模型自回归模型、马尔科夫随机场模型、分形模型、Gibbs随机场模型,这些模型方法是用模型系数来表示图像纹理特征,这类方法的关键是对图像的纹理结构进行分析以选择到最适合的模型,接下来是估计这些模型的关系。但是模型分析法的缺点是计算量大,自然纹理很难用单一模型表达的缺点。(4)频谱分析法频谱分析法是计算机视觉和图像处理中比较重要的一种分析方法,其在纹理分析中的应用也较为广泛。频谱分析法是将空间域中的纹理图像变换到频域中,6 第二章图像的底层特征提取由此得到图像的纹理特征。Fourier变换、小波变换和Gabor滤波器等是较常见的频谱分析方法。本文采用Gabor滤波器来提取图像纹理特征,并用得到的纹理特征对图像库进行分类。2.2图像的颜色特征颜色是图像另一个比较重要的底层特征。它描述的是图像或者多对区域的视觉特征,其在彩色图像处理中应用较为广泛,究其原因主要因为颜色与图像包含的物体和场景相关,而且图像的颜色特征对图像本身的尺寸、方向、大小依赖性不大,具有较高的鲁棒性。在彩色图像处理过程中涉及到的颜色特征需要考虑的问题,首先需要选择合适的颜色空间描述颜色特征;其次需要采用一定的方法量化颜色特征。颜色也是一种全局特征,对图像和图像区域的方向、大小等变化不敏感,所以图像中对象的局部特征不能很好的由图像的颜色特征来表示。对于彩色图像的彩色特征提取必须在特定的彩色空间中进行,常用的彩色空间有RGB(红、绿、蓝)、CMY(青、深红、黄)或者CMYK(青、深红、黄、黑)、HIS(色[10]调、饱和度、亮度)和Lab。(1)RGB彩色模型在RGB模型中,每种颜色出现在红、绿、蓝的原色光谱分量中,其模型示意图如下图2-1:B蓝青深红白绿G红黄R图2-1RGB模型示意图7 基于底层特征和SVM的图像分类如图所示,正方体六角分别为红、绿、蓝和青、深红、黄六种颜色,坐标系原点为黑色位置,其对体位置为白色。在上图中,立方体的表面和内部的点表示不同颜色的,可以用向量来表示该种颜色。在RGB彩色模型中,用向量(R,G,B)来表示一种颜色。若R、G、B为8bit,则颜色的种类就为:83(2)16777216.(2)CMY和CMYK彩色模型青色、深红色和黄色是光的二次色,它们是颜料的原色。以青色为例,当混合等量的红、绿和蓝的白光照射在涂青色颜料的物体表面时,反射的是绿蓝颜色分量组合成的光。RGB彩色模型到CMY彩色模型的转化公式如公式2-1:C1R,M1G,(2-1)Y1B,其中所有颜色分量均量化到区间[0,1]之间。等量的青色、深红色和黄色可以产生黑色,但在打印中这种黑色并不纯正,所以在打印中加入了真正的黑色,从而产生CMYK彩色模型。(3)RGB彩色模型RGB彩色模型比较符合人的视觉系统,但是并不能很好的适用于实际上人为的解释颜色,而HIS彩色模型的出现使得人们能够很好的解释颜色,利于人们对色彩的研究。HIS彩色模型用H、S、I三参数描述颜色的特征,H表示颜色的波长,称为色调;S表示颜色的深浅程度,称为饱和度;I表示强度或者说是亮度。HIS彩色模型可从彩色图像中消除其彩色信息中强度的影响,因此HIS彩色模型是进行图像处理彩色描述的理想工具。从RGB彩色模型到HIS彩色模型的彩色转化公式如2-2到2-4:,BG,H(2-2)360,BG,3S1(min(,,)),RGB(2-3)RGB1I(RGB),(2-4)38 第二章图像的底层特征提取其中:1(RG)(RB)cos(),1222((RG)(RGRB)())而HIS彩色模型到RGB彩色模型的转化如公式2-5到2-6:ScosH2I(1),H[0,),3cos(H)324RI(1S),H[,),(2-5)3343I(GB),H[,2),323I(GB),H[0,),32ScosH(),324GI(1)H[,),(2-6)cos(H)334I(1S),H[,2),32I(1S),H[0,),324B3I(GB),H[,),(2-7)334Scos(H)34I(1),H[,2),53cos(H)3(4)Lab彩色模型Lab色彩模型是由亮度L和有关色彩的a,b三个要素组成。其中L表示亮度,a表示从洋红色至绿色的范围,b表示从黄色至蓝色的范围。接下来我们给[11]出RGB彩色模型到Lab彩色模型的转化的简单公式:设矩阵M如下:9 基于底层特征和SVM的图像分类0.4124350.3575800.180423M0.2126710.7151600.072169,(2-8)0.0193340.1191930.950227其中:XRYMG,(2-9)ZB函数f如下:1u3,fu()(2-10)167.787u,116令X0.950450,Y1.000000,Z1.088754,则RGB彩色模型到Lab彩色nnn模型的转化公式为:Y1Y116(),30.008856,YnYnL(2-11)Y1Y903.3(),30.008856,YYnnXYa500((f)f()),(2-12)XYnnXZb200((f)f()).(2-13)XZnn常用的颜色特征表示有颜色直方图、颜色集、颜色矩和颜色聚合向量。(1)颜色直方图颜色直方图是在很多图像处理系统中被广泛采用的颜色特征。颜色直方图描述的是图像中色彩的全局分布,即是色彩在整幅图像中所占的比例大小。由于颜色直方图只是统计图像的色彩信息,而并不关心颜色的位置和空间关系,因此颜色直方图比较适合描述难以自动分割和对位置空间关系[12]不敏感的图像。常用的颜色直方图有:全局颜色直方图、累加颜色直方图和主色调直方图等。(2)颜色集(ColorSets)[13]颜色集是另外一种不同于颜色直方图的基于图像颜色内容的图像特10 第二章图像的底层特征提取征表示方法。颜色集提取的主要过程是首先将常见的颜色空间(RGB颜色空间)通过映射转化为视觉均衡的颜色空间(如HSV颜色空间),然后在转化后的颜色空间中进行量化为M级数,最后引入M维二进制空间将其与量化级数相对应,使二进制空间成为检索量化后颜色级数的索引指标。(3)颜色矩(ColorMoments)颜色矩是由MarkusStricker和MarkusOrengo于1995年提出的一种颜色特[14]征提取方法。颜色矩的理论基础是将彩色图像中的颜色分布看成一种概率分布,而在概率论中概率分布的中心矩可以表示概率分布的特征,故可以用颜色空间每个通道的矩作为彩色图像的特征。一般情况下,三阶的颜色矩就足以表示图像的彩色信息特征。以RGB彩色模型为例,其三阶内定颜色矩公式如下:一阶矩:N1E(,,)RGBP(,,)RGB,(2-14)Ni1二阶矩:N1122(,,)RGB((P(,,)RGBE(,,)RGB)),(2-15)Ni1三阶矩:N1133s(,,)RGB((P(,,)RGBE(,,)RGB)).(2-16)Ni1(4)颜色聚合向量(ColorCoherenceVector)[15]颜色聚合向量是GregPass和RaminZabih首先提出的,其核心思想是给定阈值,在每个颜色直方图中,若像素的连接区域面积大于给定阈值,则称为聚合,否则成为非聚合区域。也即是将颜色直方图通过阈值分为聚合和非聚合两个区域,来表征彩色图像的特征。颜色聚合向量是一种较为复杂的颜色直方图改进方法,它通过聚合度量将图像像素分为聚合和非聚合区域。其具体的做法如下:首先模糊图像,目的是平滑图像,去掉图像奇异点;然后对平滑后的图像进行量化,量化阶数为N;最后将每阶的颜色直方图分为聚合区域和非聚合区域。聚合区域和非聚合区域的划分是基于连接区域。我们给出连接区域的定义:设集合C是一个连接区域,则对11 基于底层特征和SVM的图像分类于任意的x、y属于集合C,存在一条路径连接x、y。给出阈值S,若同一颜色阶数n的最大连接区域大于给定的阈值S,则称这一区域为聚合向量,用来表n示,否则为非聚合向量,用来表示。这样n阶直方图就可以表示为,nnn对于n阶颜色我们可以用数对(,)来表示,则彩色图像的颜色聚合向量就可nn以表示为:((,),(,),,(,).(2-17)1122nn2.3图像的形状特征形状特征是图像视觉特征的另外一个重要的底层特征。目前来说图像的形状[16]特征提取的方法可以分为两类:基于图像轮廓和基于图像区域。基于图像轮廓特征的形状特征提取方法提取的是目标的边缘轮廓,常用的轮廓特征提取方法有[17-19]傅里叶描述子、曲率尺度空间描述子、小波描述子和全局形状特征等。基于图像区域的形状特征提取方法提取的是目标内在包含的形状特征,常用的方法有[20-23]Zernik矩、Legendre矩、圆度、偏心率、主轴方向和不变矩等几何参数。2.4图像的空间位置特征图像的空间位置特征是指图像中对象及对象间空间位置的关系,它也是图像之间一个极为重要的底层特征。一般来说图像的空间位置特征可以分为方向特征、拓扑特征和度量特征。图像的方向特征指的是图像中的目标在空间中的一种有序的特征,比如左右;图像的拓扑特征指的是在拓扑变换下保持不变的空间特征,例如在经历平移、旋转等拓扑变换下不变的特征;图像的度量特征指是利用某种度量方式来描述对象之间的空间位置关系,如空间对象间的欧氏距离等。12 第三章支持向量机理论第三章支持向量机理论3.1支持向量机(SVM)基础理论背景SVM是由V.N.Vapnik教授等人于1995年提出的基于统计学习理论的一种计算机学习方法,SVM可以提高学习机的推广能力,且支持向量机可以转化为一个二次凸优化问题,可以确保得到的极值是全局最优解,它在解决小样本问题、非线性问题及高维模式识别中表现出许多优势。SVM的理论基础是统计学习理论中的VC维(VapinkChervonenkisDimension)理论和结构风险最小化原则。(1)VC维理论VC维定义的对象是决策函数集自身的结构,其定义内容是:设F是一个定n义在空间R取值为1或-1的函数组成的决策函数候选集,F的VC维就是F中n存在函数能够将R中集合正确分类的最大集合所包含的元素个数,即:若Z{(,xy),(,xy),,(,xy)}n1122nnn是R中能被F正确分类的最大集合,则对任意xi1,2,,n给予i,任意的标号,1或-1,组成集合:T{(,xy),(,xy),,(,xy)},1122nn则中总存在一个函数将T正确分类,即存在f使得:fx()yi,1,2,,n,ii则F的VC维为n。VC维反映的是函数集合的学习能力,若函数集合的VC维较大,则函数集合越复杂,容量较大。但是函数集的VC维的确定还是较为困难的,是统计学习理论中的一个重要问题。(2)结构风险最小化原则结构风险最小化是针对训练集较少而提出的一种统计学习理论原则。对于分类器来说,经验风险R()f和实际风险Rf()之间以至少1的概率成立不等emp式:13 基于底层特征和SVM的图像分类82n4Rf()R()f((lnh1)ln),(3-1)empnh其中f是决策函数集合中的函数,n为训练集合中元素个数,h为决策函数候选集合F的VC维,(0,1]。对于公式(3-1)其右端第一项为经验风险,第二项:82n4(,,)hn((lnh1)ln),(3-2)nh称为置信区间,也称VC维信任,与VC维大小和训练集有关。两项合称为函数f的结构风险。对于(,,)hn来说,它是训练集样本个数的递减函数,当n趋近于无穷大时,(,,)hn趋近于0,也即训练集合较大时置信区间较小,结构风险趋近于经验风险;若训练样本较少,则需要考虑置信区间,而置信区间的取值依赖于F的VC维h。通过以上分析我们知道,结构风险是实际风险的上限,对于训练样本较多的情况而言,最小化经验风险就足够表示实际风险了;对于训练样本较少的情况而言,则需要同时考虑最小化经验风险和置信区间。基于此统计学习理论提出了结构风险最小化原则,对于训练集:T{(,xy),(,xy),,(,xy)},1122nnn其中,xRy,{1,1},i1,2,,.n将决策函数集合分解为与参数t有关的决ii策集合Ft(),且有:tt,有Ft()Ft()。1212t对于每个集合Ft()中存在f使得集合的经验风险最小,与此对应一个集合t的结构风险,则最终选择使得结构风险最小的f做为原函数集合Ft()的决策函数。结构风险最小化原则的本质就是寻找适当大小的决策函数集,然后使用经验风险最小化原则,最终得到决策函数。14 第三章支持向量机理论3.2SVM二分类SVM分类学习机是由简单的线性可分问题发展起来的理论,SVM线性分类器的主要方法是通过最大间隔法寻找线性可分的两类实例之间的最优分类超平面。最优分类超平面如下图3-1所示:LL1L2图3-1最优超平面其中L为圆点和方点的最优分类超平面,L和L是图像的支持平面,在L和L上1212的点称为支持向量(SV)。n对于训练集T{(,xy),(,xy),,(,xy)}其xRy,{1,1},i1,2,,.n1122nnii存在多个分类面,则其最优分类超平面((x)b)应该满足一下条件:(1)fx()yi,1,2,n;ii2(2)在所有的分类平面中达到最优;(3)对所有支持向量x有fx()0,非支持向量x有fx()0。基于以上分析,求解二分类问题的最优超平面f可以转化为求解、b的凸二次规划问题:12min,(3-3),b2st..y((wx)b)1,i1,2,,.n(3-4)ii然而对于一般的分类问题来说,它们并不是绝对线性可分的,也就是说在实际问题中并不是所有的训练样本都能满足式3-4的,所以对于不满足的样本一般15 基于底层特征和SVM的图像分类进行‘软化’,即在式子中添加了一个非负参数,使得所有样本都满足3-5:y((wx)b)1,i1,2,,.n(3-5)iii为了避免取得过大导致模型的推广能力较差,我们在求解问题时候对目标i函数增加了一个惩罚因子C,则最优化问题可以转化为:n12min,bCi,(3-6)2i1st..y((wx)b)1,i1,2,,,n(3-7)iii0,i1,2,n.(3-8)i[20]文献给出了详细的证明,该最优化问题存在唯一的最优解。可以从该最优化问题的对偶问题入手求解,首先引入原问题的Lagrange函数:nnn12L(,,,)bCii(((yixi)b)1i)ii,(3-9)2i1i1i1TT其中(,,,),(,,,)是Lagrange乘子向量。12n12n由此可得原问题的对偶问题为:nnn1min,yyxxij(ij)ijj,(3-10)2i1j1j1nst..yii0,(3-11)i10Ci,1,2,n.(3-25)i可解得对偶问题的最优解为:****T(,,),12n进而可得原问题的最优解为:n**iyxii,(3-12)i1n**byjiyxii,(3-13)116 第三章支持向量机理论至此可得线性可分问题的最优超平面,可得最佳决策函数:*fsgn((x)b).(3-14)而对于非线性可分问题,则需要引入一个适当的变换,将原来特征空间投影到一个线性可分的希尔伯特空间H上,即存在使得:n:RH(3-15)xz().x在希尔伯特空间H中可得问题的最优超平面为:(z)b0,则原问题最优超平面为:(())xb0.对于变换()x,在求解过程中我们并不需要直接求出其具体形式,只需要对(()x())x的值,我们将之定义为核函数,记作Kxx(,)。常用的核函数有:(1)多项式核函数:dKxx(,)((xx)1),(2)Gauss径向基核函数:2xxKxx(,)exp(2).3.3SVM多分类基于SVM的多分类问题有两种设计思想,一种是直接设计多分类SVM分[13][3]类器另外一种是多个SVM分类器进行组合,组合方式有两种,一种是“一对多”,另外一种是“一对一”,本文采用的是后者“一对一”的方法使用SVM对目标进行多分类,其思想就是在训练阶段对每两类就设计一个SVM分类器,然后在训练阶段用所有分类器对所有训练集进行预测,最后对每个训练样本进行投票,得票最多的即为该样本的类别。其示意图如图3-2:17 基于底层特征和SVM的图像分类类别1f(1,2)类别2f(1,n)f(2,n)类别n图3-2‘一对一’多分类示意图下面给出一个N分类的例子来说明‘一对一’分类的过程。首先用分类器对已NN(1)标记图像进行学习,得到每个类别之间的分类器,共n个分类器,对2于M个未知标记样本来说,使用所有分类器对每个未知样本x进行预测,可以m得到n个预测结果,将结果放在一个数组中得到一个n维数组,对这个数组进行统计可以得到一个N维直方图,将各个维数的值做为一个数组相对应元素,可以得到一个N维数组。这样对M个未知类别样本预测后可以得到一个MN的预测矩阵。18 第四章基于彩色Gabor纹理特征和SVM的图像分类第四章基于彩色Gabor纹理特征和SVM的图像分类近年来随着人们对图像数据的需求越来越大,数字图像数据库也日益庞大,如何有效的对这些图像数据进行分类管理以及在庞大的图像数据库中选择出所需要的图像信息是一个极为重要的问题。图像的特征提取以及分类机的选取是极为重要的环节。本文提出了一种基于RGB颜色空间的彩色Gabor纹理特征和SVM的图像分类方法。图像的Gabor纹理特征是一种较为常用的比较好的图像纹理特征提取方法,但是传统的图像纹理特征提取是将彩色图像变换成灰度图像后提取其灰度纹理特征,这一过程不可避免的使图像所包含的彩色信息受到损失,因此本文选择对彩色图像的R、G、B三个颜色通道进行Gabor滤波得到其伪彩色纹理特征。又由于人对图像感兴趣的部分一般处于图像的中心部分,因此本章在进行Gabor纹理特征提取前先对图像进行了分块处理,之后再对每块图像进行Gabor滤波,根据分块面积大小对所得的Gabor特征进行加权,最终得到每幅图像的Gabor纹理特征。SVM是由V.N.Vapnik教授等人于1995年提出的基于统计学习理论的一种计算机学习方法。它的基本思想就是将非线性可分的样本通过核函数投映到一个线性可分的高维特征空间,由最大间隔法训练得到该空间的最优分类平面,即分类器。4.1Gabor滤波Gabor滤波器是由Gabor小波函数经过旋转、平移得到的一组Gabor小波族,Gabor小波变换是D.Gabor于1946年提出的,它是对经典Fourier变换的改进。与Fourier变换相比Gabor变换多了一个窗函数,该窗函数能够很好的对信号局部信息进行分析。常用的窗函数为Gaussion函数。接下来我们以一维为例定义Gabor变换。2设函数f是一个具体的Gaussion函数,切fLR(),则Gabor变换的定义为:19 基于底层特征和SVM的图像分类*itGab(,,)ftgtbe()()dt,(4-1)fa21t*其中gt()exp()是高斯窗函数,g是g的共轭转置,且a0,b0。aaa2a4agtb()是一个时间局部化的“窗函数”,其中参数b的作用是平移窗口,以便使a函数覆盖整个时域。对参数b积分,则有:G(,,)abdbfˆ(),R,(4-2)f则信号重构为:1itf(t)G(a,b,)g(tb)eddb.(4-3)2Rfa一幅图像可以看做是一个二维信号,利用Gabor滤波器中每个小波函数可以得到各个频率各个方向的能量,而图像的纹理信息则可以从这些能量信息中获得。对于一幅大小为PQ的图像I(x,y),其离散Gabor小波变换为:*GmnIxsyt(,)mn(,),st(4-4)mn*其中st、是滤波器尺度变量,(,)st是(,)st的共轭转置,(,)st是由母mnmnmn小波(,)xy经过旋转、伸缩变换得到的,母小波(,)xy为:2211xy(,)xyexp(())exp(2jWx),(4-5)22xyxyW为调整频率,母小波的旋转平移方式如下:m(,)xya(,),xyˆˆmn其中,mxˆa(cosxysin),myˆa(cosyxsin),nm0,1,,M1,n0,1,,N1,,a1.N上式变量由以下式子确定:20 第四章基于彩色Gabor纹理特征和SVM的图像分类1a(Uh)M1,(4-6)UlmWaU,(4-7)mnl(al2ln2),(4-8)xmn,,m2a(a1)Ul1.(4-9)(,,)ymn221Uh()2tan2N2ln22xmn,,一般我们取U0.05,U0.4。lh对图像I不同方向、不同尺度进行Gabor滤波后,我们可以得到一组数据,来表示图像不同方向、尺度的能量:Emn(,)|Gmn(,)|xy,(4-10)xy其中m0,1,,M1.n0,1,,N1.利用Emn(,)的均值(Mean)和标准差(StandardDeviation)来表示相同mnmn的纹理特征:Emn(,),(4-11)mnPQ*Gxy(,)mnxy.(4-12)mnPQ*4.2图像的彩色纹理特征通常的彩色图像纹理特征提取是将彩色图像转化为灰度图像,之后再进行纹理特征提取,在这样一过程中,图像的色彩信息将不可避免的受到损失,例如两幅彩色图像间在视觉上极容易分辨,但是转化为灰度图像后,就有可能不能明显[24]区分。这是因为经过灰度转化后不同的色彩有可能具有相同的灰度级。文献提出了一种基于彩色图像空间纹理特征提取的伪灰度图像方法,其流程图如下图21 基于底层特征和SVM的图像分类4-1:伪灰度图像1特征1伪灰度图像2特征2彩色图像原图像特征伪灰度图像3特征3图4-1彩色纹理特征提取该文献中采用的是HSV彩色空间的每层色彩作为图像的伪灰度图像,然后对其进行纹理特征的提取。然而经过研究实验发现,RGB彩色空间比HSV彩色空间更能保持彩色图像的纹理特征,所以本文提出用将彩色图像转化为RGB颜色空间,分别对R、G、B三层颜色空间分成九块,然后对每块进行Gabor滤波,提取其纹理特征,如图4-2:图4-2上层为HSV空间彩色伪灰度图像;下层为RGB彩色空间的伪灰度图像由于人眼视觉对于图像的中间部分比较敏感,故对图像进行如下分块,如下图4-3:22 第四章基于彩色Gabor纹理特征和SVM的图像分类123456789图4-3图像分块示意图以一幅大小为384256的图像为例,其中第1、3、7、8大小为9664,第2、8块大小96128,第4、6块大小为19264,第5块大小192128。以印第安人图像图4-4(a)为例,其分块示意图如下图4-4(b):(a)(b)图4-4图像分块示意这样在图像总数为I的图像库中第i幅图像的特征如下:f(,,,,,,),i00i00i01i01i(N1)(M1)i(N1)(M1)i则第i幅图像的Gabor特征是将每一小块图像的均值和方差赋予权重,然后相加组成原图像的均值和方差,则其特征为:111111111Ffffffffff.(4-13)12345678916816848168164.3实验及分析基于Gabor滤波的特征提取对于灰度纹理图像,其分类效果是极其明显的,在本文中采用Brodatz图像库中的D1、D11、D24、D25、D35、D49、D50、D51、D56、D83、D84、D96、D101、D105、D106共15幅均匀纹理特征较为明显的图像进行基于Gabor纹理特征的实验。具体做法是将这15幅图像进行88均匀分块,可以得到1588960幅纹理图像。对所得到的960幅图像进行Gabor特征提取,然后进行SVM分类,其分类正确率结果如下表4-1:23 基于底层特征和SVM的图像分类表4-1纹理图像的Gabor滤波分类正确率D184.38D11100D24100D25100D35100D49100D50100D5193.75D56100D83100D84100D96100D101100D10593.75D10687.5平均正确率97.29实验结果表明,基于SVM的Gabor纹理特征对于纹理灰度图像有较好的分类效果。如图4-5:24 第四章基于彩色Gabor纹理特征和SVM的图像分类(a)(b)图4-5基于Gabor纹理特征提取和SVM分类对纹理灰度图像和彩色图像分类效果的比较如上图4-5所示,图a是对Brodatz图像库中的D1、D11、D24、D25、D35、D49、D50、D51、D56、D83、D84、D96、D101、D105、D106共15类纹理图像使用Gabor特征提取和SVM进行分类的结果,图b是基于Gabor纹理特征提取和SVM分类方法对Croel1000图像库中的10类图像进行的实验结果,通过对比我们可以得到这样的结论,基于Gabor纹理特征提取和SVM分类方法对于纹25 基于底层特征和SVM的图像分类理较为明显的灰度图像分类效果较为明显,然而对于彩色自然图像的分类效果并不显著。分析实验结果我们可以知道在对彩色图像进行特征提取的时候一般是将其先转换为灰度图像,然而这一过程使得彩色图像中色彩信息遭到不可避免的丢失,因此本文提出了基于RGB三通道的Gabor纹理特征提取和SVM分类的方法。本文提出的一种基于RGB彩色纹理特征SVM图像分类方法,其算法流程如下图4-6:1、将图像库中图像转化为RGB彩色模型,在RGB空间中处理图像;2、得到每幅图像I的R、G、B三通道的伪灰度图像IR、IG、IB;3、对灰度图像进行分块,对分块后的每一小块图像进行Gabor滤波,提取Cabor纹理特征,最后加权得到每幅伪灰度图像的Gabor特征IRG、IGG、IBG;4、将F=(IRG,IGG,IBG)做为原图像的Gabor特征;5、选取Corel1000图像库中每类图像的前50幅图像为训练集,训练得到分类器C;6、用剩下的500幅Corel图像做为测试集合,验证学习器的分类能力。图4-6基于RGB彩色纹理特征SVM图像分类算法下面将本文所用方法提取彩色纹理特征后用SVM进行分类和Gabor滤波提取纹理特征后进行SVM分类方法进行比较,将前50幅图像作为训练集,后50幅图像作为测试集合。实验结果如下表4-2:26 第四章基于彩色Gabor纹理特征和SVM的图像分类表4-2基于Cabor小波SVM分类和本文方法的实验结果对比图像集G-SVM本文方法印第安人62%72%沙滩60%54%建筑38%38%巴士78%72%恐龙100%100%大象50%56%花80%86%马88%92%雪山28%42%食物66%70%平均正确率65%68.2%由表4-2可知本文提出的基于RGB彩色Gabor纹理特征和SVM的分类方法比传统的Gabor纹理特征和SVM方法的平均分类正确率提高了3.2个百分点。每类的分类正确率比较结果由图4-7可以更加清晰得到:27 基于底层特征和SVM的图像分类图4-7本文方法和传统基于Gabor纹理特征和SVM分类结果比较如图4-7红色的折线是本文的分类方法,其整体结果比传统的方法较好。分析其原因是因为本文通过RGB三通道的纹理特征提取,较好的保留了彩色图像的彩色信息。4.4小结基于纹理的图像分类对于均匀纹理灰度图像的分类效果是较好的,但是对于生活中接触的自然图像分类效果并不明显。由于我们接触的自然图像一般具有鲜明的色彩,包含有丰富的颜色信息,因此考虑了在RGB空间的每个通道中进行纹理特征提取,这样的方法较好的保留了图像的彩色信息。实验结果表明,本文方法较普通的纹理特征提取方法用于自然图像的分类有了较大的进步。但是单一的纹理特征对于自然图像的表示仍然不很理想,因此考虑用多个特征表示来进行图像分类。28 第五章基于SVM的多特征融合图像分类第五章基于SVM的多特征融合图像分类基于内容的图像处理技术,一般的过程是提取图像的底层特征,例如图像的颜色、纹理、形状等特征。在确定图像分类方法的时候,图像特征提取的有效性是图像处理过程中考虑的重点。然而单独基于颜色、纹理和形状特征图像分类算法都有自己的局限性,比如基于颜色特征的图像分类不仅与图像本身颜色信息量有关,更与图像颜色的表示方法有关,如果用颜色直方图表示图像颜色特征,则颜色特征与颜色空间和颜色具体量化都有很大关系,所以基于颜色特征的图像分类对于颜色信息含量较少的图像效果不佳;基于图像纹理特征的图像分类对于纹理信息较少或者纹理信息特别复杂的图像效果都不是很好;基于图像形状特征的图像分类一般有较高的计算复杂度,而且对于图像多分类效果不好。因此图像多特征在图像分类中的应用日益增多,对于同一类的图像来说不同的底层特征的表示是不同的,即使对同一图像来说不同的底层特征在图像分类或者检索时的贡献是不同的。这就表明在图像分类是也许多特征混合也许可以使得分类结果更加明[25-26]显,一些工作验证了这个结论。在使用多特征混合进行分类时,由于各个特征对于图像的贡献不同,其权值也应该不同,如何确定各个特征的权值也是其中重要一步。在本章节提出的算法中,我们使用颜色和纹理两个不同的底层特征,结合SVM训练及PSO参数选择确定最终的分类器。5.1颜色直方图颜色直方图是在很多图像处理系统中被广泛采用的颜色特征。颜色直方图描述的是图像中颜色的全局分布,即是颜色在整幅图像中所占的比例大小。由于颜色直方图只是统计图像的颜色信息,而并不关心颜色的位置和空间关系,因此颜色直方图比较适合描述难以自动分割和对位置空间关系[27]不敏感的图像。常用的颜色直方图有:全局颜色直方图、累加颜色直方图和主色调直方图等。颜色直方图具有计算简便和尺度平移、旋转不变性,因此应用较为广泛。[28]颜色直方图定义如下:29 基于底层特征和SVM的图像分类hr()NPri(),1,2,,,IRiihg()NPg(),j1,2,,,J(5-1)Rjjhb()NPb(),k1,2,,,KRkk其中R、G、B是RGB彩色空间的三通道,N为图像中像素点的个数,P()是古典概率,I、J、K分别是R、G、B三通道的量化级数。由于我们量化的颜色级数一般有限,故我们可以将三通道直方图转化为单变量的直方图,转化公式如下:xIJbIgr,(5-2)则单变量的颜色直方图为:hx()NPx().(5-3)颜色直方图是基于颜色特征的图像表示中较为重要的一种基础的底层特征。图像颜色直方图的提取主要有两个过程:颜色量化和直方图归一化。(1)颜色量化颜色量化主要目的是对图像的颜色特征进行降维,减少图像处理的复杂度。由于HSV彩色空间模型在实际中更适合人们对彩色图像的研究,所以本文中采用的是在HSV彩色空间模型中处理图像。对于彩色空间的量化主要有两种量化[29]方式:均匀量化和非均匀量化。均匀量化计算简单,其计算复杂度较低简单易行,但是分类效果并不好;本文采用非均匀量化提取彩色图像的颜色特征。在HSV彩色空间模型中,H、S、V三个通是相对独立的,所以可以分别将H、S、V三通道量化。在非均匀量化中人的视觉系统对于H(色度)值的变化比较敏感,相对来说,人的视觉系统对于S、V的变化则没那么敏感。因此我们选择将H通道进行16阶量化,对S、V通道分别4阶量化,将颜色区域共分为1644256个区,接下来对HSV颜色空间模型的三通道进行非均匀量化。Matlab中的rgb2hsv函数将常见的RGB图像转化为HSV图像时,H、S、V的值都在[0,1]之间,在对H通道量化时为了方便量化,将之扩展到[0,359]之间,即令Hh360,具体量化为:30 第五章基于SVM的多特征融合图像分类0h[0,15](345,359],1h(15,25],2h(25,45],3h(45,55],4h(55,80],5h(80,108],6h(108,140],7h(140,165],H8h(165,190],9h(190,220],10h(220,255],11h(255,275],12h(275,290],13h(290,316],14h(316,330],(5-4)15h(330,345],0s[0,0.15],1s(0.15,0.4],S(5-5)2s(0.4,0.75],3s(0.75,1],0v[0,0.15],1v(0.15,0.4],V(5-6)2v(0.4,0.75],3v(0.75,1],将H、S、V三通道量化合为一维变量:LHQ**QSQ*v,(5-7)svv其中H为合一后的一维特征向量取值范围是[0,255],和Q和Q分别是S、V的sv量化级数。(2)颜色直方图归一化处理对于一幅256384的图像来说,其颜色直方图的某些区的数量极其庞大,必将导致在分类器训练时得不到具有较好推广能力的分类器。颜色直方图归一化处理的目的是消除部分颜色直方图分量因为数目较大产生的偏差,平衡各颜色直方图分量的重要程度。通常的归一化方法是将其取值范围归一化到[0,1],归一化的31 基于底层特征和SVM的图像分类方法较多,本文采取了两种归一化方法:一般归一化方法和高斯归一化。一般的归一化公式如下:nks,k1,2,K,(5-8)kN其中是彩色图像的像素点个数,K是量化的颜色级数,n是k阶的像素点个数,ks就是量化后的颜色直方图的值。另外一种方法高斯归一化是一种比较好的常用k的归一化方法,它能保证颜色直方图中极大值和极小值对图像分类的效果较小[31]。本文中高斯归一化公式如下:(L)13G,(5-9)2其中是量化对象的均值,是量化对象的方差。图5-2和图5-3分别给出提取印第安人图像图5-1的高斯归一化颜色直方图和一般归一化颜色直方图的结果:32 第五章基于SVM的多特征融合图像分类图5-1印第安人原图像图5-2一般归一化颜色直方图图5-3高斯归一化颜色直方图5.2多特征空间学习[32]多特征空间学习是A.Blum和T.Mitchell于1998提出来的一种学习方法。33 基于底层特征和SVM的图像分类多特征空间学习的理论根据是A.Blum和T.Mitchell提出的,他们通过研究认为多特征的图像处理系统比单一特征图像处理系统效果要好。多特征空间图像处理的基本思想是对于训练集合可以分为两个独立的部分,每个部分都可以独立的表示或者对目标进行学习。对于训练集合空间有III,其中是同一实例的不同特征空间。也12就是说,如果对于xI,则有x(,xx),其中xIx,I。即对于训练集合121122空间I中任意的训练样本x都可以由由一个三维向量(,xxl,)表示,其中l是训练12样本x的指标。多特征学习的两个特征需要满足下面两个条件:一,每个特征集合足以描述学习问题,即是若训练样本足够,每一个特征集合都可以得到一个原问题的强学习机;二,每个特征集合都独立于另外一个特征集合。多特征空间学习的具有两个重要的性质,也就是特征的条件独立性和特征的兼容性。定义5.1(条件独立性):在一个由两个特征空间表示的领域中,对于任意一个训练样本x(,xxl,),其中l是x给定的标签。若x与x是条件相互独立的,1212即:PIx(()xIx|()xx,l)PIx(()xx|l),(5-10)112211PIx(()x|()Ixxx,l)PIx(()x|xl).(5-11)221122则称这两个特征空间是条件独立的。定义5.2(兼容性):在一个由两个特征空间表示的领域中,设f是特征空间I11上的分类函数,f是特征空间I上的分类函数,f是整体空间I上的分类函数,22对于绝大多数训练样本x(,xxl,),有:12fx()fx()fxx(,)l.(5-12)112212则称特征空间I和I是兼容的。1234 第五章基于SVM的多特征融合图像分类5.3基于粒子群优化算法的参数选择粒子群优化算法(ParticleSwarmOptimization,PSO)是基于群体的进化算[33]法,1995年Eberhart和Kennedy提出的。PSO算法启发于鸟类、虫、鱼群等物种的群体捕食行为。总的来说,PSO算法通过全局最优个体和个体最优位置移动实现个体进化,它在粒子进化过程中保持了搜索和收敛的平衡。与遗传算法不同的是PSO算法没有交叉和变异操作,而是通过追随当前找到的最优解来搜索全局最优解。由于PSO算法简单有效,提出后受到广泛的关注,多目标PSO算法相比遗传算法,具有算法简单、快捷收敛的优点。PSO算法的基本步骤与其他进化算法类似,PSO算法也是通过个体间的协作与竞争,实现复杂空间中最优解的搜索。PSO首先在可行解空间里生成一个初始种群,该种群是随机生成的,其中各个粒子都是优化问题的解。并且由目标函数位置确定一个合适值(FitnessValue),而且各个粒子以一定速度在解空间里运动。一般情况下粒子会追随目前最优粒子运动,且经若干代搜索后得最优解,在各代中粒子会跟踪两个最优解p和g,分别是目前最优解和全种群最优解。bestbest在n维的可行解空间中,初始种群为m个粒子,记为Y{,yy,,y},记12m第i个粒子其位置为:y{y,y,,y},它的速度为记为:ii1i2inv{,vv,,v},ii1i2in其个体极值记为:p{p,p,,p}。则种群按下列公式改变粒子的速度和位ii1i2in置:t1tttttvvcrp(y)crp(y),(5-13)idid11idid22ididt1ttyyv,(5-14)ididid其中t表示进化代数,d1,2,,n,r和r为[0,1]区间的随机数。i1,2,,m,12c和c是加速的常数。12PSO算法步骤为:(1)初始化种群,给定加速常数c和c,将当前代收设为t1,最大优化代数记1235 基于底层特征和SVM的图像分类为T,初始种群记为Y{,yy,,y},其初始速度为V{,,vv,v};max12m12m(2)计算各个粒子在各维空间的适应值,将之与p相比较。置其中较好的值为bestp;best(3)比较p和g,置其中较好的值为g;bestbestbest(4)更新种群Yt(1);t1(5)检查结束条件,若满足VV,则结束,否则tt1,转(2)。结束条件maxid为最大化代数T。max5.4多特征融合SVM-PSO的图像分类实验结果及分析本节主要进行实验分析,将本文所提多特征融合分类算法与单个特征空间分类进行比较和分析。(1)特征提取和表示图像的特征提取与表示是基于图像内容的图像处理系统技术的基础技术。本文采用的是全局特征,图像的颜色和纹理特征。本文采用的图像的纹理特征提取是采用本文中提取的彩色空间纹理特征,采用M=3,N=4的Gabor小波提取图像的纹理特征,将其均值和方差做为其纹理特征,共72维;图像的颜色特征是基于HSV彩色空间的256维颜色直方图,最后对所提取的颜色直方图进行归一化。本文采用了两种归一化方法。(2)实验图像库本次实验仍然采用Corel1000标准测试图像库,选取其中每类的前50幅图像做为图像分类学习机的训练集,剩余的500幅图像做为测试集。实验中采用分类正确率P做为反应分类效果好坏的检测标准。其公式如下:nP100%,(5-15)N其中n为正确分类的数目,N为总的测试图像个数。(3)多特征混合分类算法基于多特征SVM的算法分类如下:36 第五章基于SVM的多特征融合图像分类1.输入图像库I,分别得到其不同的特征空间U、U和U;1232.在特征空间U、U和U上分别使用SVM分类器对IL进行训练,得到分类器123M、M和M;1233.使用分类器M、M和M分别在特征空间U、U和U对未标记样本进行预123123测,得到分类矩阵W、W和W;1234.对分类矩阵W、W和W进行如下加权,其权值大小由PSO算法确定相加得到最123终的分类矩阵W,WaWaWaW。112233图5-4多特征融合SVM-PSO分类算法(4)分类系统实现本文是基于Matlab2009得到的实验系统,其中使用了林智仁教授开发的Libsvm工具包。本节实验系统流程如下图5-5:37 基于底层特征和SVM的图像分类Corel测试图像库训练集样本测试集样本颜色直方图(高颜色直方图Gabor纹理斯归一化)(一般归一化)特征分类机I分类机IL分类机UL提取测试集的颜色、融合分类器h纹理特征测试集分类结果图5-5基于多特征融合的SVM-PSO图像分类算法(5)实验结果本文接下来做了如下的实验:给出了基于Gabor纹理特征和SVM的图像分类,和基于颜色直方图和SVM的图像分类,其分类正确率如下表5-1。接下来做了基于多特征融合和SVM的图像分类,其分类正确率如下表5-1第六列。38 第五章基于SVM的多特征融合图像分类表5-1四种方法分类正确率对比图像类别G-SVM直方图分类直方图分类多特征混合(普通归一化)(高斯归一化)SVM分类印第安人68%74%66%74%沙滩56%32%64%60%建筑44%30%60%52%公交车74%88%56%78%恐龙100%94%96%100%大象46%64%54%72%花82%28%80%82%马100%74%98%86%雪山42%46%68%60%食物72%54%64%76%平均正确率68.4%58.4%70.6%74%如上表所示本文提出的基于多特征融合和SVM的图像分类方法比Gabor-SVM分类的平均正确率提高了5.6个百分点,比颜色直方图的一般归一化分类方法正确率提高了15.6%,比高斯归一化的直方图分类方法平均正确率提高了3.4%,而图5-6能够更简单直接的表示这种实验结果:39 基于底层特征和SVM的图像分类图5-6基于三种单一特征分类和三种特征融合分类正确率比较图中黑色线为基于Gabor纹理特征的图像分类正确率,黄色线为基于普通归一化的颜色直方图图像分类正确率,绿色是基于高斯归一化的颜色直方图图像分类正确率,红色线为基于多特征融合的图像分类正确率。对于每一类的样本来说,基于多特征混合的SVM分类算法与单独的特征相比较都能得到较好的分类结果。实验结果表明,本文所提的方法在图像分类上是有效的和可行的。5.5小结一般情况下,自然图像包含着大量的纹理和颜色信息,不同的底层特征提取方法能够适用于不同的需要,然而各种底层特征的提取方法都有自己的优缺点,因此并没有一个很好的标准来衡量特征提取的好坏。本文提出的基于多特征融合的图像分类方法通过对不同的底层特征提取,通过训练机器进行训练得到分类器,然后进行综合投票,选出得票最高者得到最后结果。实验表明,本文提出的方法能够较好的对自然图像进行分类。40 总结与展望总结与展望本文详细介绍了基于内容的图像分类技术的研究背景和意义,并有选择的介绍了基于内容的图像分类研究现状,主要介绍了图像分类中图像特征的选取和分类器的训练。本文的主要工作是研究了底层特征及多特征融合的SVM分类方法,测试图像库是标准的Corel1000彩色图像库。主要内容如下:(1)基于内容的图像处理技术是直接对图像本身进行处理的方法,而Gabor滤波是一种较好的提取纹理特征的方法,但是一般的Gabor纹理特征是将彩色图像转化为灰度图像,然后进行Gabor滤波。彩色图像转化为灰度图像的这一过程难免有图像颜色信息的丢失,而本文提出的在RGB彩色空间中直接对R、G、B三通道伪灰度图像进行Gabor滤波对所得,然后使用分类器纹理特征进行分类。本文使用的的分类器是支持向量机(SVM),SVM的理论基础是统计学习理论。其能通过核函数将非线性可分的输入特征映射到线性可分的高维空间,并能得到该高维空间的最优分类超平面,使得其结构风险达到最小化;(2)在多特征学习的理论方法下,本文结合SVM提出了多特征融合分类方法。首先将已标签的实例分为两部分,对其中一部分进行训练得到分类器,然后用分类器对另一部分已知标签的实例进行分类预测,根据不同特征空间的分类正确率确定在其空间训练所得分类器的权值,最后对未标签样本进行分类,最后实验结果表明本文所提方法是有效的。除了本文研究的工作之外,图像分类还有许多有趣的问题值得进一步研究:(1)底层特征提取提取的研究和分析.。基于内容的图像处理技术,其基础之一是图像的底层特征提取。图像的底层特征包括图像的颜色、纹理、形状和空间位置关系。图像底层特征的提取方法随着图像处理技术的发展已经较为容易,但是不同特征提取方法对于后期的分类效果影响较大。并且单独的特征颜色、纹理或者形状特征都有可能将图像的其他信息丢失,而多特征的结合弥补了单独特征处理的图像的不足。但同时又极容易产生图像信息的冗余,导致计算复杂度的增加。所以如何结合多特征进行图像处理是我接下来学习和研究的一个方向;(2)基于统计学习理论的SVM是比较成熟的学习机器,然而其核函数的构造是SVM研究难点之一,在SVM理论中,其核函数必须满足Mercer条件,而41 基于底层特征和SVM的图像分类近年来出现了一种新的学习机器相关向量机(RelevanceVectorMachine,RVM)解决了这个问题,对于RVM的学习和研究将是我另外一个学习方向;(3)基于内容的图像处理技术是直接对图像内容本身进行处理,一般来说没有基于文本的处理技术计算复杂度低。而基于图像的Bag-of-words分类技术能够较有效的将基于文本分类的方法与图像内容分类的方法结合。42 参考文献参考文献[1]付岩,王耀威,王伟强,高文.SVM用于基于内容的自然图像分类和检索.计算机学报,2003,26(10):1261-1265.[2]M.Szummer,R.Picard.Indoo-outdoorimageclassification.Proceedingsofthe1998InternationalWorkshoponConetent-BasedAccessofImageandVideoDatabases.1998:42-51.[3]荆晓远,杨静宇,黄修武.基于小波变换和群体决策方法识别人脸图像.计算机研究与发展.1999,36(1):72-76.[4]张学工.模式识别(第三版).北京:清华大学出版社,2011.[5]C.Corte,V.Vapnik.Supportvectornetwork.MachineLearning.1995,20:273-297.[6]K.lee,H.Byun.Anewfaceauthenticationsystemformemory-constraineddevices.IEEETransactionsonConsumerElectronics.2003,49(4):1214-1222.[7]宦若虹,杨汝良.基于ICA和SVM的SAR图像特征提取与目标识别.计算机工程,2008,13(34):24-38.[8]X.Zhang,X.L.Xiao,J.W.Tian.Applicationofsupportvectormachineinclassificationofmagneticresonanceimage.InternationlJournalofComputersandApplications.2006,28(2):122-128.[9]G.Moreno,H.Maldonado.Edgedetectioninnoisyimagesbyusingthesupportvectorrmachines.InternationalWork-ConferenceonArtificialNeuralNetworks.2001:686-692[10]阮秋琦,阮宇智.数字图像处理(第三版).北京:电子工业出版社,2011.[11]W.Burger,M.J.Burge.Principlesofdigitalimageprocessing:CoreAlgorithms.Springer,2009.[12]M.Swajn,H.Ballabd.Colorindexing.InternationalJournalofComputer.1991:11-32.[13]R.John,S.F.Smith.Toolsandtechniquesforcolorimageretrieve.SPIEProceedings.1996.43 基于底层特征和SVM的图像分类[14]M.Stricker,M.Orengo.Similarityofcolorimages.SPIEStorageandRetrievalforMedia.1995.[15]G.Pass,R.Zabih.Histogramrefinementforcontent-basedimageretrieval.ApplicationsofComputerVision.1996:96-102.[16]M.Bober.MPEG-7visualshapedescriptors.IEEETransactionsonCircuitsandSystemsforVideoTechnology.2001,11(6):716-719.[17]P.Fuk.Shapediscriminationusingfourierdescriptors.IEEETransactionsonSystems,ManandCybernetics.1977,7(3):170-179.[18]F.MokhtarianA.Mackworth.Scale-baseddescriptionandrecognitionofplanarcurvesandtwo-dimensionalobjects.IEEETransactionsonPatternAnalysisandMachineIntelligence.1986,8(1):34-43.[19]D.SZhang,G.JLu.Reviewofshaperepresentationanddescriptiontechniques.PatternRecognition.2004,37(1):1-19.[20]T.Chinrt.Onimageanalysisbythemethodsofmoments.IEEETransactionsonPatternAnalysisandMachineIntelligence.1988,10(4):496-513.[21]Humk.Visualpatternrecognitionbymomentinvariants.IEEETransactionsonInformationTheory.1962,8(2):179-187.[22]Teaguemr.Imageanalysisviathegeneraltheoryofmoments.JournaloftheOpticalSocietyofAmerica.1980,70(8):920-930.[23]邓乃扬,田英杰.支持向量机——理论、算法与拓展.北京:科学出版社,2009:57-59.[24]耿国华,王克刚,李康.基于色彩纹理特征的图像分类及应用.西北大学学报,2010,40(1):53-56.[25]Y.Y.Lee,Y.LinG.Wahba.Multicategorysupportvectormachine.TechnicalReportNo.1043,DepartmentofStatics,UniversityofWisconsin.Madison,2001.[26]J.Cheng.Activelearningforimageretrievalwithco-SVM.PatternRecognition.2007,40(1):330-334.th[27]J.Cheng.Multi-ViewSamplingforRelevanceFeedbackinImageRetrieval.18InternationalConferenceonConferencepmPatternRecognition.2006:881-884.44 参考文献[28]M.J.Swajn,D.H.Ballabd.Colorindexing.InternationalJournalofComputer.1991:11-32.[29]J.R.Smith.Toolsandtechniquesforcolorimageretrival,SPIEProceedings,1996.[30]张永利,郑秀萍,雷文礼.基于量化颜色空间的彩色图像检索算法.计算机仿真,2010,27(10):194-197.[31]A.Hinneburg,D.Keim.Anefficientapproachtoclusteringlargemultimediathdatabaseswithnoise.InProceedingofthe4AcmSigkdd.1998:58-65.[32]A.Blum,T.Mitchell.Combinglabeledandunlabeleddatawithco-trainingtheproceedings.The11thAnnualConferenceonComputationalLearningTheory.1998,92-100.[33]J.Kennedy,R.Eberhart.Particleswarmoptimization.IEEEInternationalConferenceonNeuralNetworks.1995:1942-1948.45 致谢致谢倏忽三年,眨眼而过,我的研究生生涯即将结束,在本文结束之际,谨在此向给予我指导、帮助和关心的各位老师、同学、亲人和朋友们表示真诚的感谢,谢谢他们这三年来对我的关注。首先,向我研究生期间的导师杨晓慧副教授和李登峰教授表示最真挚的谢意。在研究生的三年学习和工作中,杨老师不论是在学习还是生活上都给予了我很大的帮助,使我始终保持着乐观开朗的生活和学习态度。李老师扎实深厚的数学功底时时震撼着我,其严谨的治学做事态度也一直是我学习的榜样。三年中从两位老师身上学习的东西将使我受益终生。其次,感谢我们小波分析讨论班的成员们,王娟师姐、姚雪彦师姐、王励冰师兄、蔡云师姐、史亚莉师姐、王莉莉师姐、刘佳丽师姐、吴英焕师姐、刘静静师姐、于丛威师兄、师姐、刘子胜、蔡利君、张婷以及师妹师弟们,感谢大家的讨论使得学习的过程更丰富多彩。尤其感谢我的同课题组的刘子胜、蔡利君和张婷,感谢你们陪我度过了快乐的研究生生活,和你们在一起我感到很开心,祝你们健康快乐。再次,感谢我的室友李亚涛、曹济伟和夏红川,与你们在一起的三年将是我难忘的三年,感谢你们对我生活上极大的帮助和对我脾气的容忍,谢谢你们,你们让我感觉到兄弟的情谊。最后,我要特别感谢我的爸爸妈妈和女友!感谢父母这么多年对我的养育之恩,感谢你们给我温馨的家庭环境,让我每次想到你们就觉得温暖,祝你们健康长寿。感谢女友对我的关心和支持,在研究生的最后一年中遇到你是我最大的幸运,你也是我努力工作的动力!谢谢你们,永远爱你们!李顺才2013年5月46 攻读硕士期间参与的科研项目1.国家自然科学基金(60802061)——基于多尺度几何分析和SVM的Web图像检索技术研究.2008.1-2011.12.2.国家自然科学基金(61071189)——基于Bandelet变换的压缩域图像检索技术研究.2011.1-2013.12.3.教育部重点实验室开放基金(TPIU012011004)——图像检索中相关反馈技术研究.2011.5-2013.447

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭