《基于内容主观映射下自动标注语义图像检索的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
分类号密级艺11UDC学位论文基于内容主观映射下自动标注语义的图像检索研究(题名和副题名)沈丹(作者姓名)指导教师姓名范明钮教授电子科技大学成都(职务、职称、学位、单位名称及地址)申请专业学位级别巫复专业名称软件工程11论文提交日期2008.4论文答辩日期2008.5学位授予单位和一旧期电子科技大学答辩委员会主席评阅人2005年丁月J日注1:注明《国际十进分类法UDC》的类号。 摘要摘要图像作为一种重要的数据信息类型,其应用受到了越来越多的关注。面对日益庞大和丰富的图像资源,如何快速有效地实现图像检索,己成为目前迫切需要解决的问题。传统的基于内容的图片检索过程中需要进行大量复杂的计算,且不能准确反映用户搜索的主观愿望。基于语义特征的技术虽然能解决该问题,但很难有效提取语义特征。因此,本文在现有的一些技术手段之上,对基于内容主观映射下自动标注语义的图像检索方式进行了研究,将低层视觉特征和高层语义特征相结合,利用主体和环境相似性的分类重新组织图片资源,且通过自动标注语义的方式解决图像语义赋予等有关问题,并在具体实验中实现和证明论本文所研究的检索方式对检索性能的改善。本文所做工作如下:首先研究了图像的低层视觉特征,主要包括颜色、纹理和形状三个方面。分别从各特征所涉及的相关理论的分析入手,讨论了这些特征的提取算法及相似性度量。同时,为了验证文中所采用提取算法的有效性,基于每一个特征的图像检索都通过具体实验对相应过程进行实现,并对所得的实验结果及相关数据用图和表相结合的方式进行了直观的说明和分析。在图像视觉特征有效提取的基础之上,接着对语义的自动标注进行了讨论。在本文中,该部分的实现包括了三个具体的环节:主观映射、自动标注语义和相关反馈。本文所讨论的主观映射,其作为对图像的初始语义赋予,为自动标注语义提供了学习的训练集及实现的前提条件;在自动标注语义中,又分为两种具体的情况,一是新加入的图像进行处理后,对训练集中相似度最高的图像信息进行语义的学习并自动完成语义标注;二是用户反馈的信息对初始语义修正的标注,通过这样的方式,使语义的标注逐渐准确;相关反馈通过用户的参与来改善语义标注的效果,使其中的语义能更贴近用户对图像的理解,并达到有效提高检索性能的最终目的。论文最后对文中研究的检索方式进行了总体的实验设计和实现,包括实验环境,整体结构和实现流程等方面,并通过多种情况下所得的实验结果分析了基于该方式检索的具体效果和性能的改善。 摘要关键词:图像检索,视觉特征,主观映射,语义标注,相关反馈 AbstraetAbstraCtAsakindof加portantdatainformation,theaPPlieationofimage15Paidmoreandmoreatention.Howtosearchthe加agefastandeffectivelyhasbecomeanurgentproblelnwhichnedstobesolvedatpresentwithl出名erandmuchabundant而agereSOU丁Ce.There15agreatdealofcomPlexealculationintheProeessoftraditionaicontent七ased如ageretrieval,inwhichthesubjectiveretrievaldesireofuserscannotberefleetedexaedy.However,theProblemeanbesolvedbysemantie丘级权叮e一basedteelmology.Buttheabstractingofthesemantie15stillanunsolveddifficultquestiontillnow.Hene气onthebasisofsomeexistingmech面sms,anovelmechhasmnamed“theautomaticsernanticanotation加ageretrievalbas比onconientsubjectivemaPPi喀,isProPosedinthisPaper.ItcombinesthelowlevelvisualfeatureandhighIevelsetnantiefeature,池dmakesuseofdassificationwithsinillarityofobjectiveorbackgroundstoreeons如ctsPic奴ireresouree.ItsolvestherelativeProbl。爪5ofPuttingsetnantieonimagebythewayofautomatiesemantieannotation,叨dthes如ulationresultsProvetheproposedmech耐smin而5paPercanimProvetheperibrmanceofrelrieval.Theworksof侃5PaPerareasfollows:Aiflrst,westodythelowlevelvisualfeattireofPicture,Ineludingcolor,tex权址e即dsh叩e.Onthebasisofanal州ngeachft忍权犷e,5thcories,wediscusstheextractionalgorithmandsin五larityme~ent.ToevalUatetheefl贻etive0fthealgorithmswhichareProPosedin面5PaPer,weSlinulatetheseaigorithmsandanalyZethecorresPondingresults.Seeond,westodythesernanticannotationbasedonextractingvisualfeatt甘eofimageeffectively.hithisPaP氏theimPlementof而5Partineludesdireedetailseetions:subjectivemaPPing,automaticsernanticalmotationandrelevancefeedback.ThesubjeetivemaPPing15thePr。刀isesofofl七ringtheautomatiesemanticaxmotationanexereisesetofstudyingandrealization.ItalsoeanPuttheinitialiZedsemanticonimage.Therearetwoeasesinal吐omatiesernantieannotation:one15tostudythesemantieofthehighests而ilarity而ageinformationintheexercisesetandcomPletethesemantie111哈产 annotationautomatieallyafteranewonebdngProeess曰:theotherone15tomodifytheinitial讫edsen以叻tieannotationwiththe拓edbaekinfonnationofusers.Theretrieval伽decanmakethese幻nanticannotationmoreandmoreexac仁即dimProvestheperformanceofselnanticanotationbyrelevancefeedbackofusers,.nmakesthecontain目selnanticmuehdosertothe如agecomPrehensinnofusoandreachthefinalp议POseoflmProvingtheretrievalcaPabilityefl免etively.AitheendofthisPaPer,weimPlementtheretrievalWhich15ProposedinthisPaPer,includingtheenv双Dlnentofsimulations,thewholestrUctt犷eandrealiZationflow.Andthesimulationn尧”ltsProvethatthe户旧posedmech别五smisefl笼etiveKeywords:Imageretrieval,VisualSubjeCtivemaPPing,SemanticRelevancefeedbaek 目录目录第一章绪论............................................................................................................……11.1研究背景..……“....一...……”.......................................................................................……11.2基于内容的图像检索概述...............................................……,............................……21.3国内外发展现状及研究意义................................……,.....……,..........................……31.3.1发展现状.”........................................................................................···········……31.3.2研究意义...……,.….......................................................................................一51.4论文的主要研究内容和结构.............................................................................……6第二章图像特征的提取........................································································……72.1颜色特征的提取,...................................................................……,..·......················……72.1.1颜色直方图…”..................................................................................·..········……72.1.2模糊颜色直方图...................................................···...································……82.1.3颜色特征的相似性度量...................……,...............................................……112.1.4基于颜色特征的图像检索实验与结果分析....……,..........................……巧2.2纹理特征的提取.................................................……,.................................·········……182.2.1纹理特征的相关概念...........……,.............................................……,........……182.22纹理特征的分析.…‘二,.....................................................························一212.2.3基于纹理特征的图像检索实验及结果分析.............……,.................……262.3形状特征的提取..................................................................................·...············……322.3.1图像增强................................……,.......................................……,...............……322.3.2图像分割.....................................................................................……,........……332.3.3形状的全局特征描述子.........................................................................……352.3.4基于形状的图像检索方法.................................……,............................……362.3.5实验及结果分析.........................……,.........................······························……362.4主体及环境相似性.........................……,....................·········································……422.5小结..........................................……,.........……,........................................................……43第三章内容主观映射的语义自动标注..............................................................……443.1图像内容的主观映射...........................................·..··························,················……443.2语义自动标注……”.......................................................................................·..·····……473.3相关反馈..................……”..............................................……,.................................……513.4实验及结果分析...............................................……,.............................············一543.5小结.......................................................................……,..............……,......................……59第四章总体设计及实验分析一、……,.........……、...........……,.,......……、..................……604.1实验环境...............................................................……,.,…,......……,…,...................……604.1.1设计环境.…,……”.......................................................................................……604.1.2实现环境..................................................……,......................................·····……604.2总体框架及实现..........................……,.........……,.......................……,......·...······,··……61 目录4.2.1总体框架....................................................................................................……614.2.2各部分实现流程...……,,............................................................................……644.3实验结果及分析.............................……~...……~................……~..........................……674.3.1检索性能度量..........……~...............……”.…”....................……”.................……674.3.2不同关注点的第一次检索实验结果及分析二”.…”二”……“.…”.........……674.3.3多次反馈后的检索结果及分析…”........……”…”........……”..................……694.4小结....……“...............……,二,.........................…………”..…”…“.…”...........................……71第五章结论..........................................................................................................……725.1论文总结......................................................................……”............……~..............……725.2未来工作展望................……”...................……”.…~.................一..……“.”二”..........……73致谢......................................................................................................................……74参考文献................................................................................................................……75在学期间研究成果................................................................................................……79 图目录图目录图l一1基于内容图像检索系统的基本结构...................................................……3图2一1图片缩放和旋转后直方图对比...........................................................……8图2一2二次距算法中直方图的一对多特征比较........................................……13图2一3联合嫡、条件嫡和交互信息之间的关系........................................……14图2一4基于颜色特征检索的基本实现流程................................................……16图2一5查询例图及返回图片........................................................................……17图2一6图片对应的颜色直方图....................................................................……17图2一7纹理图像示例....................................……,.........................................……18图2一8图像的纹理基元和3x3邻域系统....................................................……21图2一9图像在灰度共生矩阵中的表示........................................................……22图2一10纹理谱方法的检索流程...................................................................……26图2一11查询例图及返回图片.......................................................................……28图2一12纹理谱模糊直方图.................................................……,...................……28图2一13基于灰度共生矩阵的检索流程.......................................................……29图2一14查询例图及返回图片.......................................................................……31图2一15利用颜色特征进行基于形状的图像检索流程...............................……37图2一16图像分块的颜色直方图值及对应的差值表...................................……39图2一17根据形状特征检索的图片..............................……,..........................……40图2一18形状特征检索图片对比...................................................................……41图3一1图像主观映射赋予语义前后数据对比............................................……47图3一2映射前后视觉及Kb尺度上大小的对比.........................................……47图3一3视觉特征相似而语义完全不同的图像对比....................................……51图3一4相关反馈实现原理的基本流图........................................................……52图3一5改进权重调整的相关反馈流程........................................................……54图3一6自动语义标注关系图......................................................……,…,…,...……55图3一7主观映射图例....................................................................................……55图3一8查询结果显示....................................................................................……57图3一9反馈询问及语义修正窗口................................................................……57图3一10相关反馈情况对查准率的影响....................................……,...........……58图4一1检索实现的总体框架...……,..............................................................……62图4一2构建初始检索库及管理界面............................................................……64图4一3新图像入库流程及对相应界面........................................................……65图4一4用户检索流程及界面........................................................................……66图4一5相关反馈流程....................................................................................……66图4一6第一次检索结果...................................................................……,......……68图4一7第一次检索结果的评价度曲线.........................……,..…,..................……69Vll 图目录图4一8多次反馈中的某次和最终检索结果017矛QO︸︶图4一9多次反馈中的某次和最终检索结果 表目录表目录表表2423-24142-131颜色特征的相似性度量..................……‘4O,J甘凡f了l.2,t0X7RN︸︵一1.︺纹理谱特征的相似性度量..............……灰度共生矩阵的相似性度量..........……形状特征的相似性度量..................……不同的反馈情况所得到的查准率效果第一次返回结果的性能度量..........……多次反馈后的检索性能度量..........…… 第一章绪论第一章绪论1.1研究背景信息数字化处理等高新技术的飞速发展,使得人们对多媒体数据的获取途径不断的增多,同时数据的获取量也迅速增长。图形图像作为一种重要的信息载体,通过多样化的视觉特征,直观生动地将抽象数据形象化、真实化地表现出来,极大地丰富了人们信息交流的方式和内容[l1。但面对海量的数据信息,如何更好地通过图像的各种特征实现快速、准确地检索用户所需要的图像信息,己成为目前迫切需要解决的问题。最早关于图像检索的研究是在20世纪70年代,当时主要是基于文本的图像检索技术(几xt七as斑IinageRetrievai,简称TBIR),它通过对图像进行人工文字注解,利用文本检索实现对图像特征的查找。可以看出,这种采用对图像建立关键词等文本描述信息的方式己越来越不能适应网络或图片库系统信息检索的要求,不仅要需要大量的人工操作,而且,面对信息量每天以指数级增长的现实状况,这样的方式也是相当费时的[1]。另外,文字难以反映图像中的完整内容,即人工注解的主观性很难平衡不同的人对于图片认识的差异,这导致了检索的查准率低下,不能满足用户的查询要求。在应用需求的促进下,就自然会有一种新的检索技术出现,以改善在文本检索下低效的检索状况。90年代以后,随着大规模图像集的不断涌现,出现了对图像的内容语义,通过提取图像的颜色、纹理、形状、空间关系等特征对图像进行分析和检索,即基于内容的图像检索技术(Content七asedIinageRetrieval,简称cB琅),当前已成为图像检索领域的研究热点,并在近年来取得了长足的发展,己建立了一大批研究性的或商用的图像检索系统。如果说基于文本的图像检索是“以字找图”的话,那么基于内容的图像检索则是“以图找图”的查询模式,这是对传统检索技术的一大突破[2]。然而,从应用现状来看,基于内容的图像检索技术主要还是运用在一些专业图像的检索系统中,对于因特网这个信息最大、最广泛的交互和共享载体而言,占主导地位的信息检索方式仍然是基于传统的文本检索技术。因为网络环境下的图像资源区别于一般独立图像的特点,在于它们与网页有着千丝万缕的关系,一护 电子科技大学硕士学位论文般都是嵌在研触b文档中随之发布的,处于一定的上下文环境和相对固定的HTML标签当中l2]。所以,借助网络图像的文本环境,可以在一定程度上为图像分析和标引提供依据。而大家所熟知的Google、Baidu等著名搜索引擎便是仍然采用的基于文本的检索方式。虽然如此,这也并不能阻挡基于内容检索技术成为今后图片搜索发展的主要趋势,尤其是在Web搜索引擎上。但由于多方面的原因,基于内容的图片检索目前还没有得到很好的实际应用和推广。可以预见,在基于内容的图像检索技术被完全应用到各图片库检索系统及网络搜索引擎以前,将经历一个基于文字和基于内容相结合的或者由内容向文字映射的过渡阶段。同时,为了减少基于文本方式下大量的手工操作及改善查准率低下的状况,基于内容的检索方式也开始朝着与自动标注语义和用户反馈等技术有效结合的方向发展。1.2基干内容的图像检索概述20世纪90年代初,随着基于文本方式检索中各种问题的日益突出,基于内容的图片检索应运而生。该技术采用通过提取每幅图片的视觉内容特征,包括色彩、纹理、形状等作为索引,并根据其相似度进行查询及匹配等手段,将检索到的图片信息返回给用户[3]。其中,颜色和图像的大小、方向无关,因此该特征被广泛应用于图像检索当中。上述视觉特征将通过各种方法抽取出来,并形成一组特征向量,建立相关索引并存储到数据库中。基于内容的图像检索系统具有与传统基于文本的检索系统完全不同的构架。根据现有的一些基于内容的图片检索的实现方式和技术来看,可分为低层次视觉特征检索和高层次语义特征检索。其中,基于低层次视觉内容特征的提取,利用图片处理及视觉技术来判断图片资源中的相似度并返回满足要求的图片;图像语义特征的提取一般包括图片来源、压缩方式、分辨率、图片相关的注释信息等属性t3],其实现过程通常需要加入与用户交互的环节,以便更准确定义用户的需求和方便用户查询,并根据有效的反馈技术及机制所获取的信息来评估和改善搜索结果l4]。图1一l表示了基于内容的图像检索系统一个基本的结构。由图中可以看出,系统的核心是图像特征数据库,且图像的特征既可以从本身提取得到,又可以通过与用户交互获得,并用于计算图像之间的相似度。用户可以向系统提出查询要求,系统根据查询要求返回查询结果,用户还通过对查询结果的相关反馈来改进查询结果[5]。 第一章绪论查询/反馈图图像特征数据库库检索用户图1.1基于内容图像检索系统的基本结构该体系结构包含了基于内容的图像检索中的一些关键性环节[51:选择并提取能够充分表达图像内容的视觉特征;处理基于相似度的图像检索;处理用户对检索结果的相关反馈,改善检索的查全和查准率。归纳起来,基于内容的图像检索技术主要有以下几方面的特点[51:该技术突破了传统的基于表达式检索的局限,从媒体内容中提取信息线索。基于内容的图像检索是一种近似匹配的技术。它同时也是基于大型数据库的快速检索。在该技术的实现过程中,结合了相关反馈等有效手段。1.3国内外发展现状及研究意义1.3.1发展现状随着信息检索、图像处理、计算机视觉、人工智能等多领域技术的发展,基于内容的图像检索得到了越来越多的关注并投入了大量的研究,取得了极大的进展。发展至今,该领域主要有三个方面的研究热点t2]:第一,基于图像全局或区域的检索方法,即通过选择适合的整体或局部特征描述去尽可能表达出图像的完整内容,并采用一定的相似度量方法进行图像的匹配,该方向也可称为以图像为中心的方法,很明显,它对于用户的需求缺乏分析,并不能很好的满足用户的主观检索要求;针对第一个研究热点中出现的问题,展开了对第二个热点的研究。其中借助了相关反馈的思想,根据用户需求及时调整系统检索时采用的特征和相似性度量方法,从而缩小低层视觉特征和高层语义之间的差距,也就是所谓的“语义鸿沟”;最后,是研究如何从多种渠道获取图像语义信息以及将图像的低层视觉特征与图像关键词结合进行图像自动标注以提高检索准确率等161。 电子科技大学硕士学位论文在上述研究热点及相关技术的推动下,许多公司已经纷纷推出了一些具有代表性的基于内容的图片检索系统。vmAGE公司的vIR(巧sualInformationRetrieval)图像引擎提供了四种可视属性检索(颜色、成分、纹理和形状)闭。每种属性被赋予0到10的权值。该软件对选出的基础图像的色调、色彩以及饱和度进行分析,然后在图像库中查找与这些颜色属性最接近的图像。用户可以设定一个或多个属性权值来优化检索。要达到最佳平衡度需要反复试验,但检索过程是相当快的。在结果显示矩阵中可以选择查看3,6,9,12,15或18个简图。通过对四个属性权值的调整,显示出不同的检索结果,其中简图是根据相似度降序排列的。点击简图标题将得到该图像的一些详细说明,包括计算出的相似比。Photo权沁k是美国麻省理工学院多媒体实验室开发的用于图像查询和浏览的交互式工具闭。它由三个子系统组成,分别负责提取形状、纹理、人脸特征。用户可以根据三个子系统中相应特征来查找图像。QIBc是IBM公司开发的基于内容的图像检索系统门。它支持基于图像的查询方式,也支持草图、轮廓、组合颜色和纹理特征的查询以及其它检索方式。巧sualsEEK和研肥bsEEK是哥伦比业大学开发的基于视觉特征的搜索引擎和面向WWW的文本或者图像搜索引擎闭。它们都采用图像区域关系和从压缩域中提取的视觉特征。巧s.alSEEK系统采用的视觉特征是颜色集和基于小波的纹理特征。为了加快检索速度,系统采用了二叉树的索引算法。劝s让alSEEK支持基于视觉特征的查询和基于空间关系的查询。W比SEEK是一个面向从因切万的搜索引擎。它由二个主要模块组成,分别是图像舰频采集模块,主题分类和索引模块,查找、浏览和检索模块。它支持基于关键字的查找和基于视觉内容的查找。在国内,基于内容的图像检索系统主要有中国科学院计算技术研究所智能信息处理重点实验室开发的基于内容的图像检索演示系统灿res)[7],Mires系统是一个综合利用高层语义特征和低层可视特征的图像检索系统。它通过机器学习的办法提取图像语义类别来表示图像高层内容,底层特征则集成图像的颜色、纹理、边缘特征,该系统还实现了基于核函数和SVM的相关反馈算法。诵res系统对各种类别的图像都能进行有效的检索。除了上述的系统外,在国外还有ExcalibUr科技有限公司开发的RetrievalW扯e系统,UCSB大学开发的Netra系统,加州大学B诫eley分校开发的Blobworid系统,普林斯顿大学开发的cAETllML系统等[41。 第一章绪论1.3.2研究意义基于内容的图像检索技术有着非常广泛的应用,涉及到社会和生活的许多方面[2]。第一,科技的飞速发展使得人们越来越关注知识产权的保护问题,许多知识产权的载体都是图像,表现尤其突出的是商标和艺术作品,因此,利用基于内容的图像检索技术对实现商标的专用图形标记的自动审查无疑是具有非常现实的意义的。第二,网络正逐渐渗透到人们学习工作和生活的方方面面,除了文本资源外,网络上还存在非常丰富的图像资源。新一代网上搜索引擎应该具有协助用户从海量而且无序的网上图像资源中寻找符合要求的图像的能力,而基于内容的图像检索技术在其中扮演了相当重要的角色。第三,尽管传统的图像处理领域早就开始涉足医学和遥感图像的分析和处理的研究,但它们仍然是一个开放的研究课题,无论是民用还是军事,对于它们的研究都具有非常重大的意义。特别是在图像规模不断增加时,准确有效的图像分析手段以及快速的图像识别和检索技术就显得尤其重要。第四,当将图像的内容限制在特定领域时,基于内容的图像检索技术将找到更为具体的研究和应用意义,如犯罪与安全预防等,毫无疑问,这具有重大的社会价值。另外,互联网是一个开放的网络,这就必然会带来一些负面的影响,如不健康内容的日益增多等,尤其是一些低级趣味的图片,这在最近的一些事件中也显得更为突出。很显然,基于内容的图像检索技术完全可以应用到具有图像过滤需求的应用当中,为大家创造一个健康、干净的网络环境。除了上述所列之外,基于内容的图像检索技术对于设计、远程教育、新闻和广告、个人相册管理等方面也同样具有相当大的应用意义。通过对基于内容的图像检索技术应用前景的分析,可以发现该技术是相当具有研究价值的。另一方面,基于内容的图像检索仍然存在了许多难点问题和技术上的不足,目前还没有得到很好的解决。由于基于内容的低层次视觉特征检索需要进行如欧氏距离、相似度、小波变换等大量复杂的计算,且图片的规模一般比文本描述大,这些都将导致检索的时效性大大降低。再者,由于提取出来的特征完全是从客观上对图片本身的数据及相关度进行的分析,并不一定能很好的体现用户搜索的主观愿望,这也严重影响了检索的查准率[81。而高层语义特征在反映图片属性的同时更偏向于体现用户对图 电子科技大学硕士学位论文片的主观认识;从用户的角度出发,基于语义特征的检索能表现出更好的查准率,因此需要将高层语义特征与低层视觉特征技术很好地结合起来,这是现在图片检索领域研究的一个最主要的障碍,同时,语义特征的描述也一直是一个没有得到较好解决的难题[6]。除此之外,还有检索对象及特征和范围的多样性、对图像检索系统评价尚无统一性标准和图像检索技术从单机、局域网向因特网搜索引擎的发展等问题使得基于内容图像检索技术的实际应用受到了很大的阻碍。为此,结合基于内容检索技术的巨大应用价值和该技术仍然存在的不足,可以看出,对该技术进行更深入的研究从而解决好存在的相关难题使之有效地投入到实际应用中,这对社会、生活都具有非常重要的现实意义的。同时,对资源共享、信息的有效利用及搜索引擎的发展来说也将是一个极大的促进和推动。1.4论文的主要研究内容和结构本文从目前在基于内容的图像检索技术的应用中仍然存在的一些不足入手,研究基于内容主观映射下自动标注语义的图像检索方式,以提高图片本身特征提取中复杂的计算、手工操作等时效性,以及改善高、低层特征间的“语义鸿沟”和单纯低层视觉特征不能满足用户查询图片的主观愿望的状况。论文一共包括五个章节:第一章为绪论,该部分包含了对基于内容的图像检索的概述,并介绍了该技术的研究背景、发展的现状及研究意义和应用价值。第二章为对图像特征提取的分析,在该章节中主要是针对图像视觉特征的提取,包含颜色、纹理和形状三个特征,分别从基础知识、常用的方法及有效的提取手段等方面进行了分析和说明。第三章对内容主观映射的语义自动标注进行了介绍,该技术主要是针对手工操作的低时效性而做出改进的检索实现方式,其中包括了图像内容的主观映射,相关研究工作已在《基于内容主观映射的图像检索研究》一文中发表;语义的自动标注和学习;相关反馈三个方面,从分析相关的理论和原理入手,通过具体的实验来分析文中所采用的语义自动标注方式的实现效果;第四章为检索方式的总体实现及分析。在这一章中,介绍了实验环境的搭建,以及从整体到部分的实现流程,最后对实验结果进行了分析,并得出结论。最后一章是结论部分,包括对整个论文的总结及基于内容的图像检索技术发展前景的一个展望。 第二章图像特征的提取第二章图像特征的提取对图像视觉特征的提取,是基于内容的图像检索技术的基础,它区别于图像的高层语义特征,是纯粹的从图片中去寻找描述本身的线索,可以说是对图像最客观的反映。同时,其选择、分析和提取的好坏直接影响到图片检索的时效性、准确率以及最终用户对检索的满意度。图像视觉特征中关注和研究较多的是颜色、纹理和形状特征,在下面各小节中一一进行分析和说明。2.1颜色特征的提取在上一章对基于内容的图像检索技术的概述中提到,颜色特征因为其大小和方向无关性是图像检索中应用最为广泛的视觉特征,其提取也相对其他特征容易。目前已有许多文献提出了各种基于颜色的图像索引技术。在文献[91中首先提出了使用颜色直方图作为图像内容的索引特征,即根据划分的颜色子空间及对应像素值的计算,并采用直方图的交进行相似性度量;与此类似地,Ha丘er在QBIc中则采用了直方图的二次距离作为图像的相似性度量[’0];另外stricker等人也采用了颜色值的前三阶矩来表征图像的内容11】,等等。由此可以看出,对于颜色特征的表达,通常都是通过直方图或颜色矩的方式。本小节首先对图像颜色直方图的基本知识进行介绍,并在此基础之上讨论了模糊颜色直方图的提取方式和算法,通过计算颜色分量间模糊颜色直方图的相似程度来表达图像之间的相似性,整个过程在该小节最后的实验中进行实现,同时对实验所得的相关结果进行了分析。2.1.1颜色直方图通常,可以用直方图来表示颜色的分布情况。对于给定的图像I【x,y],它的颜色直方图可以由下式计算出来[2]:Qc仇I[x,动=m(2一1)hc伽,一霎氢仁其他其中,m为划分的颜色子空间数;X、Y氛围图像的宽度和高度;Tc为颜色空 电子科技大学硕士学位论文间的变换,即对颜色向量(r,g,b)的一种操作:Q。为对颜色变换的量化,也即对Tc的量化。颜色直方图具有在旋转和缩放过程中信息不丢失的前提下的不变特性。在一个简单的实验中,将一张表现内容为晚霞,格式为JPEG的风景照片,分别做缩放和旋转后保存为下组中的第二和第三张图片(第一张为原图),而每幅图像下面对应的便是对该图像的直方图表示。通过实验分析,对比三个直方图,虽然不是完全一样,由于在缩放和旋转过程中采用的是简单的统计方法,因此会有少量的信息丢失,这就导致了直方图表现的少许差异,但总体上来看各颜色子空间的曲线形态和能量分布是非常相似的。这并不有悖于进行基于内容的图像检索的初衷,其原本就是为了查询相似的而不是完全相同的图像l5]。图2一2图片缩放和旋转后直方图对比通过上面实验,可以看出一幅图像无论它以放大或缩小还是翻转后的形式保存下来,利用颜色特征的这种不变性都能较为准确地将其查找出来。那么,在基于内容的图像检索中,提取颜色特征作为图片描述的一个手段正是利用了该特性。2.1.2模糊颜色直方图近几年来,在基于内容的图像检索中对模糊直方图的应用受到越来越多的关注和研究[,,一r,3]。1.模糊颜色直方图的定义给定一个包含n个颜色索引的颜色空间,图像q包含N个像素,则模糊颜色直方图的定义为l2]:图像q的模糊颜色直方图F伪)一以,人,…,fn}, 第二章图像特征的提取N上夸。,,关二艺心弓=V‘‘曰‘犷(2一2)j=1j=lPj表示从图像q中任选一像素为j的概率;p,j表示第j个像素对于第i个颜色索引的隶属度函数【l4]。2.模糊C均值聚类算法在模糊直方图的计算中需要用到模糊C均值聚类(FCM)算法,该算法同时考虑了相同及不同颜色索引像素之间的差异,经实验证明,它比传统直方图方法(CCH)有更好的稳健性和更好的效率[2]。模糊C均值聚类算法是一种基于划分的聚类算法,其主要思想是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小,并通过隶属度来确定每个数据点的归属的一种聚类算法。它不仅是一种柔性的模糊划分,其计算过程也不是很复杂。令x={xl,凡,…,凡},并将其分为。个模糊组,求每组的聚类中心,使得用隶属度函数,(x)定义的目标函数达到最小。同时通过每个给定数据点用值在0和1之间的隶属度来确定其属于各个组的程度。与模糊划分相对应的隶属矩阵U=〔ul门允许有取值在0到1之间的元素,且隶属度总和为1,即[l5],C艺u*=1,Vk=l,2,…,n(2一3)i=l则,FCM的目标函数:1
此文档下载收益归作者所有