《基于综合特征的图像检索系统研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
万方数据中图分类号UDCTP391620硕士学位论文学校代码!Q§三3密级公珏基于综合特征的图像检索系统研究与实现TheResearchandApplicationofImageRetrievalSystemBasedonComprehensiveFeature作者姓名:学科专业:研究方向:学院(系、所):指导教师:李花控制科学与工程图像处理信息科学与工程学院罗桂娥教授答辩委员会主席型中南大学二零一四年五月 万方数据学位论文原创性声明【LIIIIllIIIII1IIIIIIillIY2684882本人郑重声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他教育机构的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。申请学位论文与资料若有不实之处,本人承担一切相关责任。作者签名:日期:塑!±年』月皿日学位论文版权使用授权书本学位论文作者和指导教师完全了解中南大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机构送交学位论文的复印件和电子版;本人允许本学位论文被查阅和借阅;学校可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用复印、缩印或其它手段保存和汇编本学位论文。保密论文待解密后适应本声明。作者签名:磕聊签名趔日期:型生年』月华日 万方数据基于综合特征的图像检索系统研究与实现摘要:随着多媒体技术的快速发展和海量图像库的不断涌现,如何快速准确地从大型数据库中检索到相关图像已成为急需解决的难题。传统的基于内容的图像检索方法是基于单一特征的,对图像的检索存在偏颇,精度不够。为了全面描述图像内容属性,往往需要综合多种特征检索。本文重点对颜色和形状特征进行研究,并综合颜色和形状进行检索,主要研究内容如下:1.深入分析和研究了CBIR领域内的一些相关技术,针对图像颜色空间的分布特性提出一种基于HBCH索引的图像检索方法。该方法首先通过等面积的环形划分方法对图像分块处理再进行特征提取,引入了图像颜色的空间联系,较好地体现了图像颜色的空间位置亘。2.从图像的形状特性出发,在图像兴趣点的基础上提出了一种基于均匀Harris兴趣点的Hu矩形状特征图像检索方法。首先采用了基于均匀Harris算子的兴趣点提取方法提取均匀Harris兴趣点,然后用等面积的环形划分方法将兴趣点划分成四个区域,计算每个区域的Hu矩形状特征,从而获取图像的形状特征向量SF。3.在颜色和形状特征的研究基础上,将改进的颜色与形状特征进行加权综合,进行综合特征的图像检索。采用MicrosoftVisualc++6.0开发工具构建一个基于综合特征的算法验证系统。实验数据证明基于HBCH索引的图像检索方法和基于均匀Harris兴趣点的Hu矩形状特征的图像检索算法检索精度一样。其中基于均匀Harris兴趣点的Hu矩形状特征的图像检索算法提取的特征信息内容丰富、数据量小,应用到检索中快捷高效。而基于综合特征的图像检索算法的检索结果的查准率最高,更符合人们对图像的直观感受。图45幅,表4个,参考文献61篇。关键词:CBIR;HBCH索引;均匀Harris兴趣点提取;综合特征分类号:TP391 万方数据TheResearchandApplicationoflmageRe廿ievalSystemBasedonComprehensiveFeatureAbstract:Wriththerapiddevelopmentofmultimediatechnologyandthegrowingemergenceofmassiveimagelibrary,howtorapidlyandaccuratelyretrievetherelatedimagefromalargedatabasehasbecomeanurgentproblem.Thetraditionalcontent-basedimageretrievalmethodiSbasedonsinglefeature.themethodiSbiasedandlackofprecisionforimageretrieval.Inordertofullydescribetheimagecontentattribute,alwaysneedscomprehensivevarietyoffeaturestoretrieve.ThisPapermainlystudiedthecolorandshapefeatures,andcomprehensivecolorandshapefeaturestoretrieval,themainresearchcontentiSasfollows:1.In.depthanalysisandresearchofsomerelatedtechnologiesonCBIRinthefield.basedonthedistributioncharacteristicsofimagecolorspaceputforwardanimageretrievalmethodbasedonHBCHindex.OnaccountofthedistributioncharacteristicsofimagecolorspacepresentaimageretrievalmethodbasedonHBCHindex.Themethodfirstlyusetheequal.areacirculardividingmethodtoblockprocessimageandtheextractefeatures,thiswayCanassociatetheimagecolorspace,willbewelledtoreflectthepositionofimagecolorspace.2.Startingfromtheimageshapefeaturesandonaccountofimages‘●一一'一。interestpoints,proposedaHurectangularslaapeteatureimageretrieval.methodbasedonaunifoITllHarrisinterestpoint.ThismethodfirstlYadopttheinterestpointextractionmethodbasedontheuniformHarrisoperatortoextracttheuniformHarrisinterestpoint,thenuseequal.areacirculardividingmethodtodividetheinterestpointsintofourregions,andcalculatetheHurectangularshapefeatureofeachregion,thenobtaintheshapefeaturevectorSFofimages.3.Basedonthestudyofcolorandshapefeatures,syntheticallyweightedtheimprovedcolorandshapefeatures,andthenretrieveimagebasedoncomprehensivefeatures.ThispaperadoptedtheMicrosoftVisualC++6.0developmentt001tobuildaalgorithmvalidationsystembasedoncomprehensivefeatures.III 万方数据ExperimentaldatashowthatthetwoimageretrievalmethodswhichonebasedonHBCHindexandtheotheroneuseuniformHurectangularshapefeaturesbasedonHarrisinterestpointshasthesameresultofretrievalprecision.Theresultoffeatureinformationextractedbythesecondmethodwithrichcontent,smallamountofdata,appliedto‘juicklvand““。cientlv,whilethe'esultoffeature。nformationretrievequicklyandeRmlentwlalletlaeresultotteamreIntormatlonextractedbythefirstmethodwithhi吐estprecisionandmoreaccordwithpeopleofimageintuitivefeeling.Figurenumber:45,Formnumber:4,Referencenumber:61.Keywords:CBIR;HBCHindex;UniformHarrisinterestpointextraction;Comprehensivef.ea吡eClassification:TP391IV 万方数据目录学位论文原创性声明⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯I摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.II目录⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯V1绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯11.1课题背景及研究意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯11。2图像检索技术的现状及发展⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯21.2.1基于文本的图像检索的现状及发展⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.21.2.2基于内容的图像检索的现状及发展⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.41.3基于内容的图像检索技术的应用领域⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯51.4经典的基于内容的图像检索系统介绍⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯61.5本课题的研究内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯71.6论文组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯82CBIR基本架构及相关技术研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯102.1CBIR基本架构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.102.2图像预处理技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..112.2.1图像的灰度化⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯112.2.2图像的平滑⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯122.2.3图像的锐化⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯132.3图像底层视觉特征描述和提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..142.3.1颜色特征⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯152.3.2纹理特征⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯172.3.3形状特征⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯182.4图像检索中常用的相似度量方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..202.5图像检索算法的评价标准⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..212.6本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..233基于等面积分块颜色直方图索引的图像检索方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.243.1颜色空间的选取及颜色量化方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..243.1.1颜色空间的选取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯243.1.2颜色量化⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯263.2HBCH特征提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯273.2.1图像等面积环形分块⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯28V 万方数据3.2.2图像HBCH特征提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..283.3HBCH索引的图像检索方法实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯293.3.1HBCH索引⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯293.3.2HBCH特征相似度计算⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯303.3.3算法流程与实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯313.4实验结果及分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..323.5本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..344基于HBCH和改进形状特征的图像检索方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯354.1均匀Harris兴趣点的Hu矩形状特征提取方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯354.1.1兴趣点介绍⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯354.1.2基于经典Harris算子的兴趣点提取方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯364.1.3基于均匀Harris算子的兴趣点提取方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯384.1.4基于均匀Harris兴趣点的Hu矩形状特征提取方法⋯⋯⋯⋯⋯⋯⋯404.2HBCH特征与改进的形状特征的加权综合⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯414.2.1检索特征综合策略⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯414.2.2基于均匀Harris兴趣点的形状Hu矩特征相似度计算⋯⋯⋯⋯⋯⋯424.2.3颜色与形状加权相似度计算⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯424.3算法流程与实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..434.3.1基于改进形状特征的图像检索算法流程与实现⋯⋯⋯⋯⋯⋯⋯⋯⋯434.3.2基于综合特征的图像检索算法流程与实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯444.4实验结果及分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..464.5本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯495基于综合特征的图像检索系统的设计与实现⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯505.1系统的开发环境和配置要求⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..505.2基于综合特征的图像检索系统的设计框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..505.3基于综合特征的图像检索系统实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯515.3.1图像检索系统开发流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯515.3.2系统界面和功能模块⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯525.3.3实验举例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯575.4本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..576总结与展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.596.1总结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯596.2展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯60参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.61VI 万方数据攻读学位期间主要的研究成果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.65致{射⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..66VII 万方数据硕士学位论文1绪论课题背景及研究意义近年来,随着计算机技术、互联网以及多媒体信息技术的高速发展,数字图像的数量正以无法预料的惊人速度增长,出现了大量图像信息共享的需求。图像信息作为高频共享数据之一,含盖了大量有用信息,在人们的日常生活中占据了越来越重要的位置,在各行各业中的应用显得尤为重要【lJ。因而人们对图像信息处理技术产生了许多新的需求。然而目前各个领域中海量的图像信息杂乱无序地分布,没有一种图像检索方法可以理想地在各行各业中通用,从而使得这些丰富浩大的图像资源无法高效地为我们服务【2J。为了在这杂乱无序的信息海洋中快速并准确地获取所需要的信息,图像检索的研究成为当前计算机领域的一个重要课题【3J。图像信息作为一种内容丰富、视觉直观、便于区分和无语言限制的信息载体,数据海量,数据结构复杂以及受主观性影响大。早期的管理图像信息的方法是以文件为单位地逐个打开浏览,机械地寻找用户所需的目标图像。这种管理图像的方法操作简单,正确率高,但是随着图像数据库的快速膨胀,管理起来耗时费力,查找效率低。随之图像检索技术的研究引起了重视,图像检索技术中最初是利用像素点的简单有序的组合体作为描述图像信息的模型,用一组元数据的向量来表示,通过点对点的相似性对比来度量进行图像查询【4J。但是几个简单的元数据并不能充分地描述图像内容,造成检索出来的图像不符合用户实际需求,检索效果粗糙。现在技术比较成熟的是基于关键词的图像匹配技术,其主要研究内容是围绕数据库方面进行。这种检索技术需要通过人工分析,提前对图像库中的每一幅图像注释,因而工作量太大,且图像的丰富性和人对图像认识的多样性很难准确客观的描述图像信息。所谓“一张图胜过千言万语”,图像内容丰富,但是描述特征的技术有限,常常导致图像检索不成功。而新生的基于内容的图像检索技术采用针对图像内容属性的特征提取技术进行图像检索,不需要人工对图像进行标注,节省劳力,是当前图像检索技术中研究人员最感兴趣的热门方向之一【51。一般采用基于内容的图像检索技术进行图像查询时,通过图像底层视觉特征如颜色、纹理、形状和轮廓等对图像做一个内容属性的描述[61。然而单一地基于任何一种图像特征的相似度匹配方法只能片面地描述图像属性,都存在各种各样的优缺点。为了消除单一特征给图像检索带来的缺陷不足,需要设计出一种基于综合多种图像特征的图像检索系统。将颜色、形状、纹理等图像特征组合起来描述图像信息使所描述的图像内容更贴合图像本身的语义信息,从而提高图像检索的准确性,使检索结果更加 万方数据硕士学位论文1绪论符合用户的检索要求‘71。最先由Niblack提出综合各单一图像特征进行图像检索的思想【81。之后Pentland等人在Photobook的研究中证实将综合的多种特征应用到图像特征的描述中可以提高检索效果【91。本文在研究国内外图像检索技术的基础上,对基于内容的图像检索技术和算法进行了一些深入的研究,做出一些改进使得检索效率得到一定程度的提高。1.2图像检索技术的现状及发展随着图像检索技术在各个领域的热门应用,从20世纪70年代以来,主要经历两个发展阶段:基于文本的图像检索技术和基于内容的图像检索技术00]。1.2.1基于文本的图像检索的现状及发展如前1.1节所述,最初大多采用以文本标注(Annotation)的多媒体检索手段,也就是基于文本的图像检索【11|(Text.basedImageRetrieval,TBIR)。纯文本信息检索事先对图像库中的每一幅图像理解分析,加上在此基础上的一个关键词文本信息。然后将用户提出的关键词文本和此数据库中标注的文本信息进行比对,返回“最相似”的图像信息。图1.1表示了基于文本的图像检索的系统框架。这种技术成熟,操作简单易行,符合人4f]的检索习惯。然而对于图像“最相似”的定义,从图像理解的概念出发,千种人千种看法,如图1.2,就可以用“动物”、“马"和“斑马”等进行标注,其造成检索结果千差万别。/\啦H7I/J、T^位杀倒1豕图像索引图像库数据库1关键词索引用户反馈图1-lTBIR系统框图随着信息时代的来临,数字DV,数码相机,智能手机,平板电脑等电子设备的大量普及,图像数据呈爆炸式增长。依照传统方法,人工标注每一幅图像不仅耗时耗力,而且并不现实。大多数图片以有序却与图片主体内容毫无关系的一系列编码符号命名,如“DSCN001”、“图片100”。目前许多商用WEB搜索引擎如百度和谷歌由于技术局限,主要也是采用与TBIR相似的技术方法。本文作者通过百度和谷歌两大搜索引擎输入关键词“李宁”对国家运动员李宁进行搜索。图1.3为用百度搜索引擎完成的图像搜索结果部分图像示例,图1.4为用谷歌搜索引擎完成的图像搜索结果部分图像示例。从图中实验结果可以看出,搜索结果不尽如人意,出现了许多与用户意愿违背的图片,例如图1.3中的李宁牌运动衣和图1.4中的李宁牌运动鞋广告设计图等2 万方数据硕士学位论文1绪论等。这主要是因为文本检索是按图片文件名或标注的关键词文本信息进行检索,而标注的文本信息因分析理解的概念不同而有歧义,以致检索结果并不理想。图1.-2主观歧义图片01。鬻豢鬟黪黧鬻i纛I_:乏7§§l《鬻《黪鬻》%黪iii薹薹纂jj鑫滋燮菱篓燮篓鋈荔蓄筠鬻攀8ai泌图片瓤露融曩赌晓£。运量曼誉片弦叛髋勰x鞲“糕赣鹈搿鞲糍藉藉糍蔫藉鞲鞲赫§髓羹藿搿§l瓣ll《骞*i燃{磐g群g搿#§鞲§群棼鸶赞搿囊端g辩舅湫譬舞#鬣妊黼蠹&描#∞搿赫黼赫※《#∞※黼潞赫蕊黼黼㈣蕊黼赫蠊僦B%※##珑虢瓣戮减*麟《#∞黼《《∞糍z萎;;S黼j擞谶戤l驻叛I虢强^童登文妻李宁国百度一下』q相最掺晕挛宁运动鞋李宁标志李宁女士运动鞋李宁Iocjo,i清誊Ⅱ片专业素材瘁为等捷供以下结冕笛函■兰鼙只寸-全擎驺色滏蠹管垒都710象素材痒括票≯、|::竺二图]-3百度搜索引擎的部分“李宁”搜索图像示例 万方数据硕士学位论文1绪论滋蕤蒙瓣璧蕤冀雾震瓣薹爨黧Got窖卜煞⋯I,:::::___j.粤霾豳臻圈墨;霹夏蟊凳j芭图黼褫餐更多⋯鬟霹工曼每¨_相关搜素:茎主拄塞茎主虹垒至宝亡直至强奎芏篮蔓整妻主娃蛰釜图1.4谷歌搜索引擎的部分“李宁”搜索图像示例在长期的应用实践中可以发现基于文本的图像检索虽然技术纯熟,简单方便,但是有一些致命的短板导致其在图像检索技术中终将被更为优异的技术所取代。基于文本的图像检索主要缺陷如下:(1)人工对每一幅图像进行标注,对大型的图像数据库而言工作量繁复,耗费劳动力;(2)文本描述信息的主观多样性使得不同人对相同图片有不同理解,标注有差异,从而可能导致检索失败;(3)图像内容包罗万象,丰富复杂,简单的关键词文本无法全面充分描述图像;(4)INTERNET的高速发展,使得很多不同国家民族可以信息资源网络共享,却无法用一种语言对图像标识,无法统一。1.2.2基于内容的图像检索的现状及发展20世纪80年代,多媒体技术突飞猛进,但是图像信息管理却没有引起重视。到90年代,人们渐渐发现简单依靠文本检索远远无法满足要求,以上的问题也变得越来越发尖锐。自动智能地查询管理图像,实现高效方便的查找成为检索技术中的一个热门研究课题,一种新的技术——基于内容的图像检索技术㈦(Content.basedImageRetrieval,CBIR)兴起并迅速发展,逐渐成为图像领域的一个研究焦点。经过一段长4 万方数据硕士学位论文1绪论时间的发展和研究,提出了许多比较较成熟的基于图像内容的检索算法,如:基于颜色特征检索的颜色累加直方图法【13】和颜色集法【14】、基于纹理特征检索的Tamura纹理法[15】、灰度共生矩阵法【161和马尔可夫随机场法【17】、基于形状特征检索的形状不变矩法【18】和傅里叶形状描述法【19】等。这种技术直接采用图像内容的各种特征例如图像的颜色、形状、纹理来表示图像,在理解图像内容的基础上对示例图像进行查找。实际上,图像的内容特征是从人类的视觉特征出发,对图像内容的一种抽象和压缩,全面丰富地描述了图像内涵,对图像检索的精度起了决定性的作用。CBIR技术综合了图像处理、模式识别、计算机视觉、数据库、人工智能、等学科知识。如表1.1,相较简单的TBIR技术由该领域专家人工标注的特征提取方法,CBIR通过算法由计算机自动获取图像的视觉特征信息描述图像,相似度量也不再是关键字匹配,而是图像特征之间的相似对比,检索效率更古【20l。表1-1基于文本的图像检索方法与基于内容的图像检索方法的比较1.3基于内容的图像检索技术的应用领域如上一节中介绍,基于内容的图像检索是一个新兴交叉领域技术,涉及多种学科。随着相关技术的逐步成熟,图像检索已经直接间接的被应用到其他相关领域【2l】。(1)数字图书馆:数字图书馆是一场对传统图书馆的颠覆性改革,它从根本上改变了人们对信息资源存储和获取的方式。数字图书馆将会是主要的教育设施,在教育领域里占有非常重要的地位。(2)基于WEB的搜索:INTERNET中百分之十五的内容由图形、图像和视频 万方数据硕士学位论文1绪论组成,并且这个比例还以一定速度上涨。快速有效地获取网络资源成为现如今亟待解决的IT难题。基于内容的图像搜索充图像内容特征出发,相较TBIR更贴切满足用户需求。国内已经有部分网站开始着手面向WEB的图像搜索引擎,如淘宝。(3)网络环境净化:互联网的飞速发展伴随着一些负面影响——充斥大量不健康内容毒害青少年的心理健康。国家投资了大量人力物力来拦截不良图像,而基于内容的图像检索技术可以过滤特征相似的不健康内容,对网络环境的净化就显得尤为重要了。(4)城市安全建设:通过CBIR实时安全监控城市中的意外危险,如交通意外、火灾、暴动等。一旦发现隐患,迅速排除隐患,为城市生活环境提供安全保障。(5)生产监控:伴着现代化的高速节奏,工业生产的安全问题也随之而来,通过图像监控无法预料的安全意外,防患于未然,是现代化生产中不可或缺的一道工序。(6)知识产权保护:科技的日新月异使人们意识到保护知识产权的重要性,而许多知识产权都是以图像为表现形式,例如商标,获奖证书的图章等等。利用CBIR技术建立严格的审查系统可以有效地防止侵权,保护知识产权。(7)医学领域:医院和疗养院等医疗机构每天都有大量的数字图像需要处理,因此图像处理、网络技术和数据库在医疗领域中发挥着重要的作用。1.4经典的基于内容的图像检索系统介绍鉴于基于内容的图像检索巨大的商业应用价值和广阔的发展前景,国内外信息领域科技人员经过十几年的研究,成功地将CBIR技术应用到系统模型中。许多商业企业和研究机构针对各种应用场合开发了一系列的不同应用背景的CBIR系统,主要介绍下面几个。(1)国外研究实验和原型系统QBIC:20世纪90年代,mMAlmaden研究中心针对商业化应用开发了世界上第一个用于商业的基于内容的图像检索系统——QBIc(Que巧byImageContent)【221,是图像检索领域内的一个范例和目前应用最广的图像检索系统。用户可通过该系统选择不同的检索方式实现示例查询、草图查询或由用户自己指定的特征查询,支持颜色、纹理和形状的特征描述方式。其中用RGB颜色直方图描述颜色特征,用线条的粗糙度、对比度和方向性融合性表示纹理特征,而系统的形状特征则主要由面积、轮廓、偏心率、圆度和矩不变量等特征描述。系统的图像库中有数千幅图片,除了支持基于Content.based的检索,还附带基于Text.based的查询检索。QBIC系统技术成熟,应用广泛,极大地推动了CBIR的应用和发展。Virage:同QBIC系统一样,Virage[23]也是用颜色、纹理和形状等底层视觉特征 万方数据硕士学位论文1绪论描述图像,不同的是它是其同名公司研发的CBIR搜索引擎。主要可以实现图像分析、比较和管理的功能,特别的是该系统是一个开放式框架,为用户提供界面开发工具包来自行定义图像特征、给特征赋0到10的权值、制定相似对比方法等。Virage的系统开放性使其广泛应用在一些特定领域图像数据库做二次开发,取得比较好的效果。Photobook:MIT多媒体实验室开发研制了Photobook【24】系统,主要用于基于纹理、形状和人脸面部特征的图像检索和浏览,是一套应用于研究的交互式工具。其中Photobook中的人脸识别系统已经被美国警察机关采用。MARS:多媒体分析和检索系统MARS(MultimediaAnalysisandRetrievalSystem)[25】是由美国伊利诺斯大学ILLINOI研发的一个多学科交叉产物。该系统可按实际要求组合各种图像特征,并且应用了相关反馈技术,优化了查询向量,实现了相似算法的自动选择。(2)国内研究实验和原型系统近些年,随着我国经济的发展,从自然科学到社会科学每一个领域都渗透着基于内容的图像检索的应用。但是由于国内对CBIR的研究起步较晚,与国外相比,国内无论是在理论研究还是实际应用方面都稍显逊色。从昌前实际应用现状看,CBIR主要以能应用在一些专业图库中进行图像检索,还没有通用的系统形成。各学科跨界融合应用,对信息资料的管理查询提出了新的要求,专家陆续在基于内容的图像检索方面开展了研究。国内自主开发的图像检索系统有:清华大学开发了基于INTERNET静态图像的CBIR检索的原型系统【26】,这是一个模块化的图像检索系统,提供包括颜色、纹理、形状等特征及综合利用不同特征的查询和检索方法。中国科学院声学研究所设计了一种应用了相关反馈调整试验参数的CBIR系统【z71——ImageSeek,可实现基于颜色、纹理特征的图像查询。云南大学开发了用图像单元熵进行查询的商标图像检索系统【28J。浙江大学计算机系研究所开发了PhotoNavigator系统,主要是用颜色和形状进行检索【2引。国防科技大学多媒体开发中心开发的基于内容的视频新闻节目浏览检索系统。1.5本课题的研究内容图像检索是从计算机视觉和图像处理基础上发展起来的,随着图像信息的大量增加,只依靠文字信息检索所需内容的“字找图”方式远远无法满足人们的需求,亟需一种新的“图找图”检索方式。“图找图”的关键原理就是对图像属性的精确描述,一个好的图像描述会给图像检索成功操作打下牢固基础,因此如何准确全面地描述眼睛所获取的图像信息成为图像检索中至关重要的一点。本课题的研究内容主要有:(1)对图像检索相关技术进行分析和研究 万方数据硕士学位论文1绪论阅读图像检索相关技术方面的文献资料,了解国内外图像检索的研究现状和发展状况,重点分析图像的预处理技术和图像特征提取技术。(2)对基于颜色特征的图像检索技术进行研究并改进针对一般颜色特征检索方法中常用的全局颜色直方图特征描述方法无法体现图像颜色的空间分布情况的不足,研究如何对图像进行区域划分,使图像分块更为合理,加入空间分布特征,使颜色信息描述更加丰满,提高检索精度。(3)对基于形状特征的图像检索技术进行研究并改进在研究经典方法的基础上提出一种容易实现,对提高检索效率更为有效的形状特征提取方法用于图像检索。首先对图像预处理滤除次要信息,对经典Harris兴趣点提取方法改进,使提取的Harris兴趣点分布均匀,然后在兴趣点上提取形状特征,并在图像检索中应用。(4)提出一种基于HBCH和改进形状特征的图像检索方法在颜色和形状特征的研究基础上,鉴于单一特征检索往往会忽略一些图像的重要信息,检索结果具有片面性,考虑融合两种改进的图像特征,进行图像检索。(5)构建系统平台验证算法有效性在VC平台上构建系统平台,以实现(2)、(3)和(4)点中所研究的改进方法,与传统方法比较,验证改进算法的优越性。1.6论文组织结构根据研究内容,论文的组织结构如下面所示:第1章绪论。绪论部分主要介绍课题的研究背景,从而引出课题研究的意义,分别介绍了TBIR和CB/R的现状和发展情况,CB/R技术的主流性以及应用CBIR技术的主要领域和一些经典的CBIR系统。第2章CBIR基本架构及相关技术研究。这一章是本文的理论基础部分,首先给出了CBIR的基本框架图。在框架图的流程下,先介绍了图像的预处理技术,包括图像的灰度化、平滑和锐化,分析了各种预处理方法的优劣:然后分别介绍了CBIR中的一些关键技术,如:图像的底层视觉特征提取技术、相似度量方法和常用的一些图像检索算法的评价标准。第3章基于HBCH索引的图像检索方法。本章从人类在不同颜色空间中对颜色的不同认知感受出发,论述颜色空间的选取要求以及介绍颜色量化方法。对传统全局颜色直方图做出改进,提出一种无论从时间还是检索结果上都要优于传统方法的基于HBCH索引的图像检索方法。主要介绍了HBCH特征提取方法和HBCH索引的图像检索方法的实现以及对传统方法和本章方法的实验结果分析对比,验证本章算法的有 万方数据硕士学位论文1绪论效性。第4章基于HBCH和改进形状特征的综合图像检索。本章提出了一种基于均匀Harris兴趣点的Hu矩形状特征图像检索方法。首先阐述了关于兴趣点的理论知识,引入兴趣点来描述图像的形状信息,反映了图像的局部信息。在兴趣点基础上,进而对图像提取形状特征_Hu矩进行图像检索。最后将改进的颜色与形状特征进行加权综合,进行综合特征的图像检索。最后分析不同算法所得实验结果,得出不同算法之间的优劣性。第5章基于综合特征的图像检索系统的设计与实现。介绍了本文作者搭建系统的开发环境和配置要求,主要详细地说明了设计系统的理论框架,针对图像检索算法的功能实现所设计的系统操作界面布局以及界面上分布的每个子模块具体操作所实现的功能。总结与展望。对本文在基于HBCH索引的图像检索方法、基于均匀Harris兴趣点的Hu矩形状特征的图像检索方法和在两种检索方法基础上融合两种改进的图像特征的图像检索方法上所做的研究工作进行总结,提出研究中的不足并对未来发展进行了展望。 万方数据硕士学位论文2CBIR基本框架及相关技术研究2CBIR基本架构及相关技术研究本章将在CBIR的基础知识之上探讨一些与之相关技术,这些都是后续研究工作中的一些关键技术的理论基础。首先介绍CBIR中常见系统的基本框架,以及为了后续图像检索能获得更好检索结果而对图像库中图像进行的一系列前期准备工作所需的预处理技术。图像底层视觉特征的描述和提取是CBIR中的关键技术,其提取特征的好坏关系着图像检索的成败。特征提取后,进一步要对数据间的差异进行计算来定义不同图像的相似程度,这就需要用到相似度量方法,本章重点介绍了几种相似度量方法。而判断一个算法的优劣是衡量CBIR研究工作是否成功的一个重要指标,好的算法评价标准对图像检索有着举足轻重的作用。2.1CBIR基本架构基于Content的图像检索技术出现已久,形成了一定的固有模式。相比TBIR,其有着无可替代的优势,主要特点如下图2.1所示。图2.1CBIR的特点目前没有统一标准的基于内容的图像检索系统,典型的CBIR系统结构如图2。2所示【301。由图中可知,CBIR系统主要分为两个部分:一部分是图像特征数据库的建立,通过特征提取技术提取所选择的图像库中的每一幅图像的图像特征组建相应图像库的图像特征数据库;另一部分是图像间的特征相似匹配计算判断,对两幅图像的特征数据进行距离函数值的计算来判定图像间的相似程度。可以看到在进行图像检索前,第一个工作就是对图像进行预处理,主要是为了滤除影响研究内容中的主要信息的次要信息,提高研究效率。特征提取是图像检索技术中的关键,是对图像整体或局部分析的重要技术手段,可以客观 万方数据硕士学位论文2CBIR基本框架及相关技术研究地反映出图像的丰富信息,对图像检索的影响巨大。计算机通过特征提取算法即可自动地获取图像库中图像的特征数据,将这些数据整合到一起就可建立图像特征数据库,为后期检索提供数据信息,其提取出来特征矢量决定着检索结果的优劣。同时,好的相似匹配算法可以减少图像检索中的误匹配和漏匹配,提高检索精度。警一像№鲈⋯取惜相似————]——K■∑性度醐库吲溅理吲鞭嬲吲器夸量/—NL————一{L一2.2图像预处理技术图2-2CBIR系统结构理想的图片可以使图像检索事半功倍,因此对图片做一些前期的预处理,可以大大提高研究效率,这就涉及到图像的预处理技术。图像预处理技术是图像检索技术中的基础,是在对图像正式处理前做的一系列准备工作,其目的是为了过滤图像的次要信息,更好地把握主观信息,为后续图像的特征提取和相似性度量做准备。本课题在对实验结果分析的基础上主要采用的预处理方法有彩色图像的灰度化、图像平滑和图像锐化,下面将对这几种预处理方法一一介绍【311。2.2.1图像的灰度化本课题选用了Corel图像库,其中包含了恐龙、花卉、建筑物、巴士、大象等共1000幅彩色图像。后续的研究中一些实验是针对灰度图像的,而Corel图像库中的图像都是彩色图像,因此需要对图像库中的图像进行灰度化批量处理。彩色图像中的每个像素由红(R)色分量、绿(G)色分量、蓝(B)色分量组合而成,每个分量的取值范围为[0,255],这样一个像素点的变化范围为256x256x256(1600多万)。灰度图像是一种特殊的彩色图像,当R=G=B时,即实现了彩色图像的灰度化,一般常见的彩色图像灰度化处理方法有以下三种吲其中R、G、B是处理后的颜色分量值,尺7、G’、B’是处理前的颜色分量值。(1)加权平均法 万方数据硕士学位论文2CBIR基本框架及相关技术研究根据R、G、B三个分量的重要性和其它指标将其赋予不同的权值从而进行加权平均,即:R=G=B=WRR’+%G’+%B’(2-1)由人眼对颜色的敏感度和实验表明,当%=0.30,wo=0.59,%=0.11时,最贴近人类的视觉感受。即当R=G=B=0.30R7+0.59G’+O.1lB’,灰度化的图像最为理想。(2)平均值法对彩色图像的R、G、B亮度求平均值作为图像的灰度值,即:R=G=B=(F+G’+B7)/3(2-2)(3)最大值法比较三个R、G、B的分量值,找出值最大的一个作为灰度值,即:R=G=B=max(R’,G’,B’)(2—3)对比三种预处理方法,最大值法灰度化后图像亮度过高,平均值法效果柔和,加权平均值的处理效果最为合理,所以本课题实验中采用加权平均值对图像灰度化。图2.3为本文实验方法灰度化前后的对比图。2.2.2图像的平滑图2-3加权平均值灰度化前后对比图平滑的主要功能为消除寄生效应,例如在提取图像中主要目标之前去除图像中的一些琐碎的细节、曲线缝隙和桥接直线或曲线。而一个好的平滑方法能够在实现上面所述功能的基础上同时保留图像的边缘轮廓和线条。图像平滑方法主要有低通滤波器,邻域平均法及中值滤波器等等,分为空域法和频域法两大类[331。本文主要研究介绍这三种方法,从中选择最合适的平滑法。 万方数据硕士学位论文2CBIR基本框架及相关技术研究(1)邻域平均法空域法。用一个像素点的邻域范围内像素灰度的平均值作为该像素点的灰度值,以此消除尖锐突出的像素点。(2)中值滤波器空域法。将像素点邻域中所有像素点灰度值从小到大排列,取中间值最为该点灰度值。(3)低通滤波器频域法。低通滤波器滤除代表图像边缘、跳跃内容和颗粒噪声的高频部分,保留代表大面积背景区的低频部分,实现平滑处理。低通滤波法处理示意图如图2.4,其中/-/(u,v)是传递函数,是整个低通滤波器的设计关键,不同的传递函数平滑效果不同。图2.4低通滤波法处理示意图邻域平均法计算快速,但是算法简单,处理过程粗糙,使图像边缘模糊;中值滤波器无法处理平滑细节太多的图像;低通滤波器可以有效剪除高频噪音。综合考虑,本课题采用高斯低通滤波器来处理用于后期实验的图像库图像。图2.4为本文实验方法平滑处理前后的对比图。2.2.3图像的锐化图2.5低通滤波器平滑处理前后对比图锐化的概念与平滑截然相反,主要功能是增大图像内部的对比度,突出图像中的细枝末节,因此通过锐化处理后的图像的边缘信息变得更加明显,整个图像更为清晰。图像进过平滑处理后忽略了图像的细节、缝隙等信息,图像的 万方数据硕士学位论文2CBIR基本框架及相关技术研究边缘信息变得模糊,所以因而需要对图像进行锐化处理增强图像信息突出图像的边缘特征。平滑处理原理与积分相类似,而与此相反,锐化是通过空间微分实现的,其应用方法有很多,本章只对下面两种方法进行介绍【341。(1)梯度锐化法梯度锐化法属于微分锐化法,应用得比较广泛,它是基于一阶微分的图像锐化。但是梯度锐化法不能很好的突出图像特征,无法减弱图像边缘处的模糊程度。(2)拉普拉斯锐化法一种基于二阶微分的锐化处理方法,这种方法对图像的增强效果跟图像的边缘走向无关。实验证明拉普拉斯锐化法对边缘的锐化效果相当明显,相比其它方法无论在增强图像边缘特征还是减弱边缘的模糊程度,拉普拉斯锐化法都技高一筹,因此本文采用拉普拉斯锐化法对图像进行预处理。图2.5为本文实验方法锐化处理前后的对比图,由图可以看出拉普拉斯锐化处理后增强了图像的边缘特征,强化了后期图像检索中感兴趣的特征。图2-6拉普拉斯锐化法锐化处理前后对比图2.3图像底层视觉特征描述和提取图像特征提取技术是CBIR中一个关键技术,“牵一发而动全身”。好的特征提取技术提取的特征数据可以更好地表示图像内容还原图像属性更贴合人们对图像的分析理解,其提取特征的好坏直接关系到图像检索的最终结果显示。当然,人们在接触图像时在自己的脑海里会有对图像的一个大致概念,这就是对图像的一种针对具体图像内容的包含语义的理解。但是由于计算机和图像处理等相关技术发展还并不成熟,这种完全基于语义层面上的特征提取困难重重。因而图像处理的研究领域中关于图像特征的研究方法大多是关于颜色、纹理和 万方数据硕士学位论文2CBIR基本框架及相关技术研究形状三大底层视觉特征的,这些特征一直被广泛应用于表征图像信息。2.3.1颜色特征在CBIR中,颜色作为三大底层视觉特征之一,相较其它两种特征发展研究得最为成熟,使用得最为频繁。颜色对复杂背景图像相对健壮,不受图像大小、方向影响,在描述视觉信息中最为直接和简单。因而在许多应用领域,颜色深受研究人员的青睐。图像特征研究领域内颜色特征提取方法有许多,针对本文课题的研究,主要介绍比较常用的几种,下面将对其理论原理分别一一介绍。(1)颜色直方图(ColorHistogram)ColorHistogram的研究历史悠久,技术纯熟,最早可以追溯到1991年,Swain等人第一次提出了颜色直方图【35J的概念,并将之应用到图像的特征表示中。颜色直方图是以数学中的统计学为原理,其数据所体现的物理意义是图像中各种颜色的分布情况。因为其具有与生俱来的缩放、平移、旋转不变性,计算简便,提取简易,成为最常见的颜色特征描述方法。它的基本原理就是在特定的颜色空间里统计图像中每种颜色出现的频率,如图2.7所示:图2.7颜色直方图示意图图中横坐标表示256种颜色,纵坐标表示相应颜色的像素点出现的频率。对于给定的图像f(x,y)的颜色直方图定义如下:H={』i2l,吃,绣,⋯吃⋯吃,,)(2-4)绣是颜色值为c的像素点出现频率,其定义式如下:吃=丽1M瑚-a艺瑚t。苫胪C其,V它C钆(2-5)其中M×N为图像的尺寸大小,/;,为像素点厂(f,歹)的颜色值,C为图像所 万方数据硕士学位论文2CBIR基本框架及相关技术研究有颜色的颜色通道集合,c为集合C中的任意一种颜色值。然而“金无足赤,人无完人",颜色直方图作为一种还仍在继续发展的颜色特征表示方法,有着其独特的优势,必然还有一些不足需要改进。颜色直方图最大的缺点就是将对整幅图像的颜色统计值作为图像颜色的表征,这只能反映图像的全局信息,而往往忽略了图像像素点间的空间联系,颜色的描述中缺少了空间分布信息;图像颜色从本质理解上其实是一种连续分布的信息,由于计算机数据处理的需要,往往需要对数据量化,而对颜色的量化过程又因人而异,所以常常导致量化的结果无法准确反映出图像的真实颜色,出现量化误差;特征向量维数过高,数据量大,具体应用中的计算繁复,实时性不高。如果要提高检索的效率,必须改进算法。(2)颜色集(ColorSets)1995年,SMITH和CHANG在颜色直方图的基础上做出改进,提出用颜色集【36】代替颜色直方图作为图像的颜色特征,实现了在大规模图像库中对图像的快速查找。和(1)中所述的颜色直方图提取全局颜色特征不同,颜色集首先转化颜色空间,然后量化颜色空间,分成几个主颜色向量,最后将图像进行分割,划分成有限块bin,用划分好的主颜色向量中的颜色分量分别来表示分割好的图像子块bin。这样就可以将从而将图像的颜色索引集中的每个数据表示成二进制了。颜色集其实质目的是对图像的区域特征尽量使用长度较小的数据向量来描述,大大加快了检索速度,对大规模的图像集合具有重要意义。但是颜色集过分注重检索速度,忽略了检索精度,从而图像检索的准确性大大降低了。(3)颜色矩(ColorMoments)在SMITH和CHANG提出颜色集概念的同年,Stricker和Orengo也提出一种新的颜色特征提取方法——颜色矩【37】,相较于其他方法,该方法简单易行并且相对有效。这种方法其理论依据是数学学科中的矩思想,首创用矩表示颜色的分布情况,而通过反复研究发现相对高阶矩,其低阶矩涵盖的信息更多、更丰富。所以通常在采用颜色矩作为图像颜色特征的应用当中只选取图像的一阶矩、二阶中心矩和三阶中心矩,其物理意义分别是图像颜色的均值(mean)、方差(variance)和偏度(skewness)。这前三阶矩的数学表达式如下:一阶矩:二阶中心矩:巨=专姜p,g=‘万1荟N(所嘲2声(2-6)(2-7) 万方数据硕士学位论文2CBIR基本框架及相关技术研究三阶中心矩:s,2(专著N(岛一E)3)j1,(2—8)其中,^。——灰度为j的像素点在第i个颜色通道分量中的出现频率;N——灰度级数。对R、G、B三个颜色通道计算一阶矩、二阶中心矩和三阶中心矩,则一共得到9个颜色矩特征分量。颜色矩计算快捷简单,降低了颜色特征向量的维数,却也存在一些致命的短板:低阶矩分辨能力较弱。所以其检索效率相对较低,因此在一些实际应用中往往不是单一操作而需要综合其他特征一起使用。2.3.2纹理特征到目前为止纹理还没有统一的定义和描述,主要反映图像中一块区域内的所有像素灰度级的空间分布特性,具有平移不变性、层次性、尺度性和随机与确定二重性。纹理特征不同于其他特征,不依赖亮度和颜色,所以在图像检索技术中被广泛应用。常用的纹理分析方法大致可以分成四类,如图218所示:图2—8常用纹理分析方法分类示意图其中应用最广泛的纹理特征提取方法有灰度共生矩阵法和Tamura纹理特征表示方法。其中,Haralick等人主张利用像素见得方向和距离构建共生矩阵,从中提取有价值的统计特征如共生矩阵中的熵、相关性、惯量、能量以及文龙李能量等来描述纹理特征,这就是灰度共生矩阵法【381。而Tamura纹理特征表示方法是Tamura等人在对认知心理学和纹理的视觉感知反复研究后提出的利用粗糙度、方向度、对比度等六种特性来描述纹理属性的一种统计方法[39】。 万方数据硕士学位论文2CBIR基本框架及相关技术研究2.3.3形状特征形状特征是刻画物体本质的一种显著特征,含有一定的语义信息,将形状特征应用到检索中可以提高检索的效率和准确性。但是形状特征的提取要比纹理和颜色困难复杂许多,现在还缺乏严谨的数学模型描述人类感知到的形状,而图像处理技术中的分割技术还不健全,想要通过计算机自动分割图像从而提取图像的形状特征十分困难。最为理想的形状特征体现在当图像发生平移、缩放、旋转等变换时也不会有任何变化,也就是说图像的形状描述应当具有通用性。形状特征描述根据其不同的表达方式,主要分为基于边界和基于区域的两大类【401,如图2-9。图2-9常用形状描述方法示意图由图2-9可知,形状特征的描述符极其丰富,现主要介绍以下三种:(1)矩形度矩形度H21表示的是目标物体接近矩形的程度,取值范围为[0,1]。设如表示目标图像的面积,以是包围该图像的最小矩形的面积,则图像的矩形度R为:足:阜(2.9)‰(2)圆形度圆形度刻画了物体边界的复杂程度,它们在圆形边界时取最小值,值越大表示目标形状的复杂度越高,最常用的圆形度是目标物体的周长平方与其面积之比。设P为目标物体的周长,A代表物体的面积,则圆形度C为:D2rc2百(2-10) 万方数据硕士学位论文2CBIR基本框架及相关技术研究(3)Hu矩1962年美籍华人学者胡贵明(Hu)提出二维矩不变量理论,开始将矩应用与形状特征描述,是使用最普遍的描述方法之一【4l】。对于离散数字图像f(x,Y)的P+g阶矩为:MⅣm朋=∑∑x~Yf(x,y)(2-11)则图像f(x,Y)的P+g阶中心矩为:MN%-ZZ(x一;)p(y-一Y)f(x,y)(2—12)x=ly11其中x,ny为图像的区域重心坐标,定义为:;=嚣=舞p聊∑∑∥(x,y)歹=mol:簪竺(2-14)聊oo芝芝厂(训’驴等其帆尸TP+q“,p中2,3,⋯(2-15)≯4=(r13。+r/12)2+(r/03+rhl)2(2-16)珐=(7730一31712)(仇o+7/12)[(7730+7712)2—3(7703+7721)2】+(3r/z1.‰3)(‰3+仍1)[3(仍o+rh2)2一(‰3+7721)2]≯6=(r120—r/02)[(7730+r/12)2一(7703+7721)2]+4r/1l(r130+r/12)(7703+r/21) 万方数据硕士学位论文2CBIR基本框架及相关技术研究伤=(3r/2l-r/03)(%o+编2)[(%o+仍2)2-3(r/03+吼1)2】+(3r/12—7730)(%3+仍1)[3(%o+仍2)2-(r/03+仍1)2】Hu矩是以图像区域重心为原点描述图像的同灰度级像素点是如何分布的,没有信息冗余现象,具有绝对的独立性,和位置无关性,对平移、缩放、旋转不敏感。2.4图像检索中常用的相似度量方法图像检索的匹配方法分为完全匹配和相似性匹配两大类,其中当两幅图像的特征向量完全相同时为完全匹配成功,当特征间的距离小于某个预设的值时即为相似性匹配成功。本文主要研究的是相似性匹配技术。特征提取出来后,下一个需要解决的技术问题就是如何有效地度量图像间的相似性。是否符合人眼的视觉感受是衡量一个相似性度量方法优劣的标准。即两幅图像达到视觉上的相似标准时两者之间的距离较小,反之不符合人眼对图像相似的判断标准时两者之间的距离较大。目前图像领域内有许多相似度量方法【43】,常用于基于内容的图像检索的判定图像间相似度的方法只有以下几种。其中A、B分别表示的是两幅图的特征矢量,a,、包为对应的特征向量的第i个分量,N是特征向量的维数。(1)欧式距离(EuclideanDistance)广Ⅳ1=1D(A,B)--k∑l口f+6j122(2.17)Lf.J欧氏距离I删用于分量之间正交无关的特征向量,具有空间不变性。(2)直方图相交距离(HistogramIntersection)1991年Swain等人首次提出直方图相交方法,这种方法计算简易,能够抵抗背景对匹配的影响【451。每个量化通道中两幅图像的直方图有交集的像素数量就是直方图相交,直方图相交距离即是用直方图相交和两个直方图中的任何一个的所有像素数量之比来表示两幅图像之间的相似距离,其取值范围为[0,1],定义如下:ⅣN∑rain(ai,包)∑_,min(at,61)D(A,B)=』—可—一或D(A,B)=』—可—一(2-18)y61,ybi(3)余弦距离(CosineDistance) 万方数据硕士学位论文2CBIR基本框架及相关技术研究两个向量间方向的距离差异一般用余弦距离‘461表示,公式如下:么·B=ArB=lA·Bcos0(2-19)。(丘功=1-cos侈=1一网ArB(2—2。)其中,IA--(Ar彳)i,俐=(BrB)i。2.5图像检索算法的评价标准除了本章2.3节到2.5节中所述的CBIR相关技术,CBIR相关技术中还有一个极为关键并且是衡量整个算法优劣的关键技术,那就是图像检索算法的评价标准。优秀的评价标准需要做到能够客观地寻找出相同条件下的最优算法,这对推动CBIR技术的发展和改进有相当大的意义【471。从本质上来讲,CBIR就是信息的检索问题,所以信息检索中的查准率(Precision)和查全率(Recall)是目前应用到最多的评估指标[48】。查准率=塑絮器喾输霉卅的图像翦目查全率=塑器豁馨用公式表达为:查准率:P叫彳l驴訾=南(2-21)查蟀R刊BI舻訾=老(2-22)其中,a+b+c+d=Q;口+C=A:a+6=B:Q——整个图像数据库;A——相关图像的集合;B——检索出的图像集合;P、R的取值范围为[0,1】。图2.10表示a、b、C、d之间的关系。 万方数据硕士学位论文2CBIR基本框架及相关技术研究图2-10查全率和查准率示意图查准率表示系统排除无关图像的能力,体现了检索的准确性;查全率表示系统检索相关图像的能力,体现了检索的全面性。然而两者达到一定程度后互有影响,呈现出非线性反比关系。当查全率低时,查准率相对较高,无法两者兼顾,所以需要取一个相对平衡的点来满足检索要求。上述评价方法是用单值表示的性能指标,还有一种用图像表示的性能指标。如图2.11以查准率P为Y轴,查全率R为X轴,绘制一条曲线,这条曲线就叫做PVR曲线【49|。查准率0查全率图2·11PVR曲线图中PVR曲线即f(x,Y),E是由X、Y轴和PVR曲线围合的面积值,由公式(2.23)可求得,可知E的取值范围为[0,1]。E值越大则检索效果越好,反之值越小则效果越差,当E值达到1时,即为整个检索系统性能达到最佳。E=[f(x,y)dx(2-23)现在常见的图像检索算法的评价标准主要是以上几种,本课题主要是针对图像检索算法的准确性进行的研究,所以后续的实验研究都采用查准率作为算法验证的评价标准。 万方数据硕士学位论文2CBIR基本框架及相关技术研究2.6本章小结本章是整篇论文的理论基础部分,首先给出了CBIR的基本框架图,介绍了一些CBIR中涉及的重要技术。然后介绍了图像的预处理技术,例如图像的灰度化、平滑和锐化,针对不同预处理技术,对其优劣做了深入的分析。在CBIR的基本框架图的基础上,进一步对CBIR相关技术进行了一些重点介绍,比如针对描述图像内容的图像底层视觉特征的提取技术。另外还例举了几种图像检索中常用的相似度量方法和图像检索算法的评价标准。本章重点是介绍一些本文后续研究工作中需要用的一些重点理论基础,为深入研究打下了坚实的基础。 万方数据硕士学位论文3基于等面积分块颜色直方图索引的图像检索方法本章主要是对图像的颜色特征展开研究,提出了一种基于HBCH(theHomalographicBlockColorHistogram,等面积分块颜色直方图)索引的图像检索方法。首先介绍了颜色空间的选取及颜色量化方法。然后针对全局直方图描述图像的颜色分布时忽略了图像中颜色的空间分布特征,无法准确描述图像中的具体对象或物体的缺点,在对图像提取特征前采用等面积环形的均匀分块方法对图像分块从而引入图像的空间信息,提出了HBCH特征提取方法。最后详述了HBCH索引、相似度计算以及算法流程和实现,并将本章方法和传统方法的实验数据分析对比,通过实验验证本章方法的有效性。3.1颜色空间的选取及颜色量化方法3.1.1颜色空间的选取图像领域中存在许多人们已知和未知的颜色空间模型,建立在不同的颜色空间中的颜色直方图自然也不同,颜色空间的构建对图像颜色特征提取有着直观的影响【50】。构造一个理想的颜色空间需要满足图3—1中的三大要求。针对本文研究,作者主要研究RGB颜色空间和HSV颜色空间。图3-1颜色空间构建条件(1)RGB颜色空间RGB颜色空间模型为人们最熟知应用最广泛的一种模型,是数字图像文件保存的最原始的默认格式。RGB颜色空间面向CRT(CathodeRayTube)设备,用红(R)、绿(G)、蓝(B)三个颜色分量的组合表示颜色,其颜色空间立方体示意图如图3-2[”】,是建立在笛卡尔坐标上的。每种颜色分量图像用8位比特图像表示,则在屏幕上可以用RGB颜色空间模拟还原2瓢3=16,777,216种颜 万方数据硕士学位论文3基于等面积分块颜色直方图索引的图像检索方法色,分别可对应到图3.2中立方体内的每一个点上。例如蓝色对应RGB=(0,0,1),红色对应RGB=(1,O,0),绿色对应RGB=(0,1,0),则可知RGB取值范围为(R,G,B)e[0,1】[52】。BG图3-2RGB颜色空间立方体示意图因为最初采集的和最终显示的颜色信息都是RGB值,因此在图像处理中RGB颜色空间被广泛运用。但是它不能直观地表达图像的颜色信息,与人眼的感知差别很大,单从RGB值很难获知其所代表颜色的认知属性。因此在实际应用中往往先把RGB颜色空间转换到其他的颜色空间。(2)HSV颜色空间HSV颜色空间根据人眼色彩视觉特征用色调(H)、饱和度(S)和亮度(V)来描述图像颜色信息,符合人类视觉感知。图3.3是HSV颜色空间的示意图,其中色调(Hue)是光的颜色比如红、绿、橙、黄、青、蓝、紫等颜色,对应绕V轴的旋转角;饱和度(Saturation)指彩色的深浅程度,比如浅红,深蓝等,对应离开V轴的距离;亮度(Value)是人眼感受到的光的明暗程度,与物体发光程度相关,对应立体圆锥形的竖自轴。HSV颜色空间模型贴合人类的视觉感官,与人对颜色的感知最为相似,在计算机视觉研究领域应用十分广泛,而且从RGB颜色空间转换HSV空间简单方便【531。所以,本文选取HSV颜色空间进行图像处理。 万方数据硕士学位论文3基于等面积分块颜色直方图索引的图像检索方法青饱和度(Saturation)图3-3HSV颜色空间示意图给定图像的RGB值(R,G,B),RGB颜色空间中的值转换到HSV颜色空间的H、S、V值的计算公式如下:日:』盯驱G12万一盯B>Gs:1一≤;min(震,G,艿)矿、。。y=击附G删其中,(R,G,B)∈[0,1],盯=arccos(R—G)+(R—B)顽磊亍雨i霞面’述公式可知H∈【O,360],S∈[0,1],矿∈[O,1]。3.1.2颜色量化(3—1)(3-2)(3-3)由上一般一幅图像的颜色信息非常多,尤其是彩色图像,而高维数据特征会给计算带来极大的不便。所以需要根据人眼对颜色的感知情况对H、S、V三个分量进行不同程度的量化,降低数据维数‘541。色彩定义的范围不同,相应的H、S、V三个分量的量化情况也不一样。经过对颜色模型的研究和分析比较,本文按照人类对颜色感知标准将色调分为8份,饱和度分为3份,亮度分为3份。 万方数据硕士学位论文3基于等面积分块颜色直方图索引的图像检索方法量化后的色调、饱和度和亮度值分别日’、S7、y’。量化公式如下:H’=0,H∈[316,360]u[0,20]1,H∈[21,40】2,H∈[41,75】3,日∈[76,155](3-4)4,H∈[156,190]5,H∈[191,270]6,H∈[271,295】7,H∈[296,315】10,S∈[o,0.2】S7={1,S∈[0.2,0.7】(3-5)12,S∈【0.7,1]10,V∈[o,0.2】V’={1,V∈[0.2,0.7】(3-6)12,V∈【0.7,1】按照上面的分量量化级,将三个颜色分量合成一维特征。合成公式如下:K=HQQv+S'Qv+V’(3-7)其中,Q和Qv分别是S’和y’的量化级数,一般取Q=3,Qv=3。由此,式(3.7)可转化为:K=9H’+3S’+V7(3.8)即色调日’的权值为9,饱和度S’的权值为3,亮度y’的权值为1,K的取值范围为[0,71],这样图像颜色就被量化成72种颜色,有效地压缩了图像的颜色特征维数。3.2HBCH特征提取传统意义上的颜色直方图特征提取方法相对而言虽然快捷易行但是技术粗糙,只是简单地统计图像中的每种颜色相应像素点的出现次数,无法体现出颜色组成之间的空间分布,用于对一幅图像的整体粗略检索有一定的成效,却无法实现对图像的细致检索和图像中具体对象的检索,检索效果较差。由于图像特征提取中两幅空间位置完全不同但颜色属性统计特征相近的图像可能拥有相似的颜色直方图。为了避免这种情况,本文采用HBCH提取图像的颜色信息,弥补了传统颜色直方图缺乏空间位置信息的缺陷,增强了互补性。 万方数据硕士学位论文3基于等面积分块颜色直方图索引的图像检索方法3.2.1图像等面积环形分块一般采用的分块方法是将图像均匀地分成mxn块,忽略了图像的主体部分。而人们往往只对位于图像中心位置的主体部分感兴趣,并不在乎图像四周的背景区域【55。,71。为了突出图像的中间部分的关键性,本文选择了基于图像空间的固定划分方法,采用一种基于等面积的环形划分方法对图像进行分块处理。首先确定图像的物理中心点O,本文中所研究的图像都是经过大小归一化处理的,大小为256x256,所以可知O点坐标为(128,128)。如图3.4以点O(128,128)为基准等面积将图像分割成一个圆,N.1个圆环和一个剩余部分,则图像被分成N+1个分块。则圆的半径和圆环宽度为:足=256x256S。m/256十x.2J5刀6(S_1)5~L』v十lJ刀(Sel,2,3⋯,Ⅳ)(3-9)式(3.9)中,通过实验研究将N设定为3,即将图像分割成1个圆,2个圆环和1个剩余部分,共4块区域。实验证明等面积的环形划分方法比传统的均匀m×n分块方法更能形象地凸显图像的主体对象,削弱图像中的客体部分对整幅图像属性描述的影响。图3.4等面积的环形划分方法3.2.2图像HBCH特征提取早在文章的第二章的2.4.1小节的(1)部分,就详细介绍了颜色直方图的基本原理和具体实现公式。由此可以知道,颜色直方图其实就是对图像的颜色分布数据化显示方式。为了本文研究能得到更好的结果,采用图像的归一化颜色直方图,更有利于进一步的研究。对于给定的图像的归一化颜色直方图定义如下: 万方数据硕士学位论文3基于等面积分块颜色直方图索引的图像检索方法H(k)=gt/G(3.10)其中,l(_图像颜色值,取值范围为[0,71];&——颜色值为k的像素的个数;G_图像颜色值总数,由3.2.2小节可知数值为72。用式(3.10)计算出图像的每一个子块的颜色直方图作为该分块的颜色特征CF,。CF,={日(1),日(2),H(3)⋯日(七)⋯}(3—11)合并四个分块的颜色特征只得到一个融合了图像颜色空间位置信息的HBCH特征向量:CF=(昭,呸,q,CF.)(3.12)由式(3.12)可以知道,颜色特征向量CF包含了四个颜色特征CF,,其中每个颜色特征CF,含有72个数据,分别描述了图像的每个子块Block的颜色信息。HBCH在对图像提取颜色特征前先对图像有规划地划分区域,一定程度上地增加了图像颜色间的空间联系,所提取得颜色特征自然具备了空间性,而不单单只是对图像全局的颜色信息表示,一些容易忽略的区域颜色分布也引起了重视。这样的方法提取出来的特征对实验结果更为有利,使图像检索过程中特征匹配更为精准。3.3HBCH索引的图像检索方法实现3.3.1HBCH索引如前所述,在对图像库图像进行颜色信息提取的基础上,结合数据库聚集索引技术【58J生成图像库的索引。HBCH索引算法步骤如下:(1)采用3.3.1小节中提出的等面积的环形划分方法对图像库中的每幅图像进行分块。(2)计算图像上的每个子块的归一化分块颜色直方图,作为图像的局部特征数据,合并分块颜色直方图构造图像的HBCH特征向量CF。(3)将图像库中每一幅图像局部特征数据按照图像的物理存储路径和图名进行物理排序。(4)生成如表3.1中所示的聚集HBCH索引,即一幅图像的所有局部特征数据位于该图像的物理存储路径和图像的同一行上。 万方数据硕士学位论文3基于等面积分块颜色直方图索引的图像检索方法表3-1聚集索引格式建立索引后,进行图像检索时只需计算出查询图像的特征数据,然后从HBCH索引文件中读取待查询的图像库中的图像存储路径,图名和特征数据进行相似度对比。而不需在进行图像检索时再对图像库中的每一幅图像进行特征提取,大大提高了检索的速度。3.3.2HBCH特征相似度计算提取出图像的HBCH特征并建立特征索引后,检索技术的关键就是查询图像和待查询图像库中的图像相似性的确定。本文采用欧氏距离作为相似测量标准,计算查询图像Q和待查询图像库中图像L的HBCH特征的相似度。当欧氏距离D小于某个较小阈值时,则认为图像Q和图像L相似,否则认为两幅图像不相似。由前文可知,本文提出的颜色特征矢量为4维,设查询图像Q的HBCH特征矢量为CF’=(啷:c足,CF3',CF?),待查询图像库中图像L的HBCH特征矢量为CF=(CF,,cE,CE,呱)。对图像的不同子块分别赋予不同的权值wl,由用户根据关键图中所要检索的图像信息分布情况制定权值,相应地,为了突出图像中心部分,适当加大中心圆的权值,并规定所有权值总和为1,则两幅图像的HBCH特征相似度记为:臣■————■Dc(Q,L)=./≥:w,(CF’一cF)2(3—13)V百从索引文件中读取数据与查询图像对比,当欧氏距离Dc(Q,L)<口时,停止从索引文件读取数据对比,此处口是阈值参数,可通过实验获取。即当检索到相似度最大的图像时立即停止检索,不再对图像库中剩下的图像进行检索,这就极大地缩短了检索的时间,可以快速地检索到用户所需的图像。将已经与查询图像对比过的图像信息如图像路径、图名和欧氏距离,按HBCH特征的相似性由大Nd,的顺序排列,即Dc(Q,三)值越大,该幅图像越靠后排列。 万方数据硕士学位论文3基于等面积分块颜色直方图索引的图像检索方法3.3.3算法流程与实现图像库,图像等面积环形分块士提取子块颜色直方图0合成图像的船CH特征向量CF士聚集HBCH索引士生成耶CH索引文件索弓&件图3-5基于HBCH索引的图像检索算法流程图基于HBCH索引的图像检索算法涉及了颜色空间的选择、颜色量化、图像等面积环形分块、图像HBCH特征提取和建立HBCH索引等几个关键技术,具体算法流程如图3.5所示。基于HBCH索引的图像检索算法实现步骤如下:(1)对所有图像进行预处理,对图像库中的每幅图像用等面积的环形划分方法将图像分成4个子块,计算图像上的每个子块的归一化分块颜色直方图,合并每个子块的归一化分块颜色直方图构造图像的HBCH特征向量CF; 万方数据硕士学位论文3基于等面积分块颜色直方图索引的图像检索方法(2)将图像库中每一幅图像的物理存储路径、图名和HBCH特征向量CF进行物理排序生成聚集HBCH索引文件;(3)用户从图像库中选择一张图片作为查询图像,选择图像库路径和HBCH索引检索方式并根据图像内容属性设置好特征向量中每个分量的权值;(4)同样用步骤(1)中的方法对查询图像提取HBCH特征向量CF’;(5)然后从HBCH索引文件中读取图像库中图像的HBCH向量CF数据,对CF和CF’特征向量中的每个分量数据设置权值,计算两幅图像HBCH特征的欧氏距离pc(Q,L);(6)当Dc(Q,三)<口时,则停止检索,将已经计算的图像库中的图像按相似度大小排列返回给用户,检索结束,否则就返回继续比对直到找到相似度符合要求的图像。3.4实验结果及分析本文实验中选取Corel图像库中恐龙、花卉、建筑物、巴士、大象等共1000幅图像作为测试库进行实验。查询图像直接从图像库中选取,每次查询将排列在前面的前50幅图像作为检索结果。由第二章2.6节中的公式(2.21)可得传统的全局颜色直方图和本章所提HBCH索引特征方法的查准率。实验对比数据如表3.2所示。表3-2全局颜色直方图和HBCH索引的检索性能比较由表3.2可以看出,传统方法的检索时间是本章所提出的基于HBCH索引图像检索方法的近5倍。基于HBCH索引的图像检索方法在降低检索时间的基础上检索精度也有很大提高,是一种效率更高的图像检索方法,有效地缩短了检索时间,实现快速图像检索。 万方数据硕士学位论文3基于等面积分块颜色直方图索引的图像检索方法教室址年青兰疆妊证2■●t●万巷————·盒■蠢皂I方■■予旧a111,’∞鼍●抬哩万巷蜂哥■r懦煺^静城弓鞍肆芷矗t的t色与曙将嶂怔啦抗●啻:::!=:::::::图3-6基于全局颜色直方图检索结果图3.7基于HBCH索引的图像捡索结果以图像库中有代表性的花卉类图像为例,分别用全局颜色直方图和本文所改进的HBCH索引对“红花”进行检索,结果如图3-6和图3—7。图3-6中,全局颜色直方图检索结果里可以很快辨别出第4、6、7、9、15、16和第17幅图明显与查询图像不相关,其中第3、10和12幅图虽然也是红花, 万方数据硕士学位论文3基于等面积分块颜色直方图索引的图像检索方法但是在红花数量、方向角度上明显与查询图像并不相符。返回的前20幅图的查准率只有0.65,检索结果误差较大,效果不理想。而图3—7的基于HBCH索引的图像检索结果中,图3-6中第2、3、12幅图像分别位于图3—7中第7、18、17位上,并且没有图3-6中的第4、6、7、9、16和第17幅图。图3—7排列的图像顺序更符合人们对查询图像相关性程度的直观判断,计算这前20图像的查准率为0.95,检索效果明显提高,实验证明,无论在精度还是时间上基于HBCH索引的图像检索方法都要明显优于传统基于全局颜色直方图的方法。3.5本章小结颜色特征是基于内容的图像检索中应用的最多的图像特征之一,本章从人眼视觉感知特性出发,考虑图像的局部特性对整幅图像的影响,针对传统的全局颜色直方图图像检索方法片面考虑图像的整体颜色分布忽略细节的缺陷进行改进,提出了一种基于HBCH索引的图像检索方法。首先将图像库中的每幅图像按照等面积的环形划分方法分块处理,计算出每个图像子块Block的颜色直方图,以此作为图像区域的特征,从而体现出图像颜色间的空间联系,降低图像颜色特征向量的维数减少图像匹配时的数据量,为特征相似度计算精简了时间。然后用户可以根据视觉感受自己定义每一个子块的权重,对感兴趣的子块区域适当扩大权重比例,这样就突出了图像中的主体部分,避免了次要信息对图像对比的干扰。最后利用数据库聚集索引技术将每个子块颜色直方图按图像库物理存储地址和图名进行物理排序生成索引文件用于图像检索,而不必每次检索都对图像库中的每一幅图像进行特征提取。当用户提交查询图像时,只需从索引文件中读取特征数据与查询图像的图像特征比对,求出欧氏距离,当欧氏距离小于设定的阈值即停止比对。实验证结果表明,本文方法具有较好的检索效果,缩短了检索时间,实现了快速检索。但是颜色特征只能单一描述图像的部分属性,在描述特征上不够全面。因此,可以结合形状特征综合描述图像,得到检索精度更高的检索效果,第五章将对此展开研究。 万方数据硕士学位论文4基于HBCH和改进形状特征的图像检索方法本章提出一种基于均匀Harris兴趣点的Hu矩形状特征的图像检索方法,充分体现了图像的局部信息,也解决了图像形状特征提取复杂的难题。然而单靠颜色特征或是形状特征进行图像检索,往往并不能准确快速地检索出所想要查询的信息,无法满足人们的检索需要,因此本文综合第3章HBCH索引特征和均匀Harris兴趣点的Hu矩形状特征,研究了一种基于综合特征的图像检索方法,在4.7节中将会通过实验对这本文所提出的三种算法和传统全局颜色直方图算法进行分析比较。4.1均匀Harris兴趣点的Hu矩形状特征提取方法4.1.1兴趣点介绍CBIR技术的传统方法是提取图像的底层视觉特征用一组特征矢量表示,而通常特征提取是基于图像的全局特征进行的,数据繁多,耗时不精确。从而局部特征注重细节内容、数据精简、具有独特性的优点自然就突显出来,一般的局部特征提取技术常将图像分割或是提取兴趣点处理。兴趣点(InterestPoints)有多种叫法,有时也称关键点(KeyPoints)或显著点(SalientPoints),是图像中含有重要信息的点,符合人类视觉特征。兴趣点(InterestPoints)数据量小、信息含量高、计算简单,可以在完整描述图像重要属性的基础上,同时有效地降低特征向量的维数避免维数灾难,快速有效,对进一步对图像检索打下了厚实的基础。有的文献里将灰度图像中在X轴和Y轴上灰度级都有很大跨越的点定义为兴趣点,也就是通常所说的角点(ComerPoints)岭91,本文研究的兴趣点就是传统意义上的角点,对兴趣点的研究即是对角点的研究。兴趣点是图像非常重要的局部特征点,并且一幅图像的兴趣点总数只占整幅图像像素点总数大约0.05%,使实时图像处理的实现不再只是一种设想,有效地降低了图像特征的数据量。随着图像的内容越来越丰富,图像的一些局部细节信息也成为人们关注的重点。而兴趣点是其中典型的局部信息特征点,被广泛应用到各种图像相关的研究领域中,如图4.1。有效地提取图像的兴趣点,对后续图像检索的研究有着至关重要的作用。 万方数据硕士学位论文4基于HBCH和改进形状特征的图像检索方法图4-1兴趣点应用领域4.1.2基于经典Harris算子的兴趣点提取方法1988年,ChrisHarris和MikeStephens对Moravec算子研究改进提出Harris算子,用于角点检测【601。Harris算子是目前使用较为广泛的检测算法之一,计算快速、精度较高。Harris角点检测算法的基本原理是通过对灰度图像中局部区域点亮度变化的观察来检测角点的。主要是将图像中的某一点沿着从该点为中心的任意方向移动进行一个微小距离,如果引起了较大的灰度变化,则判定该点为HaIris算子检测到的角点,也就是本文所认定的兴趣点。Harris检测算子涉及图像亮度的自相关矩阵,是一种基于梯度的检测方法,其所需的自相关矩阵计算公式如下:M:P咄:∥∥。f£L'I(4-1)l‘‘』;fR=Det(M)一kTrace2(M)(4—2)其中,M——自相关矩阵;‘——x方向上的梯度;‘——舫向上的梯度:w:P一(u2+v2)/2a2——高斯模板函数;Q——函数的卷积运算;R——图像的响应函数;Det(M)=五五——矩阵M的迹;乃口ce(M)——矩阵M的行列式;七——默认常数,通常取值为0.04—0.06; 万方数据硕士学位论文4基于HBCH和改进形状特征的图像检索方法基于经典Harris算子的兴趣点提取方法流程如图4.2所示,其中设定兴趣点的检测阈值T=o.015rm麟,T是当图像中兴趣点取局部极大值时的Harris响应函数R值。经典Harris兴趣点检测方法的具体实验内容【6lJ如下。(1)读取图像,设定丁值,以图像中的任一点f(x,Y)为中心创建一个W×w(本文选用5×5)大小的窗口,从图像的左上角到图像的右下角进行一次遍历检测;(2)当5×5窗口沿任意方向移动一个微小的距离,引起窗口内像素点的亮度发生巨大的变化,那么就认定此点为兴趣点,反之,如果没有发生剧烈变化,则视该点为非兴趣点,此点所在5×5区域则为平坦区。图4-2基于经典Harris算子的兴趣点提取算法流程图基于经典Harris算子的兴趣点提取方法实现步骤如下:(1)用户提交待处理图像,读取图像,设置阈值T;(2)根据公式(4.1)对图像中的每个像素点逐个计算其自相关矩阵M, 万方数据硕士学位论文4基于HBCH和改进形状特征的图像检索方法再根据公式(4.2)和M(x,y)值计算其相应的响应函数R(x,y);(3)判断像素点的R(x,y)值是否大于所设定的阈值T,如果大于阈值T,则继续判断该点是否是局部最大值,如果是则表示这个点就是所需要的兴趣点,即提取该点作为兴趣点,否则就返回判断下一个像素点是否所需要的兴趣点;(4)判断图像的所有像素点是否计算完毕,计算完毕,则整个兴趣点提取工作完成,否则就返回计算下一个像素点。4.1.3基于均匀Harris算子的兴趣点提取方法由前文可知,Harris兴趣点就是响应函数只取得局部最大值时的像素点,兴趣点提取算法中,设置阈值丁对整个兴趣点的提取有至关重要的作用。当响应函数R值大于等于阈值丁时,则视此点为兴趣点,反之则为非兴趣点。然而一般的阈值丁的设定不确定性大,必须经过多次实验、分析才能选择合适的阈值r,提取合适的兴趣点。总之而言,阈值丁设定较大的值,则能提取的兴趣点偏少,且相当集中,当阈值丁偏小时,则可以取得相对较多的兴趣点,兴趣点分布均匀却出现聚簇现象,没有反映出图像中物体的轮廓,提取的兴趣点并不理想。因此提出一种改进的Harris兴趣点提取算法——基于均匀Harris算子的兴趣点提取方法,保证提取的兴趣点均匀并且不会出现聚簇现象,其算法流程如图4.3。基于均匀Harris算子的兴趣点提取方法实现步骤如下:(1)用经典Harris算子提取图像的兴趣点;(2)采用3×3模块对图像均匀分块,统计每一块图像子块内的兴趣点数并计算整幅图像的兴趣点总数Sum,将子块内的兴趣点按响应函数R值从大到小的顺序排列好;(3)用聚集点剔除方法解决兴趣点聚簇现象的问题,子块内的兴趣点数量少于(1/9)水Sum,则保留图像子块中所有兴趣点,反之则只保留响应函数R值较大的兴趣点。从而可以提取分布均匀的兴趣点,有效地避免了聚簇现象。(4)分析所提取的所有兴趣点是否符合用户要求,若没有达到理想效果,则返回重新设定新的HalTiS算子参数,如果丰富,则完成基于均匀Harris算子的兴趣点提取的全部工作。 万方数据硕士学位论文4基于HBCH和改进形状特征的图像检索方法图4—3基于均匀Harris算子的兴趣点提取算法流程图39 万方数据硕士学位论文4基于HBCH和改进形状特征的图像检索方法4.1.4基于均匀Hart'is兴趣点的Hu矩形状特征提取方法(1)兴趣点等面积环形划分采用均匀Harris检测算子提取兴趣点出来后,需要进一步对兴趣点的形状属性进行描述。为了体现特征的空间属性,本文按照3.3.1节中提到的等面积环形划分方法将提取到的兴趣点分成四部分,划分示意图如图4.4。图4-4兴趣点等面积环形划分示意图图像大小为256×256,将兴趣点用集合,={(x,y)l≤x≤256;1≤少≤256}表示,其中划分的圆的半径和圆环宽度大小郎恐、恐可由3.3.1小节中的公式(3.9)求出。则每个部分的兴趣点集合分别为:厶=妣y)lo≤√(z一128)2+(y一128)2
此文档下载收益归作者所有