欢迎来到天天文库
浏览记录
ID:33603644
大小:4.81 MB
页数:61页
时间:2019-02-27
《图像检索中的相关反馈与自动标注研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第1章绪论基于示例的图像检索是2000年以前研究较多的领域之一(photosi砂。在许多应用环境下,QBE有着不可替代的作用。例如,在医学图像领域,人们往往需要根据病人的透视图像来进行诊断(C10ugh.Peta1,2005)。这时候,利用基于示例的图像检索可以找出类似的图像与相对应的诊断信息供医生参考。此外,指纹鉴别、人脸识别等等也是基于示例的图像检索得到广泛应用的例子。在QBE系统中,用户提交一幅实际的示例图像或者手工绘制的草图,系统提取该图像的颜色、纹理、形状等信息,利用得到的高维特征向量在数据库中进行查询。但是如何获取能够准确反映
2、用户查询意图的示例图像或草图在许多情况下并不容易解决,所以检索的结果往往不能达到用户的需求。与基于关键词的图像检索相比,基于示例的图像检索更加直观,这是由于图像本身是一种视觉媒体,许多信息难以用文本表达,而图像本身的视觉内容则可以描述相当复杂的信息。但是相对来说,基于示例的图像检索系统在用户交互的友好性上远不如基于标注的图像检索系统。此外,由于视觉特征向量一般维数很高,所以QBE系统对资源开销很大。基于示例的图像检索系统涉及到许多方面,主要包括图像的表示方式及其计算(即特征的提取和存储)、相似性度量(Clarkson.K,2005)、高维
3、索引、查询方式、用户界面等等。其中许多闯题,如高维索引、查询方式,都是非常困难、需要更多的研究课题(ChristianBohm,2001)。图像检索系统中最突出的问题就是底层特征和高层语义之间的“语义鸿沟"。“语义鸿沟”问题是制约图像检索系统检索精度的重要因素。QBE系统一般通过提取纹理、颜色、形状、频域谱特征等低层特征,然后根据不同的相似度度量准则在特征层面上傲一次相似度匹配.最后输出检索结果。然而用户的搜索意图往往是图像内容反映的高层的语义概念,如“日出"、“街道”、“海滩"等等。然而由于当前图像理解技术和认知理解水平约局限,提取的图
4、像低层特征并不能一定很好地表达用户的查询语义概念,所以检索的结果往往不能很好地满足用户的查询需求。这也就是图像检索系统的低层特征和高层语义之间的“语义鸿沟"问题。从目前的研究来看,虽然学者们提出了许多种方法,但是该问题并没有得到很好的解决。本文讨论的相关反馈和自动标注都是为了解决这个问题。其次,如前文所述,图像本身数据量很大,不能直接索引和搜索。一般是提取有效的特征,数据量大为降低,简化了后续的处理复杂度。但是,这些特2第l章绪论征往往表示为具有很高维的特征向量,这样图像检索就转化成了高维向量空间的搜索。当图像的数量快速增长时,如何快速、
5、准确地搜索高维空间是一个非常困难的问题。在数据库领域,高维矢量空间索引也是目前非常有挑战性的一个研究方向。所以,QBE系统难以扩充到大型图像库(如上百万或上亿图像)上。尽管仍然存在诸如以上的若干问题,从90年代初期到现在,关于图像检索的研究取得了相当大的进展,人们设计出了许多算法,并且研究和开发出来多种系统。这些研究同时也促进了计算机视觉、图像理解、机器学习等方向的发展。QBIC(Niblackw.etal,1993)是最早也是最著名的一个系统。该系统使用色彩,纹理,形状特征检索或由用户指定需要特别检索的某一类特征。这个系统是早期使用特征
6、进行图像检索的最著名的一个系统。其优点是采用了多种检索策略来进行检索相似图像,如可以采用特征、草图和用户指定感兴趣的特征等多种方式进行检索;缺点是需要用户参与较多,缺乏语义提取能力。MARS(Mehrotraetal,1997)是最早使用相关反馈技术进行检索的系统。该系统使用布尔运算和相关反馈技术,从用户给出的范例中查询;或是从预先设定的特征集合中选择感兴趣特征进行检索,如从色彩面板中选择特定的色彩或是从现有模式中选择特定的纹理等。PicHunter(Cox,2000)是另_类使用相关反馈技术的代表系统。该系统采用比较判断和概率模型的反馈
7、技术,并根据贝叶斯法则进行检索。该系统在相关反馈的研究上比经典的反馈模型的研究更具特色。NETRA(MaW.一YandManjunathB.S,1999)双系统是由两位主要研究人员发展的№tral和Netra2。这两个系统最大的不同是采用了不同的图像分割方法:Netral中采用的是“edgeflow”算法,Netra2中发展出JSEG算法。该系统最大的特色也在于其优秀的分割算法上。通过分割算法找出同种性质的区域,检索时由用户指定“感兴趣”的区域及色彩,纹理等特征进行检索。Bl。bworld(C.Chadetal,2002)系统采用图像分割
8、方法,将图像分成一个个“原子"区域,并由用户指定“感兴趣"的原子区域及其色彩、纹理、形状等特征的重要性,并将原子区域组合成逻辑与、或关系的对象概念进行检索。SIMPLICITY(JiaLian
此文档下载收益归作者所有