欢迎来到天天文库
浏览记录
ID:29472806
大小:406.04 KB
页数:39页
时间:2018-12-20
《基于内容的视觉信息检索(译文)》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、基于内容的视觉信息检索OgeMarques,BorkoFurhtFloridaAtlanticUniversity,USA本章主要对视觉信息检索(VisualInformationRetrieval,简写为VIR)系统特别是基于内容的视觉信息检索(Content-BasedVisualInformationRetrieval,简写为CBVIR)系统领域作了一个综述。本章阐述了该领域的一些主要概念以及系统设计时所面临的主要问题,并回顾评价了当前已有的一些系统原型以及商业上的解决方案,同时指出了该领域中比较有前途的研究方向。绪论近年来,数字化格式的视听信息量成指
2、数级增长,每天都会有成G字节级的新的图像、声音和视频产生和存储,这些构成了一个巨大的、分布式的、未组织的多媒体信息库,其中的大部分信息可以通过互联网访问到。多媒体信息的数字化、压缩和存储已经变得很普及、很简单,而且成本也大大降低了,这些都可以通过现存的大量的硬件和软件来完成,但是如果以后要对这些信息进行高效率的检索则需要进行大量的额外工作。对多媒体库中多媒体数据的检索主要有三种方法:1、自由浏览(Freebrowsing):用户顺序浏览图像、声音和视频文件集,当发现所想要的信息时便停止浏览。2、基于文本的检索(Text-basedretrieval):在编目
3、阶段(cataloguingstage)给视听文件加上文本信息(元数据),在检索阶段,这些附加的文本信息被用来引导常规的基于文本的搜索引擎查找所需要的数据。3、基于内容的检索(Content-basedretrieval):用户搜索多媒体库中有关图像、声音或者视频片断的实际内容的信息。基于内容的搜索引擎将这些信息按照某种方式进行转换以便对数据库进行查询,检索出能尽量满足用户要求的结果。前两种方法都有严重的局限性和可扩展性问题。自由浏览只适用于临时用户使用,而不适用于那些经常要获取具体的多媒体信息以进行专业应用的用户。这是一个冗长、效率低下而且耗时的过程,对大
4、型的数据库而言,这是完全不实用的。基于文本的检索在编目阶段存在着两个重大的问题:a)需要花费相当多的时间和精力手工对每一幅独立的图像或者视频片断进行标注;b)对内容进行标注时由于人的主观性而带来了不精确性。这两个问题随着多媒体信息的搜集量的增大而更加严重,很可能会使得后期的检索出现错误。基于文本的检索需要前期对多媒体数据进行标注,这样导致它的效率低下且具有很大的局限性,为了解决这些问题,来自于图像处理和计算机视觉方向的研究人员开始研究更可行的多媒体信息(特别是图像和视频片断)检索方法——基于内容的检索方法,即图像和视频将根据它们的视觉内容(如:颜色、纹理、对
5、象的形状和运动,等等)建立索引,而不是手工用关键字进行标注。基于内容的视觉信息检索(CBVIR)的研究始于上个世纪九十年代早期,而且很有可能在二十一世纪的最初十年里持续下去。目前,许多大学和大公司的研究小组都在这个领域积极地进行研究,许多系统原型和商业产品也已经研制成功,但是目前的解决方案与视觉信息检索的最终目标,即使用户以快速、高效、语义上有意义的(semanticallymeaningful)、友好的且位置相对独立(location-independent)的方式从海量的视觉信息中检索出图像或者视频片断,仍有很大的差距。本章下面的内容组织如下:在第二节我
6、们将回顾CBVIR系统的基本原理;第三节将讨论设计一个CBVIR系统的主要问题;第四节概述现存的(包括商业性的和研究性的在内)一些CBVIR系统;第五节叙述在这一领域出现的的一些open研究问题(openresearchproblems);第六节描述了作者们开发的一个CBVIR系统——MUSE的主要特征;最后,第七节是对本章的总结评论。CBVIR系统基本原理预备知识视觉信息检索(VIR)是计算机科学与工程学科中一个相对比较新的研究领域。与传统的信息检索类似,VIR系统的主要目标是检索出所有的与用户的查询相关的图像(或图像序列),同时在检索的结果中应尽可能的去
7、掉不相关的图像。对信息的检索与对数据的检索的着重点恰恰相反。视觉信息检索系统必须能够解释文档(图像)的内容并将它们按照与用户查询的相关程度进行排列。这个解释过程包括从文档(图像)里抽取(语义)信息并用这些信息与用户要求进行匹配。视觉信息检索研究的发展得到了多个研究领域的支持(如图1所示),尤其是:基于文本的信息检索,图像处理和计算机视觉,模式识别,多媒体数据库组织,多维索引(multidimensionalindexing),psychologicalmodelingofuserbehavior,人机交互,等等。图1视觉信息检索结合了许多研究方向VIR系统根
8、据用于查询检索图像或视频文件的属性的不同可以大体上可
此文档下载收益归作者所有