基于内容的视频分析与检索

基于内容的视频分析与检索

ID:14087101

大小:31.00 KB

页数:6页

时间:2018-07-25

基于内容的视频分析与检索_第1页
基于内容的视频分析与检索_第2页
基于内容的视频分析与检索_第3页
基于内容的视频分析与检索_第4页
基于内容的视频分析与检索_第5页
资源描述:

《基于内容的视频分析与检索》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、摘要文章简要介绍了从基于内容的视频分析与检索问题的提出到所涉及的关键技术以及目前研究状况,并简要介绍了现阶段在这方面的研究热点及以后要做的工作。一、问题的提出:互联网的出现给人类带来了很大的便利,特别是实现资源共享之后的互联网,但面对这浩如烟海的资源到底哪些是对自己有利用价值的呢?而90年代以来,多媒体技术和网络技术的突飞猛进,人们正快速的进入一个信息化社会。现代技术已能运用各种手段采集和生产大量各种类型的多媒体信息数据,出现了数字图书馆、数字博物馆、数字电影、可视电话、交互电视、会议电视、点播视频服务、远程教育以及远程医疗等多种新的服务形式和信息交流手段

2、,在众多的多媒体信息中最大也是最主要的一种就是视频信息,人类接受的信息约有70%来自视觉,视频所携带的信息量远远大于语音和数据。在视频信息高度膨胀的今天,随之而来的问题就是对海量视频信息的高效检索和浏览,即人们如何快速有效地查看大量的视频信息,并从中找出自己感兴趣的内容。传统的视频信息检索方案是使用文字标示符进行检索,具体到对视频帧的查询是借助对帧图像的编号和注释来进行的,首先给帧图像加上一个对其描述的文字或数字注释,然后在检索时对注释进行检索,这样一来对帧图像的查询就变成了基于注释的查询。这种方法虽然简单,但不能完全满足对视频数据检索的需要,首先视频数据

3、量很大,用手工方式添加注释工作量很大,而且效率很低;其次视频内容丰富很难用文字标签完全表达;再次文字描述是一种特定的抽象,特定的标签只适合特定的查询;最后文字标签是靠观察者加上去的,因此受主观因素的影响,不同的观察者可能有不同的描述[1]。从而需要一种客观全面的视频自动检索方法,基于内容的视频检索(Content-BasedVideoRetrieval,CBVR)应运而生。它根据视频的内容及上下文关系,对大规模视频数据库中的视频数据进行检索。提供这样一种算法:在没有人工参与的情况下,自动提取并描述视频的特征和内容。区别于传统的基于关键字的检索手段。融合了图

4、像理解、模式识别、计算机视觉等技术。近年来随着多媒体信息在娱乐、商业、生产、医学、安全、国防、军事等领域的大量应用,基于内容的视频检索技术己经成为近年来国内外研究的热点问题研究视频数据的高效分类、处理和索引技术,建立和完善视频信息的快速浏览检索机制,开发功能强大、使用便捷的视频信息浏览检索系统,既具有极大的理论价值,也具有巨大的应用潜力。二、解决方案:视频标注:视频标注是通过人工的方式将某一段视频进行主观的属性标注,然后以文本的方法进行检索。视频标注技术己相当成熟,但有其固有的不足,第一,要人工手动完成,工作量极大,且效率很低。第二,某些视频和感知特征很难

5、用文字来描述。第三,主观性很强,没有统一的标准,不同的人对同一段视频有不同的理解,必然导致不同的标注结果。视频摘要:视频摘要以自动或半自动的方式,从原视频中提取有意义的部分,将它们合并而成的紧凑的、能充分表现视频语义内容的视频概要。视频摘要技术也有一定的发展,同时给基于内容的视频检索提供了思路,但与真正的基于内容的视频检索有一定的距离。基于非压缩域的视频内容检索:基于非压缩域的视频内容检索是以视频的低层特征为基础进行分析,特征提取等,最后以视频的本质特征为检索依据,完全实现检索的自动化。基于非压缩域的视频内容检索己有相当的研究成果,但由于其所有算法均要在完

6、全解压的基础上进行,而视频数据不但数据量很大,而且运算量也很大,所以在具体实现时并不理想。基于压缩域的视频内容检索:基于压缩域的视频内容检索是在不完全解压或不解压的前提下以视频流的低层特征为基础进行分析、特征提取等,最后以视频的本质特征为检索依据,完全实现检索的自动化。由于基于压缩域的视频内容检索在没有解压或没有完全解压的前提下进行,所以其优点是:第一,大大减小了数据量,第二,减少了数据运算量,从而大大提高了系统的效率。三、国外研究现状:1、QBIC是IBM研究中心开发的基于内容的检索系统,它是第一个功能齐全的视频数据库系统,也是基于内容检索系统的典型代表

7、,对视频数据库发展有较远的影响。QBIC系统支持示例查询和用户草图查询,抽取颜色、纹理、形状特征、以及镜头和目标运动等信息,并采用R-tree作为高维索引结构,进而结合关键字对大型图像和视频数据库进行检索。2、Informedia数字视频库工程是卡耐基梅隆大学(CMU)关于数字视频媒体的处理与管理的一个重大项目,是较为完整的基于内容视频分析原型系统的先驱。该系统率先将数字音频处理技术和文本处理技术运用到基于内容视频分析中,通过语音识别和文字识别获取视频语义、辅助视频分段、抽取有意义的视频片段生成视频摘要,支持自动的全方位的视频信息查询,以支撑基于内容的视频

8、浏览、检索和服务。3、videoQ是一套全自动的面向对象的基于内容

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。