基于内容的视频信息检索模型及方法综述

基于内容的视频信息检索模型及方法综述

ID:22039283

大小:169.34 KB

页数:25页

时间:2018-10-26

基于内容的视频信息检索模型及方法综述_第1页
基于内容的视频信息检索模型及方法综述_第2页
基于内容的视频信息检索模型及方法综述_第3页
基于内容的视频信息检索模型及方法综述_第4页
基于内容的视频信息检索模型及方法综述_第5页
资源描述:

《基于内容的视频信息检索模型及方法综述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于内容的视频信息检索模型及方法综述研一郭玉会引言视频检索简介基于内容的视频检索模型视频信息检索的方法分析总结引言随着信息时代的到来,特别是计算机技术和网络技术的发展,海量的信息在全球被采集、传输、流通和应用。由于越来越多的视觉信息数据库的建立和人们对视觉信息越来越多的需求,视觉信息的描述和检索已经成为了当今研究的热点,如何有效的描述视觉信息、如何实现基于内容的信息检索等一系列问题成为多媒体信息相关部门努力研究的重点。基于内容的视觉信息检索大体上分为两类:基于内容的图象信息检索和基于内容的视频信息检

2、索。本文主要对基于内容的视频信息检索技术进行相关的讨论。视频检索简介传统视频检索基于内容的视频检索传统视频检索视频检索就是要从大量的视频数据中找到所需要的视频片段。传统视频信息管理系统是通过访问字符串属性的方式查询视频信息。在系统的描述端,使用相关模型、框架模型、面向目标的模型等表达方案,用字符串表达与内容无关的原数据。在系统的查询端使用同样的文字标识符,借助于对视频的编号通过标签来匹配,使对视频的检索变成了对标签的检索。传统视频检索系统的优点是:简单、快速。缺点是:单纯基于文本,难以实现有效的管理

3、和检索的准确性(1)模糊性视频信息内容的丰富性决定了很难用语言标签准确、完整的描述视频信息的全部内容,这就使得对视频信息的描述存在很大的模糊性(2)不确定性文字描述是对视频信息的一种特定的抽象,这就要求描述方法要符合一定的标准,如果标准改变了,描述方法就要改变。(3)准确性低随着人们对信息依赖性的加强,人们对视频资料中包含的具体信息的需求也越来越多。传统的对视频的描述都是通过手工注释完成的,所以使准确性大大降低。(4)主观因素由于文字标签都是通过观察者选定后加在视频标签上的,因此视频描述很大程度上受

4、到主观因素的影响,不同的观察者或同一个观察者在不同的条件下对同一幅图像会给出不同的描述,有时这种差异会很大。基于内容的视频信息描述方案并不是放弃了传统的文本描述方式,而是最大限度的减少具有极强主观性的文本标签项,使描述系统能够客观、准确、全面的描述视频信息。基于内容的视频检索基于内容的视频检索就是指根据视频的内容及上下文关系,对大规模视频数据库中的视频数据进行检索。主要特点:(1)对视频信息的描述更加具体、客观和全面。(2)低级语义描述子低级描述子的特点之一就是可以由计算机自动提取,这就省去了从大量

5、数据中标识对象的重复劳动,同时也极大程度的降低了文本描述信息中的主观性,大大提高了检索结果的准确性。(3)更多的视频内在信息(4)多样灵活的检索方式基于内容的概念什么是基于内容?所谓基于内容的检索(CBR)就是指根据媒体和媒体对象的内容语义及上下文联系进行检索。基于内容?????基于内容检索的特点:从媒体内容中提取信息线索。直接对图像,视频、音频进行分析,抽取特征,使得检索更加媒体对象。提取特征的方法多种多样。人机交互进行。近似匹配。在检索过程中,采用逐步求精的方法。直到定位到目标。基于内容的检索可

6、以利用图像处理、模式识别、语音信号、计算机视觉、人工智能等学科中的一些方法作为基础技术,以提高其检索精确度。基于内容的视频检索模型基于内容的视频信息检索模型视频数据处理模型中的关键技术基于内容的视频检索系统主要由三部分组成:用户端、可视化界面和管理端。用户端数据库视频数据处理搜索引擎视频数据处理关键帧提取镜头检测视频流视频类聚特征提取故事情节镜头边界的检测镜头是视频数据的基本单元。大部分视频是通过编辑由一个个镜头连接而成的,所以基于内容检索的视频处理,首先要把视频自动地分割为镜头,以作为基本的索引单

7、元,这个过程就称为镜头边界的检测,也叫场景转换检索(SCD),它是实现基于内容的视频检索的第一步。关键帧的选取关键帧是用于描述一个镜头的关键图像帧,它反映一个镜头的主要内容。关键帧的选取一方面必须能够反映镜头中的主要事件,因而描述应尽可能准确完全,另一方面,为便于管理数据量应尽量小,且计算不宜太复杂。特征提取视频数据的特征分为静态特征和动态特征。①静态特征提取②运动特征提取视频类聚视频聚类是研究镜头间的关系,也就是如何把内容相近的镜头组合起来。根据聚类目的的不同,视频聚类可分为两类:一类是把同属一个

8、场景的镜头进行聚类,以形成层次型的视频结构———场景和电影。另一类聚类即对视频进行分类。它只考虑特征相似性,而不考虑时间连续性。根据镜头的重复程度,视频一般可分为对话型、动作型和其它类型。视频信息检索的方法基于内容的视频信息检索系统主要通过三种方式实现,即:(1)基于图像的方式(2)基于视频的特有信息(3)图像和视频的特有信息相结合分析总结高效快速地对视频数据进行检索,必须要对图像进行分割、提取特征、分类描述,分类结果存入相应的数据库中,最后进行相似匹配,完成查询和检

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。