欢迎来到天天文库
浏览记录
ID:33813291
大小:206.43 KB
页数:5页
时间:2019-02-28
《基于mepg压缩视频流的镜头切换算法研究new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2第00138年卷6第月2期JotmmlofA河d北uh工E_dtu大cat学ion成5人;rh教~al禽of学H院eb学ei报UniversityofTechnol,~Vo1.18No.2JUN.2o03基于MPEG压缩视频流的镜头切换算法研究齐虹袁全天津电子信息职业技术学院天津市300132)摘要通过对MPEG系列标准及视频图像压缩原理和视图像分段技术的分析,详细分析并实现了利用树形分类法实现镜头切换的算法。经过实验获取了大量的视频数据(如I帧及切换点的位置)。结果表明该算法具有较好的检出率和检测精度。关键词MPEG;视频;镜头;DC序列;镜头切换检
2、测镜头切换的识别是实现对动态视频基于内容检索的第一步。从实用角度看,越来越多的动态视频都是以压缩形式存缩和传输,所以,基于压缩视频流的镜头切换的研究具有重要的实际意义。本论文通过大量的视频分段及视频序列的分析,旨在研究一种基于MPEG压缩视频流镜头切换检测算法,在此实现了一种针对MPEG压缩视频镜头的切换探测算法。它主要是利用DC序列和压缩流中的关键字计算直方图差等,然后进行差值统计的方法确定。1PEG系列标准MPEG一1:数字电视标准。它是为了CD—ROM上的交互式视频。其设计思想是在1Mbit/s到1.5Mbit/s的低带宽条件下,提供尽可能高的图像
3、质量。MPEG一2:数字电视标准。它是一个直接与数字电视广播有关的高质量图像和声音编码标准。它可以说是MPEG一1的扩充,因为它们的基本算法都相同。但MPG2增加了许多MPEG1没有的功能,MPEG一2要达到的最基本目标是:位速率4—9Mbit/5,最高达15Mbit/s。MPEG一4:多媒体应用标准。它着眼于三方面:一是数字电视,二是交互式图形应用,三是交互式多媒体应用。MPEG一7:多媒体内容描述接口。它是用来描述各种类型的多媒体信息及它们之间的关系,以便更快更有效地检索信息。2PEG视频压缩基础技术MPEG视频中,图像分成三种类型:(1)I图像。只
4、能利用自身的相关性进行中等程度的压缩。它提供在压缩数据流中随机存取的点。(2)P图像。它用最近的前一个I图像或前一个P图像预测编码得到.并作为下一个预测的参照图像。它可能会引趋误差的增值。(3)B图像。它在预测时,既可以使用前一个圈俘作参等.也可以使用下一个图像作参也可以同时使用前后两个参考图像作为参考图像。MPEG系列标准采用的图像编码方法是:帧内图像编码和帧间图像编码。帧内图像压缩编码技术主要采用ADCT技术。ADCT技术主要包括以下四步:DCT变换、量化、游程编码、哈夫曼编码;帧问图像编码足利用时间相关性对一个图像序列进行编码。若附近帧中各像素问县
5、有较大的相关性,就可采用应用时间预测的帧间DPCM编码技术。运动补偿预测技术也可以采用。在多种MPEC砚颁编码方案中,将帧内编码技术和帧间编码技术两者自适收稿日期:2003一l一7齐虹女1972年生讲师河北工业大学第2期齐虹等基于MPEG压缩视频流的镜头切换算法研究l5应结合起来,会实现数据的高压缩。3视频分段技术任何一段视频数据流都是由许多镜头组成的。在新视频数据流插入到视频文件中时,应根据数据模型对数据流进行多层次的分段,层次的最底层一般是镜头分段或镜头变换识别。镜头变换识别的基本任务之一就是将经过剪辑的视频分解成镜头。基于DC图像序列的视频分析和分
6、段:经过DCT变换后,DCT系数的直流分量DC系数集中了图像的主要信息,用DC系数为主反变换得到DC图像,可比较正确地反映视频全景的变化过程。通过对DC图像序列的测度计算,判别分析,达到切换镜头视频场景变化识别。DC图像有两个特点:一是它包含了原图像的基本全局信息;二是与全图像比较,DC图像明显缩小,具有压缩性处理过程更加快捷的特点。DC图像序列提取示例:下图所示的DC图像,是从原图像缩小后得到的一幅图,它的每个像素取自原图的一个88小块,像素值取该块的直流分量DC系数值。DC图保留了原图的重要信息,且数据量仅为原来1/64。能较好地达到恢复原图像的作用
7、。■4镜头切换方式算法研究两段镜头间的切换方式有两种:1、切变(cut):直接将第一段镜头的最后一帧和第二段镜头的第一帧衔接,变化只持续一帧。2、渐变(gradualtransition):通过一些特技处理而将两段镜头的衔接作得更平滑,比如渐隐(dissolve)、淡入(de—n)、淡出(face—out)等。渐变要持续10到30帧左右,镜头间的切换边界不是一个点,而是一个过程。树形分类策略:把要处理的各种情况看作是一个多类别的分类问题,以树形分类器的形式将三个主要算法分级组织起来。分类:边界:1)切变类;2)渐变类:渐隐、淡入、淡出。非边界:1)大运动
8、类:摄像机运动、大物体运动、许多小物体运动;2)噪声类:物理噪声、l6河北工业大
此文档下载收益归作者所有