欢迎来到天天文库
浏览记录
ID:30910094
大小:40.50 KB
页数:3页
时间:2019-01-04
《mpeg-4背景图像编码研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、文章编号:1009-8119(2006)02-0047-02MPEG-4背景图像编码研究张国军李小平(北京理工大学计算机科学与工程系,北京100081)摘要介绍了背景图像编码。Sprite编码是针对背景视频对象的特点而提出的一种有效的编码方法。对GME的改进着重考虑合理的选择计算点、减少冗余点数和采用一种较好的去除前景对象干扰的方法三个方面。关键词MPEG-4,Sprite编码,全局运动估计,MVFASTMPEG-4SpriteEncodeResearchZhangGuojunLiXiaoping(Dept.ofComputerScienceang
2、Engineering,BeijingInstituteofTechnology,Beijing100081)AbstractSpriteencode.Spriteencodeisanewideawhichisbasedonencodingaccrodingtoobject,theprominentfeatureofMPEG-4.ThepaperresearchthetechniqueofGME,andimprovedtheexitingtechniquefromthreeaspeces:globalmotionestimation,selecti
3、onofcomputingpointandoverlaparithmetic.KeywordsMPEG-4,Spriteencode,GME,MVFAST1引言MPEG-4是基于视频对象的编码,对于一幅待编码图像,MPEG-4将前景对象和背景对象分开进行编码,这样可以根据网络情况和个人兴趣实现对某个视频对象的任意控制。Sprite编码是针对背景视频对象的特点而提出的一种有效的编码方法。在许多应用场合中,背景视频对象自身是没有任何局部运动的,其每帧所产生的变化是由于前景物体的运动而造成的,例如,一部分背景被掩盖,而另一部分背景又显露出来;或者是由于摄
4、像头的运动,如平移、旋转、缩放所产生的比较复杂的变化而造成的。为了有效编码这类图像,可以将一段视频序列中的背景对象在一段时间出现的所有内容拼接成一幅完整的背景图像,该背景对象在某一帧出现过的像素点,在这幅完整的背景图像中都能找到对应点,这样的完整背景图像称为Sprite图像,针对Sprite图像所进行的编码称为Sprite编码。Sprite编码是MPEG-4标准中出现的的一种新的编码技术,它利用全局运动估计生成一段视频序列的Sprite图像,然后将这个Sprite图像编码,以后各帧的背景编码都只是对该帧相对于Sprite图像的运动参数进行编码;解码
5、时首先解码得到Sprite图像,然后解码以后每帧运动参数的码流,并根据解码得到的运动参数从Sprite图像中生成当前帧的背景。目前,Sprite编码方法根据不同的编码过程可以分为以下两种:1.1静态Sprite(Off-lineSprite)这种方法主要适合于人工合成图像的编码。在编码前Sprite图像和每帧图像重构点都已经知道了,在编码过程中根据图像重构点,计算出当前帧在Sprite图像中的对应点和范围,编码传输这部分Sprite图像和重构点。整个Sprite图像只需要编码传输一次,在解码端就能通过解得的重构点,重构许多帧不同的图像。1.2动态S
6、prite(On-lineSprite)本文主要讨论动态Sprite编码。这种方法主要用于自然图像的编码,是一种增强的运动补偿方式。在编码器和解码器中都必须建立相同的动态Sprite图像。对将要编码的每一帧图像,将其与已有Sprite图像进行全局运动估计,并进行运动补偿,利用所得到的差值数据不断对已有Sprite图像进行更新,直到完整的Sprite图像生成。2动态Sprite编码2.1全局运动估计(GlobalMotionEstimation)全局运动估计GME是一种基于模型的运动分析方法。通常情况下,自然背景对象是没有自身运动的,由于摄象机运动才
7、造成了在图像序列中的背景产生变化,对这样的背景所进行的运动分析就采用了全局运动估计。它的基本原理是利用密度估计的方法得到最佳估计的模型参数,可以采用迭代优化方法比较好地估计出那些模型参数。全局运动估计技术应用是很广泛的,例如Sprite编码、全局运动补偿编码和sprite图像生成等。另外,由于全局运动估计可以得到和相机运动有关的信息,因此它在视频内容的分析描述(如MPEG-7)方面也有重要应用。本文主要讨论GME在Sprite编码中的应用。即使是这样,对一幅352×240的图像做二维的(-7,7)范围内的全局运动估计也需要大约228万次加法。为了进
8、一步减少运算量,常见的做法是对参考VOP和当前编码VOP都做两次滤波,产生金字塔结构三层图像,最低层是原图像,最上层的图像
此文档下载收益归作者所有