mpeg-4视频编解码dct算法的实现研究

mpeg-4视频编解码dct算法的实现研究

ID:21952478

大小:4.78 MB

页数:84页

时间:2018-10-25

mpeg-4视频编解码dct算法的实现研究_第1页
mpeg-4视频编解码dct算法的实现研究_第2页
mpeg-4视频编解码dct算法的实现研究_第3页
mpeg-4视频编解码dct算法的实现研究_第4页
mpeg-4视频编解码dct算法的实现研究_第5页
资源描述:

《mpeg-4视频编解码dct算法的实现研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第一章引言第一章引言1.1图像压缩基本理论伴随着计算机网络、通信技术、多媒体技术的飞速发展,多媒体通信已经成为人类生活不可缺少的部分。在多媒体信息处理过程中,人们最基本的需求是能够动态实时的处理、传输和获取图形、图像、动画、声音及视频等多种媒体信息。然而,对于这些数字化后的信息,尤其是动态视频数据,数据量十分庞大。例如,针对一幅具有中等分辨率(640×480)的数字彩色视频图像,若每像素以24bit量化,表示一帧图像需要约需要7.4Mbits,对于25帧/秒的帧速率,该视频信号的传输速率高达184.3Mbit/s。如此海量的数据信息给计算机的存储能力、处理速度以及通信网络的传

2、输带宽带来了相当大的困难,因此为了实际的应用,必须对视频信号进行大幅度的压缩,在保证图像质量的前提下,最大限度地降低图像数据量,以利于图像的存储和传输。视频压缩不仅是必要的而且是可能的,因为原始图像数据存在很大的信息冗余度,我们可以通过去除这些冗余信息,达到压缩的目的。首先,视频图像帧内相邻像素间是空域相关的,通过变换编码消除冗余;其次,对于连续视频序列来说,相邻帧之间也存在较强的时域相关性,尤其是运动较慢的视频,时域相关性更大,通过帧间预测编码消除冗余;而且,人眼对图像边缘的急剧变化不敏感,对图像的亮度信息敏感而对色彩的分辨力较弱,利用人眼的这些视觉特点也可以实现图像的高压

3、缩率。数据压缩的主要目标是实现较大的压缩比、较快的压缩解压速度与尽可能好的图像还原质量。-1-电子科技大学工程硕士学位论文近年来,国际电联(ITU-T)和国际标准化组织(ISO)也相继推出新的视频标准,从H.261到H.264,从MPEG-1到MPEG-7,不同的标准由于采用不同的工具集和算法,满足不同场合的应用需求,但其编解码的核心技术原理是相同的,主要包括变换编码和预测编码。视频压缩的基本过程主要由预测编码、变换编码(DCT/IDCT)、量化、熵编码等构成,同样,解压缩由反变换编码(IDCT)、反量化、运动补偿、可变长解码构成。其原理如图1.1所示。1、预测编码预测编码是

4、根据已编码的过去像素来预测当前像素,将预测值与实际值相减得到误差值,并对预测误差值进行量化编码[1]。由于误差值远小于实际值,从而达到压缩的目的。预测编码包括帧内预测和帧间预测两种编码方式。帧间预测编码是1969年由Mounts提出的,其理论基础是视频序列相邻帧之间存在很强的时间相关性,因为相邻帧之间的时间间隔很小,图像内容的细节变化也是非常小,它能获得比帧内编码高得多的压缩比,通过与帧内编码配合使用于视频信号压缩中,可避免错误帧的扩散。帧间预测编码是由运动估计和运动补偿两部分组成。其中基于块匹配算法的运动估计技术因为运算量小(尤其是改进后的算法)、实时性高、并很好的解决了搜

5、索复杂度与图像精度间的矛盾,从而得到广泛的应用。它由运动搜索、运动矢量编码、宏块类型判断、帧差计算四个步骤组成:(1)运动搜索。在前帧的对应于当前帧当前宏块位置的附近区域中,搜索与当前宏块最匹配的宏块,在此过程中,利用快速搜索算法获取最佳的预测运动矢量和相应的最小误差。根据算法规定的搜索起点和搜索路径,逐个计算运动矢量的误差,满足一定的阈值原则或达到最小误差时,得到最优匹配宏块,搜索完成。(2)运动矢量编码。通过对两帧图像子块的比较,可以得到运动矢量,一般采用差分方式传送相邻运动矢量的差值,以减少编码比特数,达到更高的压缩效率。(3)宏块类型判断。在找到匹配宏块后根据前后两帧

6、的相关性选择采用帧内编-2-第一章引言码或者帧间编码,相关性强则采用帧间编码,相关性弱则采用帧内编码。(4)帧差计算。在前帧中通过运动估计找到最匹配的宏块后,传送前后匹配宏块间像素差值矩阵。在运动估计后需要进行运动补偿,运动补偿应用于解码器和编码器的本地解码中,实际上是运动估计的逆过程。首先根据运动矢量和预测方式等参数获取参考宏块的数据,然后利用像素差值矩阵对参考宏块进行修正,从而恢复当前宏块的数据。因此,经过运动估计和运动补偿后,最终输出的不是一连串的帧图像完整编码,而是“帧内图像编码+误差图像编码+差分运动矢量编码”。2、变换编码变换编码是对图像数据进行空间域的转换,将时

7、空域的原始图像值变换到系数域(频域)。经过变换,消除了像素的空间相关性,使能量主要集中在局部的少数变换系数上。变换本身不带来压缩效果,而是由于能量的集中,使得后续的量化和变长编码可以进行有效的压缩。常用的变换编码类型有哈尔变换、DCT变换、KL变换、Walsh-Hadamard变换等。其中KL变换是最优的,它能完全消除图像子块内各像素间的线性相关性,而且均方误差最小,但算法比较复杂,不利于图像编码的实时实现,而DCT变换由于存在快速的算法,性能十分逼近KL变换,从而得到广泛应用[2]。DCT变换就是在编

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。