欢迎来到天天文库
浏览记录
ID:34531073
大小:5.04 MB
页数:106页
时间:2019-03-07
《多标准离散余弦变换算法及vlsi体系研究和实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、杭州电子科技大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名:日期:年月日学位论文使用授权说明本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发
2、表论文或使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定)论文作者签名:日期:年月日指导教师签名:日期:年月日杭州电子科技大学硕士学位论文第一章绪论1.1前言当今社会的信息化步伐的加快,使视频和图像数据的存储量与日俱增,而通信和多媒体的带宽有限,国际标准化组织为了解决这一矛盾,先后制定了一系列标准应用于视频图像压缩。而视频压缩编码方法[1]可分为,预测编码,变换编码,熵编码。预
3、测编码主要是利用图像在局部空间和时间范围内相邻像素间的相关性,参考已经完成编码并重构后的临近像素值,并预测当前像素值,将像素预测值和实际值相减得到的残差值作为后续压缩的数据对象,通常分为帧内和帧间预测编码。预测编码的缺点是有可能造成误码的扩散,从而形成区域误码[1]。变换编码是利用图像的大部分都是平坦区域或者说内容变化缓慢的区域,只有小部分属于细节区域或者说内容突变区域的性质来实现压缩编码。从频域的角度说,一幅图像的大部分都是直流或低频区域,而少部分属于高频区域。图像从空间域变换到频域之后,将产生相关性很小的一些变换系数,这些系数中高
4、频部分占了少数,所以大部分高频系数数值很小,通过量化有可能变为零可以不用传输,且不影响后面的码流质量,而直流或低频部分占了大多数,这样就可以对其进行压缩编码。正交变换在图像编码中应用广泛。如快速傅立叶变换(FFT)、K-L变换、离散余弦变换(DCT)等等。其中,编码性能以K-L变换最理想,但没有快速算法[1],而且它的变换矩阵根据不同的图像需要不同的变换矩阵,所以没有通用性。DCT编码性能和K-L变换相近,但它有快速算法,所以目前广泛应用于图像编码中。相比于预测编码,变换编码的影响只限制在一个块,所以不会造成误码扩散。熵编码是利用信源
5、的统计特性进行压缩,通常分为变长编码(哈夫曼编码)和算术编码。变长编码采用一个码字代表一个输入信息符号,分配字长较短的二进制码给出现概率大的符号,而分配字长较长的二进制码给出现概率比较小的符号,这样就可以得到符号平均码长最短的码了。算术编码是采用一个浮点数代替一串输入符号。所以输出的是一个介于0和1之间(不等于1)的浮点数。目前业界主要的视频和图像压缩标准有JPEG,MPEG-4,H264,AVS等。它们都是采用混合视频压缩编码方法。1.1.1JPEG标准简介1杭州电子科技大学硕士学位论文JPEG(JointPhotographicE
6、xpertsGroup)标准是静止图像压缩编码标准。于1991年3月由ISO/IEC通过,它是以DCT变换和变长编码为基础的。JPEG标准不仅适用于静止图像编码,同时也适用于运动图像中帧内图像的编码,是数字视频和图像压缩编码技术发展的基础[2]。JPEG标准分为基本系统、扩展系统和信息保持系统三个部分。基本系统提供对顺序扫描静止图像的高效有损编码。1.1.2MPEG-4标准简介MPEG-4(MovingPictureExpertsGroup)标准有若干部分组成,主要分为系统、视频和音频,MPEG-4的编码基于对象,与MPEG-1和MP
7、EG-2两个标准相比,最显著的差别在于它是采用基于对象的编码理念,即在编码时将一幅景物分成若干在时间和空间上相互联系的音视频对象,分别编码后,再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频。这样既方便对不同的对象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合,并且这样也可以方便的实现对于各种对象的操作及编辑。MPEG-4便于操作和控制,注重多媒体系统的交互性和灵活性,主要应用于可视电话、视频会议等。MPEG-4所基于的对象为VO(VideoObject),它包含了三类信息[1]:运动信息,
8、形状信息,纹理信息。其视频数据流的逻辑结构如图1.1所示。其中,层次由小到大依次分为VOP(VideoObjetPlane)、GOV(GroupofVop)、VOL(VideoObjectLayer)、VO(VideoO
此文档下载收益归作者所有