欢迎来到天天文库
浏览记录
ID:43243139
大小:1.39 MB
页数:179页
时间:2019-10-07
《网络多媒体技术(西电版)第2章多媒体数据压缩编码技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第2章多媒体数据压缩编码技术2.1多媒体数据压缩的必要性和可行性2.2多媒体数据压缩理论基础2.3压缩算法的分类及性能评价2.4熵编码2.5预测编码第2章多媒体数据压缩编码技术2.6变换编码2.7矢量量化编码2.8压缩编码新技术2.9本章小结思考练习题在多媒体系统中,处理、传输、存储的多媒体信息主要包括文字、声音、图形、图像、视频等媒体类型,这些媒体以大量数据的形式存在,如果不对它们进行压缩,是无法在计算机中存储、处理和传输的。所以,多媒体数据的压缩编码技术是网络多媒体技术中的重要基础。本章主要讨论多媒体数据编码基本原理、常用压缩编码方法以及新型压缩编码技术。2.
2、1.1多媒体数据压缩的必要性信息时代的重要特征是信息的数字化,而数字化后的视频和音频等媒体信息具有媒体海量性,这与当前硬件技术所能提供的计算机存储资源和网络带宽之间有很大差距。这样,就对多媒体信息的存储和传输造成了很大困难,成为阻碍人们有效获取和利用信息的一个瓶颈问题。不能对多媒体数据进行有效的压缩,就难以保证通信的顺利进行。数字化了的视频和音频信号的数据量是非常惊人的。下面举例来说明。2.1多媒体数据压缩的必要性和可行性对于音频信息来说,人在正常说话时的音频一般为200Hz~3.4kHz,即人类语音的宽度约为3.4kHz。同样依据采样定理,并设数字化精度为8bi
3、t,则每秒的数据量为3.4×2×8=54.4kb即在上述采样条件下讲1分钟话的数据量约为400kb。 以一般彩色电视信号为例,设代表光强、色彩和色饱和度的YIQ空间中各分量的带宽分别为4MHz、1.3MHz和0.5MHz。根据采样定理,仅当采样频率大于或等于2倍的原始信号的频率时,才能保证采样后的信号可被无失真地恢复为原始信号。再设各样点均被数字化为8bit,从而1秒钟的电视信号的数据量为(4+1.3+0.5)×2×8=92.8MB因而一张640MB容量的CD-ROM能够存放的原始电视数据(每字节附有2位校验位)为也就是说,一张普通光盘只
4、能存放44s的原始数据。 表2-1列出了支持语音、图像、视频等多媒体信号高质量存储和传输所必需的未压缩速率以及信号特性。表2-1各种信号的特性和未压缩速率从以上两个例子以及表2-1可以看出:未进行任何形式的编码和压缩的多媒体信息数据量庞大,如果不进行压缩处理,计算机系统几乎无法对其进行存取和交换。因此,对多媒体数据进行压缩十分必要。2.1.2多媒体数据压缩的可行性从信息论观点来看,描述信源的数据是信息量(信源熵)和信息冗余量之和。数据压缩编码的本质就是减少这些冗余量,从而可以减少数据量而不是减少信源的信息量。一般而言,图像、视频、音频数据中存在的数据冗余类型主
5、要有以下这些:(1)空间冗余。在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结果在数字化图像中就表现为数据冗余。(2)时间冗余。时间冗余反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其他帧图像中的物体或场景重构出来。音频的前后样值之间也同样有时间冗余。(3)信息熵冗余。信源编码时,当分配给第i个码元类的比特数b(yi)=-lbPi(Pi为第i个码元类的概率)时,才能使编码后的单位数据量等于其信源熵,即达到其压缩极限。但实际中各码元类的先验概率很难预知,比特分配不能达到最佳,因而使实际单位数据量大于信
6、源熵,即存在信息熵冗余。(4)视觉冗余。人眼对于图像场的注意是非均匀的,人眼并不能察觉图像场的所有变化。事实上人类视觉的一般分辨能力为26灰度等级,而一般图像的量化采用的是28灰度等级,即存在着视觉冗余。(5)听觉冗余。人耳对不同频率的声音的敏感度是不同的,并不能察觉所有频率的变化,因此存在听觉冗余。(6)其他冗余,包括结构冗余、知识冗余等。 在实际编码中,人们总是利用这些冗余进行压缩。例如图2-1中,F1帧中有一辆汽车和一个路标P,经过时间T后,图像F2仍包含以上两个物体,只是小车向前行驶了一段路程。此时,F1和F2是时间相关的,后一幅图像F2在参照图像F1
7、的基础上只需很少数据量即可表示出来,从而减少了存储空间,实现了数据压缩。再比如人脸的图像有固定的结构,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于脸的中线上,等等。根据已有的这些知识,可以构造其基本模型,因而图像的存储只需要保存一些特征参数,从而可以大大减少数据量。 随着对人类视觉系统和图像模型的进一步研究,人们可能会发现更多的冗余性,使图像数据压缩编码的可行性越来越大,从而推动图像压缩技术的进一步发展。图2-1时间冗余多媒体数据压缩编码必须在保持信息源内容不变或损失不大的前提下才有意义,这就必然涉及信息的度量问题。下面首先讨论信源模型及其熵,然后介绍无失真编码
8、理论和有失
此文档下载收益归作者所有