欢迎来到天天文库
浏览记录
ID:40222820
大小:220.00 KB
页数:29页
时间:2019-07-27
《第6章 压缩编码标准》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第6章多媒体数据的压缩本章要求1、了解数据压缩的必要性和数据中存在的各种冗余2、熟悉数据压缩的基本原理和常用的数据压缩方法3、掌握无损压缩的编码算法(行程编码哈夫曼编码算术编码)4、了解有损压缩的编码算法(统计编码预测编码、变换编码)5、熟悉常用多媒体数据压缩的标准6.1数据压缩概述1、压缩的必要性声音、图像、视频和动画的数据量太大声音1分钟立体声音乐采样频率为44.1KHZ,16位量化精度的数据量为44.1*1000*16*2*60/8=10.09MB存储一首4分钟的歌曲约需40MB图像1副640*480的R
2、GB彩色图像的存储容量为640*480*24/8=900KB视频1秒钟(25帧/秒)的视频数据量为25*900KB=21.97MB1张650MB的CDROM光盘只能存储约650/21.97=29.59秒的视频空间冗余:图像内部相邻像素之间的相关性时间冗余:视频序列中前后帧之间的相关性视觉或听觉冗余(人眼或人耳具有一定的掩蔽效应)知识冗余(具有规律性的结构,用于图像理解上,如人脸)统计冗余(字符出现的频率具有一定的规律性)结构冗余(具有纹理结构的图像区域)信息熵冗余(即编码冗余,用相同位数进行编码产生的冗余)2数
3、据冗余6.2数据压缩的基本原理1、信息编码基础压缩的实质:根据数据的内在联系将数据从一种编码映射为另一种编码,又叫压缩编码。编码器(压缩)存储器或网络解码器(解压缩)输入数据输出数据数据压缩过程数据压缩方法的衡量指标压缩率:越大越好压缩质量:数据失真越小越好压缩与解压缩的速度:速度越快越好2、数据压缩方法无损压缩有损压缩混合编码预测编码变换编码PCM编码DPCM编码ADPCM编码帧间预测编码离散余弦变换K-L变换小波变换JPEGMPEGH.261行程编码哈夫曼编码算术编码香农编码LZW编码统计编码6.3数据压缩
4、的编码算法无损压缩编码算法行程编码哈夫曼编码算术编码有损压缩编码算法PCM(脉冲编码调制)预测编码变换编码重点一、无损压缩原理:减少或去除数据中的冗余;优点:可以无失真地还原成原来的数据;缺点:但是压缩比率较小,一般在2:1到5:1之间;应用:压缩数据或程序;1.行程编码(游程编码)原理:将连续相同的数据序列用重复次数和单个数据来表示。应用:用于图像文件的压缩(尤其适合于由计算机生成的图像)如bmp和tiff等图像格式。(1)多值信息的编码编码格式:信息重复次数+被重复的信息例:字符串为:atttefppppp
5、pddddss行程编码为:a3tef6p4d2s(2)二值信息的编码编码格式:0或1重复的次数例如二进制数据流为000111111000001111假设行程约定以0开始,则编码为:3654若约定以1开始,则编码为:036542.哈夫曼(Huffman)编码算法步骤(1)按照符号出现的概率大小进行排序(2)把最小的两个概率值相加,得到一个新的概率序列(3)重复上述两个步骤,直到概率值为1(4)从后往前进行编码,概率大的赋予1,概率小的赋予0。(反过来也可以)(5)写出每个符号的码字例1:字母ABCDE出现的概率分
6、别为0.15、0.25、0.1、0.37和0.13,其哈夫曼编码为:P(C)=0.1P(E)=0.13P(CE)=0.23P(A)=0.15P(ACE)=0.38P(B)=0.25P(D)=0.37P(BD)=0.62P(ACEBD)=100001111A:00B:10C:010D:11E:011假设共有100个字符,若采用等长编码,每个字符至少需要3位二进制,100个字母需要300位,采用哈夫曼编码则只需要15*2+25*2+10*3+37*2+13*3=223位。压缩比为300:223=1.34:1例2:字
7、母ABCDE出现的概率分别为0.53、0.25、0.07、0.05和0.1,其哈夫曼编码为:A:1B:01C:0011D:0010E:000若采用等长编码,至少需要3位二进制,100个字母需要300位,采用哈夫曼编码则需要:53*1+25*2+7*4+5*4+10*3=181位压缩比为300:181=1.65:10P(E)=0.1P(D)=0.05P(C)=0.07P(DC)=0.12P(EDC)=0.22P(B)=0.25P(EDCBA)=1000111P(EDCB)=0.47P(A)=0.53013、算术编
8、码编码原理:将被编码信源表示为[0,1)区间的一个实数,根据各符号出现的概率构造其所在区间,随着信息字符的不断出现,其所在区间越来越小,对应表示的实数也越来越小。例:假设有一个4个符号的信源A={a1,a2,a3,a4},各符号出现的概率及起始编码区间如下表:信号字符出现概率起始编码区间a10.2[0,0.2)a20.4[0.2,0.6)a30.2[0.6,0.8)a40.2[0.8,
此文档下载收益归作者所有