网络多媒体技术(西电版)第3章多媒体数据压缩编码标准

网络多媒体技术(西电版)第3章多媒体数据压缩编码标准

ID:43243124

大小:1.08 MB

页数:164页

时间:2019-10-07

网络多媒体技术(西电版)第3章多媒体数据压缩编码标准_第1页
网络多媒体技术(西电版)第3章多媒体数据压缩编码标准_第2页
网络多媒体技术(西电版)第3章多媒体数据压缩编码标准_第3页
网络多媒体技术(西电版)第3章多媒体数据压缩编码标准_第4页
网络多媒体技术(西电版)第3章多媒体数据压缩编码标准_第5页
资源描述:

《网络多媒体技术(西电版)第3章多媒体数据压缩编码标准》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第3章多媒体数据压缩编码标准3.1音频压缩编码标准3.2图像压缩编码标准3.3视频压缩编码标准3.4本章小结思考练习题在多媒体系统中,多媒体数据编码标准是系统设计、开发和应用的基础。本章介绍音频、图像及视频压缩编码标准。3.1.1音频信息的编码分类在实际应用中,音频压缩技术的选择需要综合考虑音频质量、压缩比、计算复杂度等因素。常用的音频压缩编码可分为波形编码、参数编码、混合编码和感知编码等。3.1音频压缩编码标准1.波形编码波形编码是基于信号统计特性进行音频压缩的编码方法,是直接对音频样值进行的编码,它在时域上进行处理,保留了信号

2、的各种过渡特征,力图使重建的音频波形尽可能与原波形一致。波形编码的技术主要有非线性量化技术、时域自适应差分编码和量化技术。非线性量化技术利用小幅度语音信号出现的概率大而大幅度语音信号出现的概率小的特点,通过为小信号分配小的量化阶,为大信号分配大的量化阶来减少总量化误差。自适应差分编码和量化技术是利用过去的语音来预测当前的语音,只对它们的差值进行编码,从而大大降低了数据率;根据量化数据的动态范围来动态调整量化阶,即采用自适应量化技术,使得量化阶与量化数据相匹配。波形编码是最简单也是应用最早的音频编码方法,具有实施简单、适应性强、音频

3、质量好等特点,其不足之处是压缩比不高,数据率较大。典型的波形编码包括脉冲编码调制(PCM)、差值量化(DPCM)、自适应量化(APCM)和自适应差值量化(ADPCM)编码等。2.参数编码参数编码是基于声学参数进行音频数据压缩的编码方法。人类的发声器官产生声音的过程可以用一个数学模型来逼近,参数编码就是通过计算表征这个发声模型的参数并对其进行编码来进一步降低数据率的。常用的音频参数有共振峰、线性预测系数、滤波器组等。参数编码的优点是压缩比高,语音编码速率较低,基本上在2~9.6kb/s之间。其缺点首先是合成语音质量较差,往往清晰度满

4、足要求而自然度不好,难于辨认说话人是谁;其次是电路实现的复杂度比较高。目前,编码速率小于16kb/s的低比特语音编码大都采用参数编码。参数编码在移动通信、多媒体通信和IP网络电话应用中都起到了重要的作用。参数编码的典型代表是线性预测编码(LPC)。3.混合编码混合编码是将波形编码的高质量与参数编码的低数据率结合起来的编码方法,以求能在较低数据率下获得较高的音质。其基本原理是合成分析方法,即将综合滤波器引入编码器,与分析器相结合,在编码器中将激励输入综合滤波器,产生与译码器端完全一致的合成语音,然后将合成语音与原始语音相比较(波形编

5、码思想),根据均方误差最小原则,求得最佳的激励信号,然后把激励信号以及分析出来的综合滤波器编码送给解码端。这种得到综合滤波器和最佳激励的过程称为分析(得到语音参数),用激励和综合滤波器合成语音的过程称为综合。由此可见,混合编码把参数编码和波形编码的优点结合在了一起,使得用较低码率产生较好的音质成为可能。常见的混合编码包括码本激励线性预测编码(CELP)、多脉冲激励线性预测编码(MPLPC)、多脉冲最大似然量化编码(MP-MLQ)以及G.728、GSM标准等。4.感知编码感知编码是基于人耳的听觉特性,通过消除不被感知的冗余信息来实现

6、对音频数据压缩的编码方法。它基于心理声学模型,利用人的听觉阈值特性和掩蔽效应,通过给不同频率处的信号数据分量分配以不同量化比特的方法来控制量化噪声,使得噪声能量低于掩蔽阈值,即把压缩带来的失真控制在听阈以下,使人耳觉察不到失真的存在,从而实现更高效率的音频压缩。目前,在高质量音频编码标准中,心理声学模型是一个最为有效的算法模型。在此类编码中,以MPEG音频编码(MPEGLayer-1、2、3和AAC标准)和DolbyDigital的应用最为广泛。3.1.2音频压缩编码标准音频信号的压缩编码主要包括ITU制定的G.7XX系列和ISO

7、/IEC制定的MPEG-X系列标准。1.G.7XX系列中的波形编码标准采用波形编码的编码标准有G.711标准、G.721标准和G.722标准。1)G.711标准G.711标准是在1972年提出的,它是为脉冲编码调制(PCM)制定的标准。从压缩编码的评价来看,这种编码方法的语音质量好,算法延时几乎可以忽略不计,但缺点是压缩率很有限。G.711针对的是电话质量的窄带语音信号,频率范围是0.3~3.4kHz,采样频率采用8kHz,每个采样样值用8位二进制码编码,其速率为64kb/s。G.711标准推荐采用非线性压缩扩张技术,压缩方式有

8、A律和μ律两种。由于使用了压缩扩张技术,其编码方式为非线性编码,而其编码质量却与11比特线性量化编码质量相当。在5级的MOS评价等级中,其评分等级达到4.3,语音质量很好;编/解码延时只有0.125ms,可以忽略不计;算法的复杂度是最低的,定为1,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。