数字音频第32讲 音频压缩编解码ppt课件.ppt

数字音频第32讲 音频压缩编解码ppt课件.ppt

ID:58780935

大小:8.96 MB

页数:134页

时间:2020-10-03

数字音频第32讲 音频压缩编解码ppt课件.ppt_第1页
数字音频第32讲 音频压缩编解码ppt课件.ppt_第2页
数字音频第32讲 音频压缩编解码ppt课件.ppt_第3页
数字音频第32讲 音频压缩编解码ppt课件.ppt_第4页
数字音频第32讲 音频压缩编解码ppt课件.ppt_第5页
资源描述:

《数字音频第32讲 音频压缩编解码ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、(一)MUSICAM简述MUSICAM是自适应掩蔽模型的通用子带综合编码和复用MaskingPatternUniversalSubbandIntegratedCodingAndMultiplexing的英文缩写,是达到每信道比特率最低为32kbit/s~192kbit/s要求的新型编解码。它依照心理声学特性,去掉声音中大量的冗余降低比特率,进一步压缩数据率。由于适应面广、压缩效果好、解码技术复杂性低以及具有抗传输错码能力强等优点,而被ISO/MPEG音频组使用在MPEGLayerI、LayerII、LayerIII,广泛用于声音记录存储、数字电视伴音、数字声广播DAB、多媒体中的声音编码方案

2、,是音频数字处理核心技术之一。ISO/MPEGDIS-11172对LayerI、LayerII、LayerIII的数据流格式和解码方案作了详细的规定,其编码方案给出了通用的心理声学编码器,其精髓是自适应掩蔽模型的通用子带综合编码和复用,见图3-35。3.8自适应掩蔽模型的通用子带综合编码和复用图3-35ISO/IEC11172-3编码器框图对LayerI、LayerII给出了图3-36具体编码器流程图以及心理声学模型算法;而LayerIII仅有一个可能的编码方式。至于心理声学模型算法没有固定在LayerI、LayerII,因此目前围绕着LayerIII算法国内外提出了多种方案。以MPEGLa

3、yerIII(即MP3)格式编码为例,当采用mp3(即MP3在Web上最为流行的文件名“.mp3”)格式用于存储,在一张直径为12cm的光盘下可保存150首歌曲。2001年6月19日法国Thomson发布新版MP3编码器。与现有MP3相比将压缩率提高了两倍,命名为“mp3PRO”,在64kbit/s的码率下实现了相当于128kbit/s的音质。当采用mp3PRO格式在相同尺寸的光盘上可以保存300首以上的乐曲。mp3PRO格式将音频数据分为两部分进行编码。其中第一部分与现行MP3兼容;另一部分为mp3PRO独自部分。图3-36LayerI、LayerII具体编码器流程图通过采用这一方式确保了

4、与音频MP3格式文件以及用来播放MP3文件的单放机具有兼容性,从而在mp3PRO上也可播放原有MP3格式的音乐文件。反之也可以在MP3单放机播放采用mp3PRO格式的压缩文件。但只有采用mp3PRO解码器才能有最佳音质。之所以mp3PRO比MP3提高了二倍的压缩,是由于在改进了心理声学模型的算法以及编码器内增加了功能。图3-37LayerIII编码器框图LayerIII编码器的输入信号为数字音频信号,滤波器组分为32个子带送入MDCT,而对输入信号进行的1024点的FFT变换,由听觉生理学模型处理后也送至MDCT。对子带进行MDCT。经MDCT变换后送失真控制环路、哈夫曼编码等,最后形成32

5、kbit/s~192kbit/s比特率的数据流。(二)MPEGLayerI编码器LayerI复杂性最低,压缩效率也最低。压缩数据流的预设比特率为32kbit/s~448kbit/s,主要用于192kbit/s的场合。采用MUSICAM基础层,包含一组QMF将宽带样本值分割为32个窄频率范围的子带信号,依据心理声学模型对子带信号进行量化和编码,编码器结构已在图3-37中给出。解码是其逆过程。(1)多相QMF输入端提供的PCM样本值经多相QMF分割为32个子频带。子带的频率宽度∆f为∆f=fs/2n式中,fs为样本值间隔的倒数,即PCM样本值的采样频率;Fs/2即模拟声音信号的最高频率;n是分割

6、成子带的个数。对于fs=48kHz,n=32则∆f=0.75kHz对于fs=32kHz,n=32则∆f=0.5kHz每个子频带信号在一帧一帧基础上根据时变比特分配进行比例和量化,比特分配作为掩蔽门限的函数被搜索、优化,使需要的时变比特率达到固定数值。(2)心理声学模型用于ISO/MPEG11172-3的心理声学模型有两种,原则上它们都可以用在LayerI、LayerII及LayerIII,但模型I适用于LayerI、LayerII,而模型2用于LayerIII。心理声学模型要完成快速傅里叶变换FFT、子带n的声压电平、绝对阈即白由声场等响度曲线的最小可闻阈、计算掩蔽门限以及信号掩蔽比SMR。

7、具体内容结合LayerII编码器给予介绍。(3)比例因子的确定为了根据掩蔽阈值来对量化噪声整形,每个子带中都引入了比例因子,如果发现在一个给定的子带中的量化噪声超过了心理声学模型所提供的掩蔽阈值,那么该子带的比例因子就将被调整以减少量化噪声。将各个子带内连续的12个样点(子带采样样本)归为一块(这是考虑声掩蔽的时域掩蔽特性)。当输入PCM样本的采样频率为48kHz,分割成32子带(频带为0.75kHz),则子

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。