数字音频编码技术

数字音频编码技术

ID:34475476

大小:1.58 MB

页数:68页

时间:2019-03-06

数字音频编码技术_第1页
数字音频编码技术_第2页
数字音频编码技术_第3页
数字音频编码技术_第4页
数字音频编码技术_第5页
资源描述:

《数字音频编码技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数字音频编码技术闫建新闫建新数字音频编解码技术国家工程实验数字音频编解码技术国家工程实验室室20092009..1111内容内容•数字音频编码技术基础•数字音频编码技术标准•DRA音频编码技术及应用•数字音频编码技术最新进展2PPaarrttII数字音频编码技术基础数字音频编码技术基础音频应用音频应用的的典型数据典型数据采样频样本精度单道声/立(未压缩的)数质量频率范围(Hz)率(kHz)(bit/s)体声据率(kb/s)电话*88单道声64.0200~3400AM11.0258单道声88.220~1500

2、0FM22.05016立体声705.650~7000CD44.116立体声1411.220~20000VCD,DTV4816立体声1536.020~20000HDTV,48165.14608.020~20000DVD蓝光DVD96(192)247.1(2)18432.020~200004感觉音频感觉音频编编码基本结构码基本结构数字音频时频量化量化输出成帧输入映射和编码样点比特流心理声学信号掩蔽比模型抽象为数字音频冗余度不相关度输出输入压缩压缩比特流心理和生理声学模型5时频分析时频分析--基本基本要求要求•信

3、号自适应的时频分割;•好的声道隔离;•低分辨率:临界频带模式;•阻带衰减大;•高分辨率模式:高达4096子带;•完美重建;•有效的分辨率切换;•严格采样;•最小的块效应;•存在快速算法;正交变换:滤波器组:混合结构:•DCT/MDCT•多相滤波器组•WFB/MDCT•MLT/NMLT•小波(包)滤波器组•PQFB+MDCT•LOT/GenLOT•时变滤波器组•信号分解+MDCT•LBT/GenLBT•频变滤波器组6时频分析时频分析--各种各种编编码码时频时频特性特性映射频率分辨时间分辨长窗时域短窗时域类型率

4、(Hz)率(ms)响应(ms)响应(ms)LayerIPQMF7500.6710.67LayerIIPQMF7500.6710.67PQMF/LayerIII41.674.0034.6718.67MDCTAACMDCT23.442.6742.675.33TwinVQMDCT46.8810.6721.33AC-3MDCT93.752.6710.675.33GC/PQF/ARTRAC43.071.4524.313.99MDCTPQMF/DTS7500.6710.67ADPCMMDCT/PAC23.441.334

5、2.67WaveletOGGVorbisMDCT23.442.6742.675.337长长短块短块MMDDCTCT切切换换的时频分析的时频分析技术技术正变换:2N-12éN+11pùX(k)=åx(n)h(n)cosê(n+)(k+)×úNn=0ë22Nûn=0,1,...2N-1;k=0,1,...N-1h(n)是长度为2N的窗函数,必须满足完美重建条件,一般使用正弦窗:ép(n+1/2)ùh(n)=sinêúë2Nû逆变换:h(n)h(n)N-1'2éN+11pùxr(n)=åX(k)cosê(n+)(

6、k+)×úNk=0ë22Nûn=0,1,...2N-1;k=0,1,...N-1''xr,-1(n)x(n)x(n)=h(n+N)x(n+N)+h(n)x(n)r,0rr,-1r,0n=0,1,...N-18x(n)r块切换方法瞬态窗长窗2x8短窗1024时间MDCT...频率,时间1024谱系数128谱系数9声学模型声学模型•生理声学模型–非常复杂,加速算法实用效果不佳;–可以用于音质客观测试(采用高阶滤波器仿真人耳特性,仍然非常耗时)•心理声学模型–MPEG模型1和模型2;–基于MPEG模型2各种改进型

7、;–其它方式利用心理声学模型,如TwinVQ等;10心理声学心理声学模型模型--临临界界频带频带2éæföùz(f)=13arctan(0.00076f)+3.5arctanêç÷ú(Bark)êè7500øú11ëû心理声学心理声学模型模型--绝绝对对掩掩蔽蔽门限门限2-0.8-0.6(f/1000-3.3)-34T(f)=3.64(f/1000)-6.5e+10(f/1000)(dBSPL)q12心理声学心理声学模型模型--三三种种掩掩蔽蔽现象现象•时域掩蔽:预掩蔽和后掩蔽•频域掩蔽(同时掩蔽)13心心

8、理理声学模型声学模型--一个同时(频域)掩蔽的例子14预预回回声声控控制制方法方法•比特池;•增益调整;•窗切换;•时域噪声整形(TNS);•混合、切换滤波器组;15感觉感觉熵熵贝尔实验室的Johnston定义了感觉熵(PE):对CD质量音乐节目统计计算结果:透明压缩给出了近似2.1比特/样点16量量化化和和熵熵编码编码•量化技术:–线性:MPEG-1/2层1和2、PAC等–非线性:MPEG-1/2层3、MPEG

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。