音频编解码原理讲解和分析报告报告材料

音频编解码原理讲解和分析报告报告材料

ID:28592348

大小:2.11 MB

页数:30页

时间:2018-12-11

音频编解码原理讲解和分析报告报告材料_第1页
音频编解码原理讲解和分析报告报告材料_第2页
音频编解码原理讲解和分析报告报告材料_第3页
音频编解码原理讲解和分析报告报告材料_第4页
音频编解码原理讲解和分析报告报告材料_第5页
资源描述:

《音频编解码原理讲解和分析报告报告材料》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实用标准文案音频编码原理讲解和分析作者:谢湘勇,算法部,xie.chris@qq.com2007-10-13简述2音频基本知识2采样(ADC)3心理声学模型原理和分析3滤波器组和window原理和分析6Window6TDAC:时域混叠抵消,timedomainaliasingcancellation7Longandshortwindow、blockswitch7FFT、MDCT8Seteroandcouple原理和分析8量化原理和分析9mp3、AAC量化编码的过程9ogg量化编码的过程11AC3量化编码的过程11Huffma

2、n编码原理和分析12mp3、ogg、AC3的编码策略12其他技术原理简介13比特池技术13TNS13SBR13预测模型14增益控制14OGG编码原理和过程详细分析14OggVorbis的引入14OggVorbis的编码过程14ogg心理声学模型15ogg量化编码的过程16ogg的huffman编码策略17主要音频格式编码对比分析19Mp319Ogg20AAC21AC322DRA(AVS内的中国音频标准多声道数字音频编码)23BSAC,TwinVQ24RA24音频编码格式的对比分析25主要格式对比表格如下26语音编码算法简介2

3、6后处理技术原理和简介28EQ28精彩文档实用标准文案SRSWOW29环境音效技术(EAX)293D30Dolby多项后处理技术30多声道介绍30简述音频编解码目前主流的原理框图如图1,下面我希望由浅入深的对各算法原理作一说明。音频基本知识§人类可听的音频频率范围为20-20khz§全音域可分为8度音阶(Octave)概念,每octave又可以分为12份,相当于1—7的每半音为一份(1/12octave)精彩文档实用标准文案§音调和噪音:音调有规律的悦耳的声音(如乐器的1—7),噪音是无规律的难听的声音。音调具有谐波分量,不

4、同的乐器对同一音调产生不同的谐波,所以我们产生不同的感觉,这叫做音色,不同的谐波也产生了音色的好坏。音质主要定义为噪音的多少。§主要的音频编解码对象是音乐、语音,一般采用不同的编解码算法来进行编码§音频的编解码的格式分类•无压缩的格式(PCM…)•无损压缩格式(APE,FLAC,LPAC,WMA_LS…)•有损音乐压缩格式(AAC,AACPlus,AC3,DTS,ATRAC,MP3,WMA,OGG,RA…)•有损语音压缩格式(AMR,GSM,LPC,SPEEX,CELP,G.7XX,ADPCM,…)•合成算法(MIDI,TT

5、S)§音频的编解码的目的:减少传输的信息量,减少储存的信息量采样(ADC)采样即将连续的信号转化为离散的量化信号,一般应用是ADC,音频编码内采样的频率一般有:fs=8k,11.025k,12k,16k,22.05k,24k,32k,44.1k,48k(hz)9种,96khz,192khz也有应用。根据奈归斯特定理,采样频率fs大于信号频率f的两倍时,可完全重构原信号,所以音域为20khz的音乐信号,一样采用fs=44.1khz采样率。采样混叠问题,由于采样会使信号的频谱产生2π为周期的周期扩展,所以信号的频率f>fs/2时

6、,会产生混叠效应,故一般进行采样需要增加低通滤波器,使输入信号频率小于fs/2。重采样的问题下面列出两问题作参考:1.将采样率为48khz的音频信号转化为24khz的信号,请问其处理过程?答案:先经过一低通滤波器(截止频率为π/2),再每两个信号抽取一个信号,产生24khz的信号.如果不进行低通滤波,则会产生混叠。2.将采样率为24khz的音频信号转化为48khz的信号,请问其处理过程?答案:先每个信号后插入一个0,再经过一低通滤波器(截止频率为π/2),产生48khz的信号.如果不进行低通滤波,则会产生原信号的映像,且最大

7、幅度下降,增加滤波可去除映像和实现对填充的零值平滑化。心理声学模型原理和分析心理声学模型是研究心理与声学的相关性,目前的主要研究成果是,1.低于一定频率或高于一定频率我们无法听到,一般人可听范围为(20hz-20khz)2.人的耳朵对在低于一定的声压级或高于一定的声压级的声音,我们无法听到,而最低的可听声压级,被称为绝对听觉阈值曲线l绝对听觉曲线近似方程:3.对不同频率同一声压级的声音人感觉的声音响度是不同的,同时不同年龄的人对同一声音其感觉的响度也会不同,小孩对低频和高频的感受能力都比老人要强烈很多。这里声音的实际能量大小

8、我们定义为声压级,人感觉的声音大小我们定义为响度。通常人对1k-4khz的声音感觉最敏感,而人的语音也大部分集中在这个频段。下图精彩文档实用标准文案为等响曲线,其中0的曲线是绝对听觉阈值曲线。l2.掩蔽性,即比较大的声音会掩蔽比较小的声音,掩蔽原理分:时域掩蔽、频域掩蔽。l频域掩蔽即同一时

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。