音频压缩技术

音频压缩技术

ID:38862798

大小:8.64 MB

页数:234页

时间:2019-06-20

音频压缩技术_第1页
音频压缩技术_第2页
音频压缩技术_第3页
音频压缩技术_第4页
音频压缩技术_第5页
资源描述:

《音频压缩技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、内容提要数字音频压缩技术引言听觉特性和声学基础性能评价和现有标准基于分析-综合的声码器MPEG音频压缩算法AC3音频压缩算法1引言:数字化数字化是趋势信息量非常大,高传输带宽或存储容量5.1声道环绕立体声:6×48KHz×16bits=4.608Mbit/s减少代表原始声音信号的信息量更好利用现有频率资源便于计算机处理和存储宽带网中高质量传输2引言:声音压缩编码理论基础冗余(Redundance)信号一部分可由另一部分重建或另外表达形式简单说明,称为信号有冗余去除冗余实现压缩编码信号冗余是变化的,故不能产生恒定码流输出不相关(Irrelevance)听觉不能感觉的那部分信号,它对声音

2、信号的确定或音色和发音位置没有贡献不相关信号部分不传输利用掩蔽效应来掩盖量化失真人耳听觉特性人耳分辨能力人耳对不同频段声音的敏感程度不同,通常对低频比对高频更敏感人耳对语音信号的相位不敏感人耳掩蔽效应MaskingEffect…3引言:语音信号的时域冗余度幅度非均匀分布小幅度样本出现的频率高样本之间的相关性当取样频率为8KHz时,相邻样本间的相关系数大于0.85;周期之间的相关性在特定瞬间,某段声音往往只是总频带300~3400Hz的少数几个频率分量在起作用象某些振荡波一些,在周期与周期之间存在一定的相关性基音之间的相关性男声基音周期为5~20ms,而典型的浊音持续100ms静止系

3、数(话音间隙)全双工话路的典型效率约为40%(静止系数为0.6)长期相关性(longtermcorrelation)如几十秒内的相关性4引言:语音信号的频域冗余度从频域考察语音信号的功率谱密度:非均匀的长时间功率谱密度长时间功率谱呈现强烈的非平坦性,高频能量较低时域上相邻样本相关语音特有的短时功率谱密度语音的短时功率谱,在某些频率出现峰值(该频率称为共振峰频率),在另外一些频率上出现谷值。出现共振峰的频率不止一个,最主要的是前两个,决定了不同的语音特征整个谱也随频率增加而递减功率谱的细节以基音频率为基础,形成高次谐波结构另外,人的声道形状及其变化规律是有限的按一定的时间段(帧)来

4、计算声道滤波器的参数或语音谱包络5引言:语音信号的短时功率谱浊音清音6内容提要数字音频压缩技术引言听觉特性和声学基础性能评价和现有标准基于分析-综合的声码器MPEG音频压缩算法AC3音频压缩算法7人类的发音器官人的发音器官由三个部分组成:(1)肺和气管产生气源;(2)喉和声带称为声门;(3)由咽腔、口腔、鼻腔组成的声道(从声带延展到嘴,成人平均声道长度为17cm)声带声道舌头嘴唇鼻腔通道肺当肺部中的受压空气通过声门沿着声道发出时就产生了话音声音的基音由声道的形状变化(主要通过移动舌头)和移动嘴唇控制。强度(响度)通过改变从肺部发出的气体的量改变。人的声音变化很慢,肺的操作很慢,声道的

5、形状变化很慢,所以语音的基音和强度变化也很慢。表现在相邻样本间很相似,即使是帧(20ms)也是强相关的。这种相关性正是语音压缩的基础。8人类的收音器官人的收音器官:外耳接受外界的声音,并沿着耳道引起鼓膜震动,中耳鼓膜的震动引起锤骨、镫骨和砧骨三块小骨相震动,将声音传到内耳,内耳可产生神经冲动,冲动沿听神经转为神经能,这样声音的信息就传到了大脑。一般情况下,音量达100dB时,时间较长可造成不可恢复性听力损伤;当音量高达110分贝时,足以使内耳毛细胞死亡,严重者会造成听力丧失。实际上,任何高于85分贝的声音都能造成听力损伤,每天8个小时90分贝,足以造成逐步和不可逆转的听力损伤9人对声

6、音强度的生理感觉强弱与声音信号强度大体成对数关系,从而引出声压级、声强级概念听觉特性:对不同强度的感觉10人对不同频率的声音感受强度不同,引出等响曲线和响度级(phon,方值)参量。听觉特性:对不同频率的响应11由等响曲线可以看出不同的声音强度,人的听觉频响不同!听觉特性:听觉频响12将不同强度的听觉频响典型曲线规范成计权曲线,用于模拟听觉频响听觉特性:计权曲线13掩蔽效应掩蔽效应:一个声音的存在掩蔽了另一个声音的存在掩蔽效应是一个较为复杂的心理和生理现像掩蔽程度与两个声音的相关性有密切联系分为频域效应和时域掩蔽效应准稳态(短时稳态)信号特性,利用频域掩蔽效应对于声音的时域结构特性,

7、利用时域掩蔽特性听觉特性:掩蔽效应(1)静音门限和掩蔽门限(灰色区域中的声音听不到)14人的听觉生理掩蔽效应,声音听起来才不显得混乱!较弱的听不见的声音信息就可以舍弃!而不必再进行编码,这是数字声码压缩的生理基础之一。听觉特性:掩蔽效应(2)15时域掩蔽效应(Temporalmaskingeffect):在时间上相邻的声音之间存在的掩蔽现象听觉特性:掩蔽效应(3)后向掩蔽:一个声音影响了在时间上先于它的声音的听觉能力同时掩蔽:在一定时间内一个声音对另一个声

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。