音频压缩的成功者——感知编码

音频压缩的成功者——感知编码

ID:21021325

大小:55.00 KB

页数:5页

时间:2018-10-18

音频压缩的成功者——感知编码_第1页
音频压缩的成功者——感知编码_第2页
音频压缩的成功者——感知编码_第3页
音频压缩的成功者——感知编码_第4页
音频压缩的成功者——感知编码_第5页
资源描述:

《音频压缩的成功者——感知编码》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、音频压缩的成功者——感知编码

2、第1内容显示中lunaskingtone),后者称为被掩蔽声音(maskedtone)。掩蔽效应探讨的基础是感知编码中的一个重要的概念——临界频段,即人耳对不同频率段声音信号的反应灵敏程度有所差别。人耳中包含了约3万个毛细胞,它们能够检测到基膜的振动,通过生理脉冲将音频信息传到大脑,但这些细胞在不同频率的敏感程度不同,在低频区域对几赫兹的差异都能分辨出来,而在高频区域,必须要有几百赫兹的差别才能分辨。所以,一般毛细胞会对其周围的强刺激作出反应,这就是临界频段。实验结果表明,在低频区域临界频段比在高频区域临界频段窄,在低频

3、段临界频段很窄,频段宽度只有100Hz到200Hz,在高于5000Hz以后的临界频段的宽度有1000Hz至几万Hz的频段宽度。3/4临界频段低于5Khz,人耳可以接收到的低频信息高于高频信息。掩蔽可分成频域掩蔽和时域掩蔽。所谓频域掩蔽是指掩蔽声与被掩蔽声同时作用时发生掩蔽效应,即较强的声音信号可以掩蔽临近频段中同时发声的较弱的信号。这种特性称为频域掩蔽,也称同时掩蔽(simultaneousmasking)。这时,掩蔽声在掩蔽效应发生期间一直起作用,是一种较强的掩蔽效应。换言之,如果在某一频段中出现了一个较强的信号,那么该频段中所有低于某一门槛值的信

4、号都将被强信号掩蔽掉,成为人耳不可闻的信号。掩蔽特性与掩蔽音的强弱,掩蔽音的中心频率,掩蔽音与被掩蔽音的频率相对位置等有关。通常,频域中的一个强音会掩蔽与之同时发声的附近的弱音,弱音离强音越近,一般越容易被掩蔽;反之,离强音较远的弱音不容易被掩蔽。滤除这一弱信号将不会对音质产生不良影响,而且能减少编码后的数据量,所以可以把它们作为噪声信号来对待。除了同时发出的声音之间有掩蔽现象之外,在时间上相邻的声音之间也有掩蔽现象,并且称为时域掩蔽。所谓时域掩蔽是指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现时,又称异时掩蔽。时域掩蔽又分为超前掩蔽(pre-maski

5、ng)和滞后掩蔽(post-masking),若掩蔽声音出现之前的一段时间内发生掩蔽效应,则称为导前掩蔽;否则称为滞后掩蔽。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。一般来说,超前掩蔽很短,只有大约5~20ms,而滞后掩蔽可以持续50~200ms。异时掩蔽也随着时间的推移很快会衰减,是一种弱掩蔽效应。如上图左图所示,当有黑线所示的某频率信号存在时,靠近它的本来可以听见的噪声B就变得听不见了,这种现象叫做频率掩蔽效应。而如右图所示,当某时刻有黑线所示的信号存在时,位于其后面的比它小一些的本来可听见的噪声E也变得听不见了,这种现象称为时

6、间掩蔽效应。这些两种效应合成的结果,就形成了实际的可闻阈。如下图所示:三、感知编码器1、感知编码器的特点感知编码器首先分析输入信号的频率和振幅,然后将其与人的听觉感知模型进行比较。编码器用这个模型去除音频信号的不相干部分及统计冗余部分。尽管这个方法是有损的,但人耳却感觉不到编码信号质量的下降。感知编码器可以将一个声道的比特速率从768kb/s降至128kb/s,将字长从16比特/取样减少至平均2.67比特/取样,数据量减少了约83%。感知编码器的有效性部分源自采用了自适应的量化方法。在PCM中,所有的信号都分为相同的字长,感知编码器则是根据可听度来分

7、配所使用的字长。重要的声音就分配多一些位数来确保可听的完整性,而对于轻言细语的编码位数就会少一些,不可听的声音就根本不进行编码,从而降低了比特速率。编码器的压缩率是输入的比特数与输出的比特数之比。一般常见的压缩率是4:1,6:1或12:1。一般感知编码采用两种比特分配方案。一种是前向自适应分配方案,所有的分配都在编码器中进行,这个编码信息也包含在比特流中。前向自适应编码的一个突出优点是在编码器中采用了心理声学模型,它只是利用编码数据完全地重建信号。当改进了编码器中心理声学模型时,可利用现有的编码器来重建信号。这种方法的一个缺点是需要占用一些比特位来传

8、递分配信息。在后向自适应分配方案中,比特分配信息可以直接从编码的音频信号中推导出来,不需要编码器中详细的分配信息,分配信息也不占用比特位。然而在解码器中的比特分配信息是根据有限的信息推导出来的,精度必然会降低。另外解码器相应也比较复杂,而且不能轻易地改变心理声学模型。感知编码有一定的抗噪性。在PCM中误差引入了宽带噪声,而对于许多感知编码器,根据预编码信号的典型带宽,噪声被限定在窄带内,因而限制了其强度。误差仅仅引入了一个低电平的噪声。感知编码系统还对目标噪声进行校正,例如对于极弱的声音、比较强的声音给予更多的保护。象任何编码系统一样,感知编码系统也

9、是综合存储量、传输速率等因素来考虑的合适的误差校正方案。由于感知编码器根据人耳的灵敏度来编码,它也可以输出放

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。