音频压缩的成功者——感知编码

ID：21021325

大小：55.00 KB

页数：5页

时间：2018-10-18

资源描述：

《音频压缩的成功者——感知编码》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、音频压缩的成功者——感知编码

2、第1内容显示中lunaskingtone)，后者称为被掩蔽声音(maskedtone)。掩蔽效应探讨的基础是感知编码中的一个重要的概念——临界频段，即人耳对不同频率段声音信号的反应灵敏程度有所差别。人耳中包含了约3万个毛细胞，它们能够检测到基膜的振动，通过生理脉冲将音频信息传到大脑，但这些细胞在不同频率的敏感程度不同，在低频区域对几赫兹的差异都能分辨出来，而在高频区域，必须要有几百赫兹的差别才能分辨。所以，一般毛细胞会对其周围的强刺激作出反应，这就是临界频段。实验结果表明，在低频区域临界频段比在高频区域临界频段窄，在低频

3、段临界频段很窄，频段宽度只有100Hz到200Hz，在高于5000Hz以后的临界频段的宽度有1000Hz至几万Hz的频段宽度。3/4临界频段低于5Khz，人耳可以接收到的低频信息高于高频信息。掩蔽可分成频域掩蔽和时域掩蔽。所谓频域掩蔽是指掩蔽声与被掩蔽声同时作用时发生掩蔽效应，即较强的声音信号可以掩蔽临近频段中同时发声的较弱的信号。这种特性称为频域掩蔽，也称同时掩蔽(simultaneousmasking)。这时，掩蔽声在掩蔽效应发生期间一直起作用，是一种较强的掩蔽效应。换言之，如果在某一频段中出现了一个较强的信号，那么该频段中所有低于某一门槛值的信

4、号都将被强信号掩蔽掉，成为人耳不可闻的信号。掩蔽特性与掩蔽音的强弱，掩蔽音的中心频率，掩蔽音与被掩蔽音的频率相对位置等有关。通常，频域中的一个强音会掩蔽与之同时发声的附近的弱音，弱音离强音越近，一般越容易被掩蔽；反之，离强音较远的弱音不容易被掩蔽。滤除这一弱信号将不会对音质产生不良影响，而且能减少编码后的数据量，所以可以把它们作为噪声信号来对待。除了同时发出的声音之间有掩蔽现象之外，在时间上相邻的声音之间也有掩蔽现象，并且称为时域掩蔽。所谓时域掩蔽是指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现时，又称异时掩蔽。时域掩蔽又分为超前掩蔽(pre-maski

5、ng)和滞后掩蔽(post-masking)，若掩蔽声音出现之前的一段时间内发生掩蔽效应，则称为导前掩蔽；否则称为滞后掩蔽。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。一般来说，超前掩蔽很短，只有大约5～20ms，而滞后掩蔽可以持续50～200ms。异时掩蔽也随着时间的推移很快会衰减，是一种弱掩蔽效应。如上图左图所示，当有黑线所示的某频率信号存在时，靠近它的本来可以听见的噪声B就变得听不见了，这种现象叫做频率掩蔽效应。而如右图所示，当某时刻有黑线所示的信号存在时，位于其后面的比它小一些的本来可听见的噪声E也变得听不见了，这种现象称为时

6、间掩蔽效应。这些两种效应合成的结果，就形成了实际的可闻阈。如下图所示：三、感知编码器1、感知编码器的特点感知编码器首先分析输入信号的频率和振幅，然后将其与人的听觉感知模型进行比较。编码器用这个模型去除音频信号的不相干部分及统计冗余部分。尽管这个方法是有损的，但人耳却感觉不到编码信号质量的下降。感知编码器可以将一个声道的比特速率从768kb/s降至128kb/s，将字长从16比特/取样减少至平均2.67比特/取样，数据量减少了约83%。感知编码器的有效性部分源自采用了自适应的量化方法。在PCM中，所有的信号都分为相同的字长，感知编码器则是根据可听度来分

7、配所使用的字长。重要的声音就分配多一些位数来确保可听的完整性，而对于轻言细语的编码位数就会少一些，不可听的声音就根本不进行编码，从而降低了比特速率。编码器的压缩率是输入的比特数与输出的比特数之比。一般常见的压缩率是4：1，6：1或12：1。一般感知编码采用两种比特分配方案。一种是前向自适应分配方案，所有的分配都在编码器中进行，这个编码信息也包含在比特流中。前向自适应编码的一个突出优点是在编码器中采用了心理声学模型，它只是利用编码数据完全地重建信号。当改进了编码器中心理声学模型时，可利用现有的编码器来重建信号。这种方法的一个缺点是需要占用一些比特位来传

8、递分配信息。在后向自适应分配方案中，比特分配信息可以直接从编码的音频信号中推导出来，不需要编码器中详细的分配信息，分配信息也不占用比特位。然而在解码器中的比特分配信息是根据有限的信息推导出来的，精度必然会降低。另外解码器相应也比较复杂，而且不能轻易地改变心理声学模型。感知编码有一定的抗噪性。在PCM中误差引入了宽带噪声，而对于许多感知编码器，根据预编码信号的典型带宽，噪声被限定在窄带内，因而限制了其强度。误差仅仅引入了一个低电平的噪声。感知编码系统还对目标噪声进行校正，例如对于极弱的声音、比较强的声音给予更多的保护。象任何编码系统一样，感知编码系统也

9、是综合存储量、传输速率等因素来考虑的合适的误差校正方案。由于感知编码器根据人耳的灵敏度来编码，它也可以输出放

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 5



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

音频压缩的成功者——感知编码

音频压缩的成功者——感知编码

相关文章

相关标签