欢迎来到天天文库
浏览记录
ID:41107842
大小:26.59 KB
页数:6页
时间:2019-08-16
《ATRAC体系压缩原理介绍》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、ATRAC是一种数字音频压缩算法,其全称是Adaptive Transform Acoustic Coding——自适应声学编码,它主要是基于声学心理学(Psychoacoustics)原理,积极的利用人耳听觉的特性,将信号中人耳感觉不到的不进行编码和传送,从而实现减少数据传输率的目的。下面笔者将具体介绍ATRAC编码和解码的过程。 我们通常一提到数据压缩方法,大家都会想到删除冗余部分这种基本方法。例如,我们在一同种音量频率持续的音乐段中,假定用二进制补码表示的原始信号是11111……11共计64个1
2、,不压缩的话,这段信号将会占用8个字节,若用64*1来表示可能2个字节就够了。假如我们如果定义音乐段内所有取样的值本身都是1,只有得0的部分才被记录到存储介质中,那我们记录这一音乐断只需一个时间轴标识即可,根本不占用空间。这就是删除冗余的基本思路,由它压缩过的数据可以完全被重建,是一种无损失的压缩方法。但是现实中的音频信号是很复杂的,如果真的采用这种方法进行压缩,其效率是很低的——只是根据音阶无数次的重新定义并记录基准值就是一项浩瀚的工作了,而且能不能真正的节省存储空间也是个问号,因此使用这种方法是有限
3、制的。 数字音频专家发现,在原始信号和经过压缩——解压缩过程处理的信号是允许有差别的,只要使人们不能轻易体察到这种差别同样可以达到高保真的要求。换句话说,只要使处理后的信号(原来信号加上噪声的)中噪声部分的能量尽可能减小至不被听到就是成功的编码方法(噪声指的是经压缩——解压缩过程后的信号与原始信号的差别)。 但是经过声学心理学的仔细研究,发现噪声被感知的能力并不是简单的数字能表示的。人们感觉到的噪声大小会因噪声的频率及很多动态因素而有很大的不同,改变某些加给噪声的情况竟然也会使人耳对其与原来的差别感
4、觉不出来。在ATRAC中主要应用声学心理学的三个主要内容来进行数据压缩的。 1. 去除处于听阈以下的部分并根据等响度曲线优化比特分配。声音要达到一定的声压级才能被听到,这一最小可听声压级就被称为听阈,它表述了人们听觉的绝对感觉。人的听阈虽然有个体差异,但其统计值却非常接近。声强超过听阈时,随声强的增加主观上产生由越来越响感觉。这里声强是客观刺激量,响度是听觉的主观心理量。声音的频率不同,人感受到的响度并不相同。通常以40dB的1000Hz纯音作为基准,并将此时的响度定义为1sone(1sone对应的响
5、度级为40phon),声音的频率不同它和基准音等响的声压级也不同。比较不同纯音和基准音等响时的声压级随频率变化的曲线成为等响曲线(Equi-loudness Curves),如图1所示。 图中虚线为听阈,虚线以下为人依靠双耳不能感知的声音。从图中可以看出人耳响度听觉得一些特性:响度取决于声强,提高声强,响度等级相应提高,但声音的响度并不唯一决定于声强,还受频率的影响。不同频率的纯音有不同的响度增长率,在曲线的最小值点及其周围的有限邻域就是人耳最敏感的频率范围(4kHz左右),ATRAC对于这个范围内的
6、信号应有较少的噪音,尽量保持原始信号;不过对于不敏感的部分则可以容忍一定程度的失真。 2. 去除由于掩蔽效应造成听阈提高而无法被感知的信号。当人们同时听两个声音时,其中一个声音的感受会随着另一个声音的出现而改变。由于其它声音的干扰造成该声音听阈上升的现象叫做掩蔽效应(Masking)。掩蔽效应与听觉传导系统(人耳机耳内组织)无关,纯属人类神经系统判断的结果。假定对声音A的阈值已经确定为50dB,但同时又听到声音B,人们发现由于声音B的影响使A的听阈提高到了64dB,即比原来的阈值提高了14dB才能被听
7、到。这个例子中,B称为掩蔽声,A称为被掩蔽声,14dB被称为掩蔽量。由一个纯音引起的掩蔽大体上决定于它的强度和频率,低频声能有效的掩蔽高频声,但高频声对低频声的掩蔽作用不大。通过窄带噪声进行的掩蔽效应试验结果表明,如图2掩蔽量随掩蔽声的增强而加大,最大掩蔽量出现在掩蔽声频率附近。当掩蔽声和被掩蔽声同时作用时掩蔽的效果最明显,被称为同时掩蔽。但掩蔽效应可以发生在两者不同时作用的条件下。掩蔽声作用在前,被掩蔽声作用在后的称为前掩蔽,反之为后掩蔽,如图3。被掩蔽声在时间上越接近掩蔽声,阈值提高越大。掩蔽声和被
8、掩蔽声在时间上相距很紧时,后掩蔽作用大于前掩蔽。且掩蔽声强度增加并不带来掩蔽量的相应增加,这与同时掩蔽效果不同。在这里有两个重要的结论对ATRAC编码中依靠掩蔽效应建立声学模型有着重要意义。强信号的频率与弱信号相同或比它高时,同时掩蔽最有效;强信号停止比较长的时间里后掩蔽有效,但前掩蔽只在强信号开始之前的2~3ms内有效。 3. 明确由临界频带确定的频带噪声对纯音的掩蔽。当频带噪声的频带不太宽时,掩蔽曲线更具对称性,并且不受频率的影响。只
此文档下载收益归作者所有