欢迎来到天天文库
浏览记录
ID:48219234
大小:721.00 KB
页数:22页
时间:2020-01-23
《研究音频的本质,详解各种音频格式的区别.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、研究音频的本质,详解各个音频格式的区别总共分为6个部分,分别是wav格式的介绍,有损格式的介绍,无损压缩格式的介绍,各音频格式的频谱分析,以及基于分析在音频文件选择上做的推荐,后添加有损压缩格式的比较。1.wav音频格式的三大参数,及各参数对于音频文件的含义wav文件有4个参数,分别是采样频率,声道数,量化位数,以及码率共4个而这4个参数里最好理解的就是声道数,所以不对此参数进行介绍那么我将要介绍的参数就是采样频率F,量化位数B,和码率R采样频率在三个参数里面最重要的是采样频率,后面两个参数都是基于在传输
2、存储过程中根据要求而得到的,唯独采样频率,它是把模拟世界的信号带到数字世界的桥梁。在讲采样频率前,我们可以先回忆一下我们初中时学抛物线时的情景。在初中时,老师教我们画抛物线时,是用什么方法画的??如果大家回想起来的话,就应该记得,是5点法。是的,用5个点就可以近似的把抛物线给画出来。音频信号是啥呢?其实是余弦波,只是这个余弦波的频率和幅值都是随时间的变量而已。我们要对这个音频信号进行记录,不可能把每一时刻的值都记录,但是,我们可以参考画抛物线的方法,用尽量少的点去精确的描绘这个音频信号。而采样频率,它干的
3、就是这个活,也就是一秒内我们要记录这个音频信号多少个点,就能近似精确的表达这个音频信号。在信号处理,有这么一个定理,叫奈奎斯特定理。这个定理怎么得来,你们不用知道,这个是信号处理专业的人才需要知道。我们只需了解的是,这个定理它告诉我们,如果我们要精确的记录一个信号,我们的采样频率必须大于等于音频信号的最大频率的两倍,记住,是最大频率。也就是F>=2*fmax。而在wav格式里,F=44.1kHz。我们知道,人耳的听音频率范围是20-20kHz,也就是说,如果我们要精确记录这个音频信号,采样频率最低起码是4
4、0kHz。这就是为啥是44.1kHz而不是其他的频率。量化位数虽然有了采样频率,我们可以精确记录音频信号,然而,这些记录过的音频信号是模拟量,对于计算机而言,是无法处理的。讲到这里,我们会出现一个新的概念,模拟量和数字量。模拟量和数字量是有区别的,我简单的介绍一下。例如0-1这个范围。一个线段内我们可以任意的取一个点,这个点的值可以确定,这个点的取值范围可以确定,唯独这个点的可取值的个数无法确定,这就是模拟量。一个可能取值个数无法确定的量,计算机是无法处理的。而数字量则是其余一样,第三点不一样,可取值的个
5、数是可以确定的,这样,计算机可以处理了。0-1这个范围,根据精度要求,我们可以确定需要取值的个数。而量化位数,这是干这活,确定音频信号的一个记录点,它的取值的可能个数。我们知道,wav的量化位数B是16,这个是一个2进制的位数。他告诉我们,一个记录点可以取值的个数是2的16次方,也就是65536。(0-1-平分65536次,我想,这个精度也是够了。)码率现在,采样频率和量化精度都讲了,轮到码率。码率是怎么得来的?非常简单,就是采样频率X量化位数X声道数,也就是R=F*B*2。R=44.1kHz*16b*2
6、=1411.2kbps~=1411kbps。码率1411就是这么得来的,虽然码率是通过计算得到,但是,他却有一个确切的含义,就是一秒内它能存储的信息量,记住是信息量。讲到这里,大家可能会联想到,MP3的320kbps,aac的512kbps,无损压缩格式的700+kbps。然后有人疑惑,是不是,码率越大就越好??对于有损格式而言,那么,码率越大是越好然而,这里有一个前提,被转换的歌必须是从正版cd刻录下来的无损格式,并且转换是同一种有损格式,例如都是MP3。不然,你用一个128kbs的MP3的歌转成320
7、kbps码率的MP3,音质是不会有改善的。对于无损压缩格式而言,码率的大小比较将没有意义。码率的大小只是告诉你,他的压缩算法是否足够好而已。码率的意义也就这样,他不能告诉你,这些保存的信息是好是坏,他只能告诉你,他存了这么多信息而已。是的,他其实是一个仓库,他不管仓库里放的啥,他只管放满没。好了,到此,wav格式的三大参数都讲完了,也许会有很多人疑惑,为啥先讲wav这个这么古董的格式,而不是MP3啊aac啦这些有损格式,或者flac、ape这些无损压缩格式。理由很简单,因为wav是最接近模拟量的数字量,是
8、最原始的数据,后面的格式都是基于wav根据自己的特色进行处理而已。而且,上面讲到的三个参数,后面的格式依然用到。自然,先把wav这个老大先介绍咯。2.有损格式的压缩原理在这部分里以及后面的无损格式压缩原理,不专门对某个格式讲行介绍,而是介绍,这些格式是基于什么理念得到。当我们了解wav格式三大参数的含义后,可能有人会疑惑,既然wav是最接近模拟量的数字格式,为啥还整来后面的有损格式和无损格式呢,直接wav多好啊。是的,直接wa
此文档下载收益归作者所有