主流有损音频格式横评

主流有损音频格式横评

ID:8979904

大小:2.19 MB

页数:16页

时间:2018-04-13

主流有损音频格式横评_第1页
主流有损音频格式横评_第2页
主流有损音频格式横评_第3页
主流有损音频格式横评_第4页
主流有损音频格式横评_第5页
资源描述:

《主流有损音频格式横评》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、主流有损音频格式横评By咣輝のま裔http://blog.sina.com.cn/u/1669168344转载请注明作者信息,谢谢。无聊做下各种音频格式的测试,发上来给大家分享下,独家首创,不喜勿喷,谢谢。这次用到的工具主要有AdobeAuditionCS6和BeyondCompare需要软件的请自行网上搜索首先,打开AdobeAuditionCS6在首选项里把频谱频率显示的分辨率选到最高,也就是16384,这样做能使频谱变得精致,更精确的反映音频的素质。接着右键右边的频率栏选择完全线性,然后再选择更多对数5次左右。说明:虽然如果选择完全对数显示比较夸张,但是频率间的差距都是用

2、对数来比较的,而不是差值。100hz和500hz;20100hz和20500hz之间都只差400hz,一个差距很大,一个只是差了一点而已。大家平常都用着完全线性这种显示来鉴别无损等等,确实高频部分比较直观,但是如果用这个来体现有损音频的品质,就极其的不合适了。(自行脑补声学和对数。。。)Audition提供了21个级别,如果说完全对数的显示方式为level0,完全线性的显示方式为level20的话,Auditioncs5.5和cs6默认的显示方式为level7,也就是更接近于对数。而Audition3的默认是完全线性的。一般来说为了直观的表现音频的整体素质,推荐设置为level

3、10到level15之间,而不是绝对线性这种不合适的设定。So,我在这里设为level15,希望大家一定要注意,别跟我说我后面的频谱有问题哦!!!说到这里大家肯定觉得我又要开始看频谱了。我只想说看频谱什么的都弱爆了。你能看出什么差距来么?高频被砍了一刀,中频坑坑洼洼。某某某这么小的码率,居然频谱如此好看,真是太强了。看似不错就真的不错了么?频谱:这是一个音频数据的直观视图。横轴时间,纵轴频率,还用颜色的明暗展现了振幅的大小(声音的大小)声音的要素都在这里了,频谱足以从视觉的角度完全的展现音频的素质。但是肉眼凡胎,跟你听音乐一样,除了特别明显的地方,你又能看出多少差别。某些看似不

4、错的频谱隐藏着许多你看不出的差别。废话不多说,这次测试用的无损音频是杜雯媞和王艺翔唱的“雪”这首歌属于男女对唱,频谱比较丰满,直达22k,有低潮,有高潮,高潮部分波形图直达0db,比较适合用来有损格式的测试。先上原wav文件的频谱图。接着上无损FLAC的对比图片:图挂了?这黑压压的是什么?这是WAV和FLAC频谱的对比图片,黑色表示没有差别。这图怎么来的?首先用AdobeAudition打开wav和flac文件,分别截取频谱图(用qq截得,能根据窗口截图,保证两次截图对齐),保存为无损格式(切记),比如bmp或者png。接着要介绍我刚刚说的BeyondCompare。这是一个文

5、件对比软件,能比较各种文件。自行搜索下载。安装完以后,选择刚刚保存的wav和flac频谱的截图,右键比较即可。打开后记得如下设置。箭头处选上。容差:表示允许的颜色差值最大值。最大255,即2的8次方减一,这涉及到位图的结构,我就不详细解释了。总之,容差相当于你对声音大小的敏感程度。越低的码率,应该设置越大来便于观察。为了保持一致性和可对比性,本文全部设为3。大家也可以设置成其他值观察对比。最后提醒下各位,某些有损格式和wav在时间长度上有毫秒级的差别,这是为了对齐到某个时间长度照成的。这会使得频谱横轴不同,照成显示上的略微差别,虽然AuditionCS6也可以打开各种有损格式,

6、但我们还是应该自己手动转换回wav格式,这时时间长度会恢复。好了FLAC打完酱油可以走了。。。256K大混战文件格式大小平均码率MP3VBRV06.85M254kbpsOggq8.26.96M258kbpsNeroaacvbr0.696.93M256kbpsQaactvbr1106.72M248kbpsQaaccvbr2567.01M258kbps需要频谱截图的到这里打包下载:接下来我要上各个有损格式的频谱跟原音频频谱的对比图片了,黑色表示基本没差,红色表示有差别,容差一律为3。MP3VBRV0点评:同码率对比,mp3格式在4K以下表现最为优秀,4K以上逐渐削弱,到了16K以上

7、削弱加剧。整体听感略微发闷。Oggq8.2点评:19K以后开始削弱,整体平衡,中规中矩,表现好于mp3Neroaacvbr0.69点评:10K以下的表现让人眼前一亮,10K到18k表现良好,18K以后基本切掉。如果你的纵轴是完全线性的,那你可能不会觉得Neroaac有多优秀。但在我看来,恰恰得益于抛弃了18k以上,使其在人耳敏感的部分发挥出了最佳的水平,推荐格式最后再插一句,觉得听不到18k以上的童鞋,推荐用vbrq0.74,其18k以下的水准能达到vbrq0.82左右的水平。觉得自己能听的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。