多媒体技术Chapter12

多媒体技术Chapter12

ID:39296539

大小:1.80 MB

页数:89页

时间:2019-06-29

多媒体技术Chapter12_第1页
多媒体技术Chapter12_第2页
多媒体技术Chapter12_第3页
多媒体技术Chapter12_第4页
多媒体技术Chapter12_第5页
资源描述:

《多媒体技术Chapter12》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第12章MPEG声音MPEG-1和MPEG-2的声音数据压缩编码是利用人的听觉系统的特性来达到压缩声音数据的目的,该压缩编码称为感知声音编码(perceptualaudiocoding)。制定了MPEG-1Audio,MPEG-2Audio和MPEG-2AAC等标准。1声音的响度就是声音的强弱。在物理上,声音的响度使用客观测量单位来度量,即dyn/cm2(达因/平方厘米)(声压)或W/cm2(瓦特/平方厘米)(声强)。在心理上,主观感觉的声音强弱使用响度级“方(phon)”或者“宋(sone)”来度量。这两种感知声音强弱的计量单位是完全不同的两种概念,但

2、是它们之间又有一定的联系。12.1.1对响度的感知12.1听觉系统的感知特性2当声音弱到人的耳朵刚刚可以听见时,我们称此时的声音强度为“听阈”。例如,1kHz纯音的声强达到10-16w/cm2(定义成零dB声强级)时,人耳刚能听到,此时主观响度级定为零方。听阈是随频率变化的。测出的“听阈—频率”曲线如图12-01所示。图中最靠下面的一根曲线叫做“零方等响度级”曲线,也称“绝对听阈”曲线,即在安静环境中,能被人耳听到的纯音的最小值。12.1.1对响度的感知3另一种极端的情况是声音强到使人耳感到疼痛。如果频率为1kHz的纯音的声强级达到120dB左右时,人的

3、耳朵就感到疼痛,这个阈值称为“痛阈”。对不同的频率进行测量,可以得到“痛阈—频率”曲线,如图12-01中最靠上面所示的一根曲线。这条曲线也就是120方等响度级曲线。12.1.1对响度的感知4在“听阈—频率”曲线和“痛阈—频率”曲线之间的区域就是人耳的听觉范围。由图12-01可以看出,1kHz的10dB的声音和200Hz的30dB的声音,在人耳听起来具有相同的响度。人耳对不同频率的敏感程度差别很大,其中对2kHz~4kHz范围的信号最为敏感,幅度很低的信号都能被人耳听到。而在低频区和高频区,能被人耳听到的信号幅度要高得多。12.1.1对响度的感知5图12-

4、01“听阈—频率”曲线12.1.1对响度的感知6客观上用频率来表示声音的音高,其单位是Hz。主观感觉的音高单位则是“美(Mel)”,主观音高与客观音高的关系是其中f的单位为Hz,这也是两个既不相同又有联系的单位。12.1.2对音高的感知12.1听觉系统的感知特性7人耳对响度的感觉有一个范围,从听阈到痛阈。人耳对频率的感觉也有一个范围。人耳可以听到的最低频率约20Hz,最高频率约18000Hz。正如测量响度时是以1kHz纯音为基准一样,在测量音高时则以40dB声强为基准,并且同样由主观感觉来确定。音高与频率之间也不是线性关系。测出的“音高—频率”曲线如图1

5、2-02所示12.1.2对音高的感知8图12-02“音高—频率”曲线12.1.2对音高的感知9一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应。前者称为掩蔽声音(maskingtone),后者称为被掩蔽声音(maskedtone)。掩蔽可分成频域掩蔽和时域掩蔽。12.1.3掩蔽效应12.1听觉系统的感知特性101.频域掩蔽一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽,如图12-03所示。从图12-03可以看到,声音频率在300Hz附近、声强约为60dB的声音掩蔽了声音频率在150Hz附近、声强约为40db的

6、声音。又如,一个声强为60dB、频率为1000Hz的纯音,另外还有一个1100Hz的纯音,前者比后者高18dB,在这种情况下我们的耳朵就只能听到那个1000Hz的强音。12.1.3掩蔽效应11如果有一个1000Hz的纯音和一个声强比它低18dB的2000Hz的纯音,那么我们的耳朵将会同时听到这两个声音。要想让2000Hz的纯音也听不到,则需要把它降到比1000Hz的纯音低45dB。弱纯音离强纯音越近就越容易被掩蔽。12.1.3掩蔽效应12图12-03声强为60dB、频率为1000Hz纯音的掩蔽效应12.1.3掩蔽效应13在图12-04中的一组曲线分别表示

7、频率为250Hz,1kHz和4kHz纯音的掩蔽效应,它们的声强均为60dB。从图12-04中可以看到:①在250Hz,1kHz和4kHz纯音附近,对其他纯音的掩蔽效果最明显;②低频纯音可以有效地掩蔽高频纯音,但高频纯音对低频纯音的掩蔽作用则不明显。12.1.3掩蔽效应14图12-04不同纯音的掩蔽效应曲线12.1.3掩蔽效应15由于声音频率与掩蔽曲线不是线性关系,为从感知上来统一度量声音频率,引入了“临界频带(criticalband)”的概念。在一个临界频带之内,很多心理声学特性都是一样的。在20Hz到16kHz范围内有24个临界频带,如表12-01所

8、示。临界频带的单位叫Bark(巴克),  1Bark=一个临界频带的宽度f(频率

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。