多媒体技术基础3版章mpeg声音

多媒体技术基础3版章mpeg声音

ID:27413492

大小:655.50 KB

页数:42页

时间:2018-12-02

多媒体技术基础3版章mpeg声音_第1页
多媒体技术基础3版章mpeg声音_第2页
多媒体技术基础3版章mpeg声音_第3页
多媒体技术基础3版章mpeg声音_第4页
多媒体技术基础3版章mpeg声音_第5页
资源描述:

《多媒体技术基础3版章mpeg声音》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多媒体技术基础(第3版)第11章MPEG声音张奇复旦大学计算机科学技术学院qz@fudan.edu.cn2011年4月2021年6月30日第11章MPEG声音2/42第11章MPEG声音目录11.1听觉系统的感知特性11.1.1.对响度的感知11.1.2.对音高的感知11.1.3.掩蔽效应11.2感知声音编码11.2.1MPEG声音的压缩依据11.2.2感知子带编码11.2.3杜比数字编码11.3MPEG-1Audio11.3.1声音编码11.3.2声音的性能11.3.3子带编码11.3.4多相滤波器组11.3.5编码层11.4MPEG-2Audio11.4.1MP

2、EG-2Audio简介11.4.2MPEG-2Audio使用的环绕声11.4.3MPEG-2Audio的后向兼容结构11.5MPEG-2AAC11.5.1MPEG-2AAC是什么11.5.2MPEG-2AAC编解码器的结构11.5.3MPEG-2AAC的类型11.6MPEG-4Audio11.6.1MPEG-4Audio是什么11.6.2MPEG-4Audio工具与文档11.6.3MPEG-4话音(speech)编码11.6.4MPEG-4声音(audio)编码11.6.5MPEG-4声音无损压缩2021年6月30日第11章MPEG声音3/42第11章MPEG声音前

3、言MPEG声音的数据压缩和编码不是依据波形本身的相关性和模拟人的发音器官的特性,而是利用人的听觉系统的特性来达到压缩声音数据的目的,这种压缩编码称为感知声音编码进入20世纪80年代,人类在利用自身的听觉系统的特性来压缩声音数据方面取得了很大的进展,先后制定了MPEG-1Audio,MPEG-2Audio,MPEG-2AAC和MPEG-4Audio等标准[1][2][3][4],并把它们统称为MPEG声音。本章涉及的许多具体算法已经超出本教材的要求。为给需要深入研究和具体开发产品的读者提供方便,本章提供了大量宝贵的参考文件和站点地址2021年6月30日第11章MPEG

4、声音4/4211.1听觉系统的感知特性对响度的感知声音的响度就是声音的强弱在物理上,用dyn/cm2(达因/平方厘米)(声压)或W/cm2(瓦特/平方厘米)(声强)度量在心理上,主观感觉的声音强弱使用响度级“方(phon)”或“宋(sone)”来度量这两种计量单位完全不同,但它们之间有一定的联系人耳的听觉范围听阈:当声音弱到人耳朵刚可听见时的声音强度痛域:声音强到使人耳感到疼痛时的声音强度听觉范围:位于听阈和痛域之间,见图11-12021年6月30日第11章MPEG声音5/4211.1听觉系统的感知特性(续1)图11-1“听阈—频率”曲线和“痛阈—频率”曲线2021

5、年6月30日第11章MPEG声音6/4211.1听觉系统的感知特性(续2)对音高(频率)的感知客观上用频率表示声音的音高,其单位是Hz。而主观感觉的音高单位则是“美(Mel)”。主观音高与客观音高的关系为其中,f的单位为Hz,Hz和Mel不同但有联系人耳对频率的感知范围,可以听到最低频率约20Hz最高频率约20000Hz2021年6月30日第11章MPEG声音7/4211.1听觉系统的感知特性(续3)音高-频率曲线测量主观音高时,让实验者听两个声强级为40dB的纯音,固定其中一个纯音的频率,调节另一个纯音的频率,直到他感到后者的音高为前者的两倍,就标定这两个声音的音

6、高差为两倍。测出的“音高—频率”曲线见图11-2图11-2“音高—频率”曲线2021年6月30日第11章MPEG声音8/4211.1听觉系统的感知特性(续4)掩蔽效应一种频率的声音阻碍听觉系统感受另一种频率的声音的现象前者称为掩蔽声音(maskingtone)后者称为被掩蔽声音(maskedtone)掩蔽可分成频域掩蔽和时域掩蔽频域掩蔽一个强纯音掩蔽在其附近同时发声的弱纯音的特性,也称同时掩蔽(simultaneousmasking),如图11-3所示2021年6月30日第11章MPEG声音9/4211.1听觉系统的感知特性(续5)图11-3频域掩蔽2021年6月3

7、0日第11章MPEG声音10/4211.1听觉系统的感知特性(续6)图11-4中的一组曲线表示为250Hz,1kHz和4kHz纯音的掩蔽效应,它们的声强均为60dB250Hz,1kHz和4kHz附近,对其他纯音的掩蔽效果最明显低频纯音可有效地掩蔽高频纯音,相反则不明显图11-4不同纯音的掩蔽效应曲线2021年6月30日第11章MPEG声音11/4211.1听觉系统的感知特性(续7)临界频带(criticalband)人耳刚可感知两种频率的声音有差别的频率范围通常认为声音(audio)有25个临界频带,见表11-1临界频带的宽度随声音频率的变化而变化在低频端,宽度

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。