多媒体技术应用2音频处理技术(陈永强)

多媒体技术应用2音频处理技术(陈永强)

ID:41110862

大小:3.95 MB

页数:78页

时间:2019-08-16

多媒体技术应用2音频处理技术(陈永强)_第1页
多媒体技术应用2音频处理技术(陈永强)_第2页
多媒体技术应用2音频处理技术(陈永强)_第3页
多媒体技术应用2音频处理技术(陈永强)_第4页
多媒体技术应用2音频处理技术(陈永强)_第5页
资源描述:

《多媒体技术应用2音频处理技术(陈永强)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、1多媒体技术应用数学与计算机学院陈永强Email:chenyqwh@163.com2013-2014-22第二章音频处理技术2.1音频基本原理2.1.1人类听觉特性2.1.2数字音频2.1.3声音2.1.4语音2.2常用音频压缩标准2.2.1音频压缩基础2.2.2常用音频压缩标准2.2.3音频文件格式2.3音频处理软件Audition2.3.1功能介绍2.3.2编辑环境2.3.3基本操作3第二章音频处理技术2.1音频基本原理2.1.1人类听觉特性2.1.2数字音频2.1.3声音2.1.4语音4近十年来,随着计算机技术

2、的高速发展,以及能同时满足数字信号的高压缩率和数字信号的高保真透明重放质量的压缩算法及标准得到大量开发与使用,数字音频已经广泛应用于因特网、多媒体及无线通信系统,CD品质的数字音频已经从根本上替代了模拟音频。因此,人们对音频信号数字化处理提出了越来越高的要求,相应软硬件实现手段的效率也在不断提高。52.1.1人类听觉特性音频信号的感知过程与人耳的听觉系统密不可分。对于人类听力感知的研究,其范围从人耳的生理设计到大脑对听觉信息的解释。当前,大部分感知音频的编码算法都是基于心理声学模型的。62.1.1人类听觉特性1.听阈

3、与听域2.音调3.响度和响度级4.绝对听觉门限5.临界频带6.同时掩蔽7.异时掩蔽8.感知熵72.1.1人类听觉特性1.听阈与听域听阈(AuditoryThreshold)就是指人能听到的最低声压级(SoundPowerLevel,SPL)。听域(AudibleArea)是指人能感知的声音的范围,正常人耳能够感知的频率范围大致是20Hz~20kHz;正常人能感知声音的声压级范围是0~128dB。8图2-1听阈-频率曲线92.1.1人类听觉特性2.音调音调(Pitch)在物理学中是指声音的高低,实际上就是指人耳对不同频

4、率声音的一种主观感受。音调主要由声音的频率决定,同时也与声音强度有关。频率高的声音,人感觉其音调也较高,反之,人感知音调低的声音其频率也低。对音调可以进行定量的判断,其度量单位为美(Mel),定义一个声压级为40dB,频率为1kHz的纯音的音调为1000Mel。102.1.1人类听觉特性3.响度和响度级响度(Loudness)是人耳感受声音强弱的主观感觉程度,这种感觉与音强、频率和波形都有关系,其度量单位为宋(Sone),定义一个声压级为40dB,频率为1kHz的纯音的响度为1Sone。响度级(LoudnessLev

5、el)是指某响度与基准响度相比的等级,其度量单位为方(Phon),定义1kHz纯音的响度级为1Phon。11图2-2人耳可听最小响度曲线122.1.1人类听觉特性4.绝对听觉门限绝对听觉门限(AbsoluteThresholdofHearing,ATH)指一个人在没有噪声的环境下,能够产生听觉,感知到一个纯音信号(某频率点)的最小能量幅度。绝对听觉门限用声压级表示,静音为0dB,痛阈为140dB。13图2-3绝对听觉门限曲线142.1.1人类听觉特性5.临界频带指一个纯音可以被以它为中心频率,并且具有一定频带宽度的连

6、续噪声所掩蔽,在这一频带内噪声功率等于该纯音的功率。使该纯音处于刚能被听到的临界状态,即称这一带宽为临界频带宽度。临界频带的单位为巴克(Bark)。152.1.1人类听觉特性6.同时掩蔽掩蔽效应是指当两个响度不等的声音作用于人耳时,响度较高的频率成分的存在会影响到对响度较低的频率成分的感知。当两个或更多的音频信号到达人内耳时,掩蔽声与被掩蔽声同时作用发生掩蔽效应,就称同时掩蔽。162.1.1人类听觉特性7.异时掩蔽指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现的情况下。若掩蔽声音出现之前的一段时间内发生掩蔽效应,则称为超

7、前掩蔽,否则称为滞后掩蔽。172.1.1人类听觉特性8.感知熵感知熵(PerceptualEntropy)指利用心理声学的掩蔽现象和信号能量化原理来测量音频信号中感知相关的信息。一般以位(bit)作为单位,实际上表示了音频信号压缩的理论极限。182.1.2数字音频音频信号是时间和幅度都连续变化的一维模拟信号,要想在计算机中对它进行处理,就要将它变成时间和幅度都是离散的数字信号,所以数字音频是指音频信号经过离散化处理后再用一系列的数字来表示的信号,其特点是保真度好,动态范围大。数字音频可分为波形声音、语音和音乐。波形声

8、音实际上包含了所有的声音形式,因此数字音频有时也泛称为声音。192.1.2数字音频用计算机来处理音频信号必须将模拟音频信号转换成有限个数字表示的离散序列,过程为:选择采样频率,即进行采样;选择分辨率,即进行量化;最后编码形成声音文件。声音的采样与量化如图所示。202.1.2数字音频1.采样采样(Sampling)指把模拟信号在时域上以固定的时间

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。