多媒体技术基础与实验教程3

多媒体技术基础与实验教程3

ID:43521288

大小:1.03 MB

页数:43页

时间:2019-10-09

多媒体技术基础与实验教程3_第1页
多媒体技术基础与实验教程3_第2页
多媒体技术基础与实验教程3_第3页
多媒体技术基础与实验教程3_第4页
多媒体技术基础与实验教程3_第5页
资源描述:

《多媒体技术基础与实验教程3》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、多媒体技术基础与实验教程第三章音频处理技术第三章目录3.1数字音频基本原理3.1.1人类听觉特性3.1.2数字音频3.1.3声音3.1.4语音3.2常用音频编码算法和标准3.2.1音频信号编码基础3.2.2常用音频编码标准3.2.3国际音频标准化组织简介3.3音频文件格式3.3.1波形格式3.3.2MIDI格式3.3.3MP3压缩格式3.3.4流式音频格式3.4音频处理工具Audition3.4.1功能概述3.4.2编辑环境3.4.3基本操作3.1数字音频基本原理3.1.1人类听觉特性听阈与听域声压是声音在空气中传播而改变了空气原来的恒定静压力,导致了原

2、有静压力的微小增加。声压级为某一点的声压与参考声压的比值取常用对数后再乘以20的值,单位是分贝,即dB,是反映声音大小、强弱的最基本参量。听阈(AuditoryThreshold)就是指人能听到的最低声压级(SoundPowerLevel,SPL)。纯音的听阈与频率有关:1kHz纯音的听阈约为4dB,10kHz时听阈约为15dB,到40kHz时达到50dB左右。听域(AudibleArea)是指人能感知的声音的范围,正常人耳能够感知的频率范围大致是20Hz~20kHz;正常人能感知声音的声压级范围是0~128dB,这里基准声压级(0dBSPL)的定义是1

3、0-16W/cm2。声强是指单位时间(1秒钟)内声音通过垂直于声音传播方向单位面积(cm2)的声能量。听域—频率曲线在“听阈-频率”曲线和“痛阈-频率”曲线之间的区域就是人耳的听觉范围。音调音调(Pitch)是指人耳对不同频率声音的一种主观感受。人们定义一个高于听阈40dB、频率为1kHz的纯音的音调为1000Mel,这里Mel是音调的度量单位。响度和响度级响度(Loudness)是人耳感受声音强弱的主观感觉程度,这种感觉与音强、频率和波形都有关系,其度量单位为Sone,定义一个高于听阈40dB、频率为1kHz的纯音的响度为1Sone。响度级(Loudn

4、essLevel)是指某响度与基准响度相比的等级,其度量单位为Phon,定义1kHz纯音的声强级为1Phon。响度和响度级L之间满足以下转换关系:绝对听觉门限绝对听觉门限(AbsoluteThresholdofHearing,ATH)指一个人在没有噪声的环境下,能够产生听觉,感知到一个纯音信号(某各频率点)的最小能量幅度。通常绝对听觉门限用声压级表示(dB),静音为0dB,痛阈为140dB。绝对听觉门限曲线横坐标是频率,表示人所能听到的声音的频率范围纵坐标是声压级,表示所有低于门限的声音信号人类一般听不到临界频带临界频带(CriticalBand)是指一

5、个纯音可以被以它为中心频率,并且具有一定频带宽度的连续噪声所掩蔽,在这一频带内噪声功率等于该纯音的功率。这使该纯音处于刚能被听到的临界状态,即称这一带宽为临界频带宽度。临界频带的单位叫Bark(巴克)。频率<500Hz的情况下,频率>500Hz的情况下,临界频带频率(Hz)临界频带频率(Hz)低端高端宽度低端高端宽度0010010013200023203201100200100142320270038022003001001527003150450330040010016315037005504400510110173700440070055106301

6、20184400530090066307701401953006400110077709201502064007700130089201080160217700950018009108012701902295001200025001012701480210231200015500350011148017202402415500220506550121720200028025个临界频带同时掩蔽同时掩蔽(SimultaneousMasking)又称频域掩蔽,分为噪声掩蔽音调(NMT)、音调掩蔽噪声(TMN)和噪声掩蔽噪声(NMN)。掩蔽效应是指当两个响度不等

7、的声音作用于人耳时,响度较高的频率成分的存在会影响到对响度较低的频率成分的感知。当两个或更多的音频信号到达人内耳时,掩蔽声与被掩蔽声同时作用发生掩蔽效应,就称同时掩蔽。即在一个临界频带内,一个大的信号可以掩蔽掉若干小的信号,无论这个信号是音调还是噪音。声强为60dB、频率为1000Hz纯音的掩蔽效应声强为60dB、频率不同的纯音的掩蔽效应异时掩蔽异时掩蔽(NonsimultaneousMasking)又称时域掩蔽,是指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现的情况下。此时出现的一个强音频信号可以掩蔽到之前若干时间和之后若干时间的音频信号的感知,即导前掩蔽

8、或滞后掩蔽。而对之前音频信号的掩蔽效应衰减的很快,大概只能掩蔽到几毫秒,而对之后

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。