数字音频感知编码的心理声学模型_李琳琳new

数字音频感知编码的心理声学模型_李琳琳new

ID:34439533

大小:1.22 MB

页数:4页

时间:2019-03-06

数字音频感知编码的心理声学模型_李琳琳new_第1页
数字音频感知编码的心理声学模型_李琳琳new_第2页
数字音频感知编码的心理声学模型_李琳琳new_第3页
数字音频感知编码的心理声学模型_李琳琳new_第4页
资源描述:

《数字音频感知编码的心理声学模型_李琳琳new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、经验与交流EXPERIENCEANDEXCHANGECHINANEWTELECOMMUNICATIONS(TechnicalEdition)数字音频感知编码的心理声学模型李琳琳(同济大学微电子中心上海200092)摘要心理声学模型是感知编码的核心部分,它是一个模拟人耳听觉感知的数学模型。高质量数字音频信号感知编码的基本思想就是把量化噪声隐藏在与信号相关的闻阈以下。因此,本文系统介绍了心理声学模型的相关概念,并且详细讲解了信号经过心理声学模型的计算过程。关键词听觉阈值临界频带掩蔽一些正常听力的成年人所做的测试得出如下的非线1简介性函数逼近。2音频编码和音频压缩算法是为了获得高保真度-0.8

2、-0.6(f/1000-3.3)-3T(f)=3.64(f/1000)-6.5e+10q和宽带宽的音频信号,使之便于高效率传输和存储。4(f/1000)(dBSPL)音频编码的中心思想就是用最小的比特存储声音信T(f)可视为频域中可引入的最大可允许失真号,使之达到透明声音信号标准。由于CD标准已被q广泛接受,CD音质己经成为评价音频设备品质的一能量。种标准,称为“透明音质”。音频压缩技术就是对经过67页的图1所示是绝对听觉阈值曲线,低于该采样量化的PCM信号进行处理,力求压缩后的音频曲线的声音人耳是听不到的。数据量最小化,并同时达到所谓的“透明音质”,即解2.2临界频带码后的输出信号与原

3、先的输入信号不可分辨。用绝对阈值来控制编码失真只是感知编码的第一步,它代表了一个极限值。量化噪声的掩蔽阈值是2心理声学模型概述一个变量,它由激励信号决定。由于信号是时变的,2.1绝对听觉阈值所以掩蔽阈值也是时变的。为了估计这个阈值,我们绝对听觉阈值就是指无噪声的条件下一个纯音必须首先了解人耳是如何进行频谱分析的。内耳的能够被人耳听见所需要的最小能量。绝对听觉阈值基底膜和频率-位置是映射关系,也就是说一定频用dBSPL(SoundPressureLevel)这个单位来表示。该率的信号只对耳蜗中的一定部位产生激励。我们可阈值依赖于频率的大小,从1940年Fletcher经过对以把内耳看成一组

4、高度重叠的非等带宽的滤波器66CHINANEWTELECOMMUNICATIONS(TechnicalEdition)JUL2008No.13经验与交流EXPERIENCEANDEXCHANGECHINANEWTELECOMMUNICATIONS(TechnicalEdition)Z的单位为Bark。理想情100况下,把人耳的听觉范围分80为25个临界频带,一个临界频带就相当于1Bark。临界带LP60S宽在500Hz以下趋于恒定,Bd,40约为100Hz。而超过500Hz的级等临界带宽则相当于中心频率压20声的20%。02.3同时掩蔽和扩散掩蔽102103104同时掩蔽就是指在频率频率

5、(Hz)中的一种现象,无论何时两个或两个以上的频率接近的图1安静状态下的绝对听觉阈值曲线声音同时发生,弱音会被强组。那么,临界带宽就是能引起人耳主观感觉上变化音所掩蔽,人耳变得不可闻。取决于频谱的形状,某明显的带宽。些特定的频谱能量的声音会掩蔽其他频谱能量的声例如,在两个掩蔽的纯音之间有一个窄带噪声,音。尽管声音频谱可能包含着复杂的同时掩蔽信号,如图2(a)所示,只要两个纯音之间的间隔Δf不超但是为了减少编码失真,我们将同时掩蔽简单的分过临界带宽fcb时,噪声的最小听觉阈值恒定。如果频为音调掩蔽噪声和噪声掩蔽音调。音调掩蔽噪声,即率间隔超过临界带宽,窄带噪声的感知阈值迅速下一个发生在临界

6、频带中心的强大能量的音调掩蔽了降,如图2(c)所示。同样的,两个噪声掩蔽纯音的情相对微弱的噪声,使噪声在人耳感知阈值之下。噪声况见图2(b)(d)。掩蔽音调也是同理。不管上述哪一种掩蔽现象,都是由于强音调或者强噪声在耳蜗基底膜上的临界频带(dB)(dB)内产生了足够大的刺激强度,阻止了对相对微弱信ΔfΔf号的感知。在有效编码中,每一帧必然含有一系列这级级压压两种掩蔽类型,首先,将掩蔽信号分为噪声和音调,声声它们各自的掩蔽阈值将联合一起计算出全局的掩蔽(a)f(b)f阈值。全局掩蔽阈值也就是指刚刚可察觉的失真,即值值阈阈JND(JustNoticeableDistortion)。为了给噪声

7、谱进行整知知感感形,就必须把绝对听觉阈值Tq考虑在内,max(jnd,fcbΔffcbΔfTq)就是最终可允许的失真阈值。(c)(d)由于一个位于临界频带中心的掩蔽信号会对其他临界频带产生掩蔽效应,我们称这种现象叫做掩图2临界频带测量方法蔽扩散。临界带宽BW(cf)和其中心频率的关系如下:假设一个掩蔽音用一个mbit的量化器来量化,2]0.69BW(cf)=25+75[1+1.4(f/1000)(Hz)SMR(Signal-to-M

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。