心理声学模型及其在mp3编码中的应用

心理声学模型及其在mp3编码中的应用

ID:9220445

大小:203.92 KB

页数:5页

时间:2018-04-23

心理声学模型及其在mp3编码中的应用_第1页
心理声学模型及其在mp3编码中的应用_第2页
心理声学模型及其在mp3编码中的应用_第3页
心理声学模型及其在mp3编码中的应用_第4页
心理声学模型及其在mp3编码中的应用_第5页
资源描述:

《心理声学模型及其在mp3编码中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第23卷第3期宁波大学学报(理工版)Vol.23No.32010年7月JOURNALOFNINGBOUNIVERSITY(NSEE)July2010文章编号:1001-5132(2010)03-0027-05心理声学模型及其在MP3编码中的应用*张力光,王让定(宁波大学纵横智能软件研究所,浙江宁波315211)摘要:心理声学模型是音频感知编码的核心部分,其直接影响着音频编码的质量及压缩比.基于心理声学的基本原理、绝对听觉阈值、掩蔽效应及临界频带等相关内容,并结合心理声学的数学表达,按照MP3标准编码程序中的各个模块来详细分析算法流程.最后通过相应算法来描述预回声

2、产生机理及其在MP3编码中的抑制方法.关键词:心理声学模型;掩蔽效应;MP3编码;预回声抑制中图分类号:TP391.42文献标识码:A随着计算机网络、无线通信、电子消费产品、过模拟人的发音器官的特性,利用人的听觉系统,高清晰度电视、数字音频广播等新兴技术的迅猛发运用分析技术和频率相关比特分配技术,使量化[3]展,数字音频技术发展将面临着一些挑战,比如如噪声和听觉特性相匹配.因而心理声学模型的好何在较小的信道带宽、有限的存储空间以及高性价坏直接影响了音频压缩效率和音频感知质量.比等要求下寻求更一种有效的压缩方法,以获得低码率高品质数字音频.目前传统的音频压缩技1心

3、理声学原理术很多,它们主要力求输入和输出信号波形一致,这种编码技术以数学意义上的最接近来进行量化人的听觉系统能否感知到音频信号主要取决[1]和编码.因此这种编码器的码率很高,压缩比低.于音频信号的频率和强度,人们能感知的频率范为了获得更高的压缩比,一种期望在主观感知意围一般在20~20000Hz.音频信号强度一般用对数义上更接近的高质量、低码率的音频编码技术越来形式表示,单位为分贝(dB),即:SPL=10lg(/II),0[4]−122越成为数字音频压缩技术的主导.这种编码器对其中,I为10Wm/.0失真的考虑是基于人类对输出信号的有效感知,1.1绝对听觉阈值

4、因而此种编码也被称为感知音频编码(Perceptual绝对听觉阈值描述在无噪声环境下,人耳对[2]AudioCoder,PAC).不同的声音频率分量能够感知的最小声压级.绝[4]现在一些比较成熟的音频编码技术都使用了对听觉阈值的经验公式为:−−0.80.6−2−34感知编码,如MPEG系列标准等.感知音频编码通Tf()=−−3.64f6.5ef(3.3)+10f,Q收稿日期:2009-07-17.宁波大学学报(理工版)网址:http://3xb.nbu.edu.cn基金项目:国家自然科学基金(60672070,60873220);浙江省自然科学基金(Y10802

5、2).第一作者:张力光(1983-),男,浙江嘉兴人,在读硕士研究生,主要研究方向:信息隐藏.E-mail:zlg4585192@sina.com*通讯作者:王让定(1962-),男,甘肃天水人,博士/教授,主要研究方向:音频信息隐藏及语音识别.E-mail:wangrangding@nbu.edu.cn28宁波大学学报(理工版)2010其中,f为音频信号频率;T为绝对听觉阈值.一波器,其幅度响应为不对称和非线性的.掩蔽阈值Q般人耳最敏感的频率段在500~5000Hz范围内.在以掩蔽信号频率为中心的狭小频带内是个常数,1.2音频信号的掩蔽效应而这个狭小频带的宽度

6、即称为临界频带.在实际所谓掩蔽效应就是一个音频信号可使人的听应用中,将可感知频率范围内划分为24个临界频觉系统感觉不到另一个声音的存在.掩蔽效应主带,临界频带的单位为巴克(bark),bark和Hz的转要可划分为时域掩蔽和频域掩蔽:(1)时域掩蔽是[5]换公式为:指能量较强的音频信号,可掩蔽同时或其前后出20.76ff⎛⎞zf()13arctan=+3.5arctan⎜⎟,现能量较弱的音频信号的现象,所以又称异时掩1000⎝⎠7500蔽.异时掩蔽又分为超前掩蔽(Pre-masking)和滞后而每个临界带的带宽可以由下式求得:掩蔽(Post-masking),如图

7、1(a)所示,前掩蔽持续时f2⎛⎞cBWf()=+×+×2575⎜⎟11.4,间约为20ms,后掩蔽持续时间为150ms.(2)频域⎝⎠1000掩蔽是指掩蔽声与被掩蔽声同时作用时发生的掩其中,f为该临界带的中心频率;()BWf为该临c蔽效应,也称同时掩蔽(SimultaneousMasking),如界带的带宽.临界带在频率500Hz以下几乎是等图1(b)所示.掩蔽作用的大小可用信掩比(Signal-带宽,大约为100Hz;但当频率超过500Hz,临界to-MaskRatio,SMR)来衡量,其定义为掩蔽信号的频带的带宽随着频率的增加而递增.能量SPL与该信号所产

8、生的掩蔽阈值的能量之差.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。