心理声学数字音频处理概述new

心理声学数字音频处理概述new

ID:34459863

大小:202.39 KB

页数:4页

时间:2019-03-06

心理声学数字音频处理概述new_第1页
心理声学数字音频处理概述new_第2页
心理声学数字音频处理概述new_第3页
心理声学数字音频处理概述new_第4页
资源描述:

《心理声学数字音频处理概述new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《西部广播电视》2000年第3期心理声学数字音频处理概述黄麦原(云南电视台650031)摘要本文首先分正常人的听域与听阈、频谱掩蔽效应和时间掩蔽效应,介绍人耳的主要听觉特性,然后讨论心理声学数字音频处理中的三种重要技术:噪声整形、感觉加权滤波器和心理声学模型。目前,这些技术已成为保持主观音质不下降的前提下,降低数字音频的比特率的主要途径。关键词数字音频掩蔽效应噪声整形感觉加权滤波器心理声学模型1引言特点,无失真压缩编码的压缩率很低,无法满音频信号在向数字化发展的同时,对数足一般应用的需要,因此,音频信

2、号压缩编码字音频信号的存储和传输能力提出了更高的必须允许有一定的失真。研究音频压缩编码要求。为了在有限的存储设备和传输通道中的目的是如何在降低数码率的同时,不至于存储和传输大量的音频数据,在推进音频数使音频失真在听感上明显增加。评价音频失字化的同时,人们广泛开展了音频数据压缩真的方法可分为两类,即客观评定和主观评编码技术的研究。根据编码理论,有两种类型定。客观评定方法用客观测量的手段来评价的压缩编码,一种是无失真压缩编码,另一种语音编码质量,常用的方法有信噪比、加权信是有失真压缩编码。基于音频信号所具

3、有的噪比和平均分段信噪比等。其特点是计算简出系统可靠性的前提下,力求单机和系统性代价是其价格的提高。所以选型时一定要立能价格比尽可能高。一等价钱一等货,对时基足各电视台自身的经济实力,根据电视播出校正器单机来说和整个电视播出系统来说都系统中与时基校正器配套的设备的等级以及是同样的道理,可靠性和性能技术指标的等整个系统对图像质量要求的高低来选购相应级和档次高的时基校正器,其价格必然要高等级和档次的时基校正器。于等级和档次低的时基校正器。电视播出系5结束语统中时基校正器选型时通常考虑的几个主要电视播出系统

4、中放像机重放节目时,其技术指标有信噪比SöN,视频带宽(幅频特重放磁头与磁带的相对速度不可能和编辑记性)、微分增益失真DG和微分相位失真录时录像机的磁头与磁带的相对速度完全一DP,色亮时延差$S等。要想提高这些技术指致,同时由于周围工作环境的影响和磁带张标,制造商面临的技术难度较大,例如要增加力的不均匀性变化,放像机重放视频信号在带宽也即增加图像清晰度,就要增加视频信时间轴上会发生畸变,从而产生时基误差,因号数字化时采样点数,即提高采样频率,就要此对于要完成各种高质量锁相同步切换和键使用更高价格的高速

5、模ö数、数ö模转换器和控混合叠加台标及字幕功能的电视播出系统大容量高速存储器。另外要从复合视频信号而言,凡是放像机输出的视频信号,都必须经中尽量完整地分离出亮度信号,必须采用更过时基校正器进行时基校正后才能接入主切高档次和更高价格的数字梳状滤波器,因此换器(或切换台)。提高时基校正器技术指标和输出图像质量的30©1994-2008ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http://www.cnki.net单,但它

6、不能完全反映人耳对音质的感觉。另每个声音信号在听觉中产生1个同听一方面,主观评定方法符合人类听音时对音阈,该同听阈取决于信号的频谱和时间过程。质的感觉。容易被人们接受,目前得到了广泛图1中示出了1个强度为70dB、频率为应用。音频压缩的一个重要途径是利用人耳1kHz的纯音所形成的同听阈。处于同听阈以的听觉特征,使压缩过程中产生的失真不易下的声音事件(信号或噪声),由于被1kHz被人听到,也即压缩解压缩后的音质有较好信号所掩蔽,都听不到。这种现象称为频谱掩的主观评定结果。这种技术叫心理声学音频蔽效应。此

7、时,1kHz的纯音称为掩敝者,处于压缩技术。目前,它已变成GSM话音压缩编同听阈曲线以下的声音事件称为被掩蔽者。码、MPEG音频压缩、数字音频广播(DAB)图2、图3分别图示了同听阈与中心频率及同听阈与音强间的关系。等中的关键技术。本文先介绍人耳听觉特性,然后讨论几种常用的心理声学数字音频处理技术。2人耳听觉特性迄今为止,对于听觉特性的研究大部分是在心理学和语言学领域内进行,本节简要介绍在这方面的一些实验研究结果。这些结果是心理声学数字音频处理的主要依据。图2具有3种不同频率的窄带噪声同听阈211正常

8、人的听域与听阈正常人可听声音的频率范围为16Hz~16kHz,年轻人可听到20kHz的声音,而老年人可听到的高频减少到10kHz左右。在安静的环境中,人耳刚刚能感觉到的最小声音强度称为静听阈,它是频率的函数。在低频端和高频端静听阈特别高,在3~4kHz附近静听阈很低,即人耳对该范围的声音感觉最灵敏。静听阈曲线如图1所示。图3中心频率为1kHz的纯音、声压不同时的同听阈曲线213时间掩蔽效应在强的声音信号出现之前的短暂时间内,业已存在的弱音可以被掩蔽,这称

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。