音频信号处理技术

音频信号处理技术

ID:39754883

大小:5.52 MB

页数:165页

时间:2019-07-10

音频信号处理技术_第1页
音频信号处理技术_第2页
音频信号处理技术_第3页
音频信号处理技术_第4页
音频信号处理技术_第5页
资源描述:

《音频信号处理技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、范铁生岳承君王军王丹华编著电子工业出版社高等院校计算机规划教材多媒体技术基础与应用第三章一维的音频信号理技术学习要点了解音频信号的基本概念理解人类的听觉特性理解时频域掩蔽效应理解音频信号压缩技术了解常见音频编码标准通过实例掌握常用的音频处理软件●●●●●●3.1音频信号的基本概念3.1.1音频信号的特点3.1.2音频信号的离散化3.1.3音频信号的音质指标3.1.4音频文件的格式3.2人类听觉特性3.2.1人耳的构造3.2.2频率3.2.3时域掩蔽效应3.2.4频域掩蔽效应3.2.5音频的有关定律3.3音频信号的压缩技术3.3.1脉冲编码调

2、制3.3.2感知编码3.3.3子带编码3.4音频编码标准3.4.1CCITTG系列标准3.4.2MP3压缩标准3.4.3AC-3压缩标准3.4.4MIDI标准3.5应用实例数字化声音压缩的必要性储存:计算一分钟未经压缩的CD高保真立体声数字声音文件的大小为10MB左右,必须进行压缩才能储存。经过MP3压缩编码后只有1MB左右。传输:音频压缩的目标是将数据传输率由1.5Mbit/s码率降低到100~400kbit/s。MP3音频文件通常码率为32kbit/s与视频压缩相似,音频压缩也有两种方式:冗余度消除——省略多余信息,无损不相关性消除——

3、省去接收端(人耳)不能察觉的信息,有损所有音频压缩方法基于心理声学模型,利用人耳的不足,消除音频信号中的不相关信息。人耳不能察觉频域和时域中强声音脉冲邻近的声音对人耳而言,某些声音可以掩盖其他低幅度的声音信号。语音信号冗余几个方面:1).幅度非均匀分布语音中小幅度样本比大幅度样本出现的概率要高。通话会有间隙,且实际语音信号的功率电平也趋向于出现在编码范围的较低电平端。2).样本之间的相关性对语音波形分析表明,采样数据的最大相关性存在于邻近样本之间。当采样速率为8KHz时,相邻采样值之间的相关系数大于0.85,甚至在相距十个样本之间,相关系数

4、还有0.3左右的数量级。3).周期之间的相关性虽然电话语音信号的频率分布在300-3400Hz的频带内,但在特定的瞬间,某一声音却往往只是该频带内的少数频率起作用。当声音中只存在少数几个基本频率时,就会像某些振荡波形一样,在周期与周期之间存在着一定的相关性。4).基音之间的相关性语音可以分为清音和浊音两种基本类型.浊音是由声带振动产生,每一次振动使一股空气从肺部流进声道。激励声道的各股空气之间的间隔称为基音周期。浊音的波形对应于基音周期的长期重复波形。对浊音编码是对一个基音周期波形进行编码,并以它作为其它基音段的模板。冗余度降低(无损)和不

5、相关性降低(有损)可以将原始声音信号码率降低90%。不相关性降低依赖于人耳的心理声学模型——Zwicker教授知觉编码----人耳不能分辨的声音分量不传输。人耳剖面图,分为三个主要部分:外耳、中耳、内耳。人耳心理声学模型人耳心理声学模型外耳实现阻抗匹配功能,声音通过空气传输,类似3kHz区域回声递升滤波器。人耳灵敏度最高的范围正是:3kHz~4kHz。耳膜或鼓膜将声波转换为机械振动,通过锤骨、砧骨、镫骨传送到通向感觉内耳的膜状窗.内耳有平衡器官,由几个充满液体的弓形和耳蜗构成。耳蜗是真正的听觉器官,直接听到声音。如果展开耳蜗会在其入口处发现

6、高频传感器,然后是中频传感器,最末端是低频传感器。内耳膜上分布着频率选择、声音采集传感器,将听觉神经连接到大脑。与音频编码相关的人耳特性人耳的灵敏度在很大程度上依赖于频率。低于20Hz,高于20kHz的声音信号人耳无法听到。人耳最敏感范围为3kHz~4kHz,在该范围之外,人耳敏感度向高频和低频两个方向降低。低于某个阈值的声音人耳无法听到,该阈值取决于频率,声音信号中低于该阈值的分量无需传送,对人耳而言是不相关信息。图听觉阈值与频率关系与音频编码相关的人耳特性掩蔽现象:例如一个测试人员听一个幅度固定的1kHz正弦波,同时添加其他不同频率和幅

7、度的正弦波,发现在1kHz附近低于某个阈值的其他正弦信号听不到,该阈值取决于频率,称作掩蔽阈值。掩蔽阈值曲线取决于掩蔽信号的频率,掩蔽信号的频率越高,被掩蔽的范围越大。这一特性叫做频域掩蔽。在掩蔽阈值以下的声音分量不需传送。图4.7频域掩蔽图掩蔽阈值与音频编码相关的人耳特性时域掩蔽时域中一个强脉冲会掩蔽该脉冲前后低于某个阈值的声音信号。这种现象,尤其是前掩蔽,很难想象,但可以进行很好的解释。是由于人耳的有限时域分辨率,再加上信号通过听觉神经传输到大脑的方式。目前的音频压缩方法只利用了频域掩蔽。图时域掩蔽一、声音声音是传递信息的重要媒体,是多

8、媒体技术研究中的一个重要内容;声音的物理特性机械振动或气流等外力引起周围弹性媒质发生波动,产生声波。声波传到人耳经过人类听觉系统的感知就是声音声音是通过空气传播的一种连续的波,称

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。