《音频信息处理》PPT课件

ID：39191292

大小：3.22 MB

页数：33页

时间：2019-06-26

资源描述：

《《音频信息处理》PPT课件》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、第2章音频信息处理2．1音频处理基础2．2音频处理软件AdobeAudition2．3音频处理综合应用案例2.1音频处理基础1.声波（1）声波：由各种机械振动或气流扰动引起周围的弹性媒质发生波动。（2）声源：产生声波的物体，如人的声带和乐器等。（3）声音：人的听觉系统所能感知到的声波。音频的频率范围：20Hz～20000Hz语音的频率范围：300Hz～3000Hz次声波的频率范围：<20Hz超声波的频率范围：>20kHz（4）声强：对于一定频率的声音，要能引起听觉，其声强也有一定的范围。下限：是恰能引起人听觉的最小声

2、强，叫做该频率的可闻阈；上限：是指人耳能听闻的最大声强，高于上限的声强，人耳感觉疼痛，所以叫做该频率的疼痛阈。常见声音的分贝量级分贝数低于2020～4040～6060～7070～90>90听觉效果能分辨轻声正常交谈声吵闹很吵听力受损2．声音的基本特征（1）声波信号的物理特征周期（T）：声波的两个波峰或波谷之间的相对时间。频率（f）：周期的倒数（f=1/T），即每秒波峰或波谷出现的次数。幅度：从声波信号的基线到波峰的距离，幅度越大声波的强度也越大。通常也用声压、声强或声功率来表示声音的强弱。人们感知到的声音特征称为心理学特征音

3、调：在音乐中又叫音高，是由发声物体的振动频率决定，振动越快（即频率越大），音调越高，振动越慢，音调越低。音调的高低与声音基频的对数（20*log）成线性关系。基频越低，给人的感觉是声音越低沉，基频频率增加一倍，在音乐上就叫升高了一个八度。音色：这是一个主观评价声音的量，声音的音色取决于声音的频谱结构，一般高次谐波越丰富，音色越明亮并具有穿透力。响度：人耳对声音强弱的感觉程度，主要取决于振幅和声压。通常振幅越大声音越响，其次人耳距离声源越远，声音越小。（2）声音信号的心理学特征（3）声音质量的评价声音质量与带宽有关，频率范围越宽

4、，声音质量越高。1）声音质量分级：按照声音信号的频率范围将声音质量分为5级。质量频率范围采样频率（kHz）采样精度（bits）声道数数据率（非压缩）（kB/s）电话200～3400Hz88单道声8AM100～5500Hz11.0258单道声11.0FM20～11000Hz22.05016立体声88.2CD-DA5～20000Hz44.116立体声176.4DVD0～96000Hz192246声道12002）信噪比（SNR）：即有用信号与噪音信号的强度之比，单位是分贝。3)声音主观质量的度量：主观度量就是大多数人对声音质量的感觉

5、。3．音频信号的表示（1）音频信号：通过麦克风等设备转换成的电信号。规则音频信号：带有语音、音乐和音效的有规律的音频信号，承载了一定的信息。语音：语言的载体，有丰富的语言内涵，是人类交流的信息载体。音乐：是一种规范的符号化的声音。音效：自然界中各种声音效果，如掌声、雷鸣声，爆破声等。不规则音频信号：不包含任何信息的声音，比如噪声。（2）音频信号的表示音频信号的数学表示ω0：声音的基音，决定了音调的高低nω0：声音的泛音，决定了声音的音色An:声波的振幅，表示声音的强弱2）音频信号的波形表示3）音频信号的频谱表示声音信号的

6、频率分布曲线。复杂的声音是由振幅和频率不同的正弦声波叠加而成的，这些正弦波的幅值按频率排列的图形就叫做频谱。男声的基频较低，低频分量更加丰富，因此听起来会更加低沉、浑厚。1.音频信号数字化声音信号在时间上是连续的，在幅度上也是连续的，属于模拟信号。（1）采样声音信号在时间上的离散化，即每隔一段时间抽取一个信号样本。采样频率：每秒采样的次数。奈奎斯特理论（Nyquisttheory）：采样频率不低于声音信号最高频率的两倍，这样就能把数字声音还原成原来的声音，称为无损数字化。fs>=2fmax电话话音信号的最高频率约为3.4kHz

7、，所以采样频率取为8kHz。2.1.2音频信号的数字化声音信号在幅度上的离散化也就是采样过程中对每一个采样点的幅度值用数字量来表示。如果幅度的划分是等间隔的，称为线性量化，否则为非线性量化。采样精度：即量化的位数，位数越多量化等级数也越多，所能表示的声波幅度的动态范围也越大，当然需要的存储空间也越大。（2）量化（3）编码就是用一组二进制码组来表示每一个有固定电平的量化值，或者说将量化值转换成二进制码组。典型的音频编码方法：脉冲编码调制法（PCM）。（4）数字音频的数据量数据量=采样频率*采样精度*采样时间*声道数/8（字节数）

8、单声道：一次只产生一组声波数据，立体声：一次产生两组声波数据。例2.1计算一分钟未压缩的高保真立体声数字声音数据的大小。60*（44100*16*2）/8=10.09MB一首未经压缩的4分钟的歌曲文件的大小约为40MB，那么一个容量为512MB的MP3播放器也只能播放12首这

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 33



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

《音频信息处理》PPT课件

《音频信息处理》PPT课件

相关文章

相关标签