第二讲 数字声音及MIDI简介ppt课件.ppt

第二讲 数字声音及MIDI简介ppt课件.ppt

ID:59236299

大小:351.00 KB

页数:37页

时间:2020-09-26

第二讲 数字声音及MIDI简介ppt课件.ppt_第1页
第二讲 数字声音及MIDI简介ppt课件.ppt_第2页
第二讲 数字声音及MIDI简介ppt课件.ppt_第3页
第二讲 数字声音及MIDI简介ppt课件.ppt_第4页
第二讲 数字声音及MIDI简介ppt课件.ppt_第5页
资源描述:

《第二讲 数字声音及MIDI简介ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、MMTYANGZHOUDAXUE物理科学与技术学院第二讲数字声音及MIDI简介声音是携带信息的极其重要的媒体(20%),是多媒体技术研究中的一个重要内容。声音的种类繁多,如人的话音、乐器声、动物发出的声音、机器产生的声音以及自然界的声音等。这些声音有许多共同的特性,也有它们各自的特性。在用计算机处理这些声音时,既要考虑它们的共性,又要利用它们的各自的特性。我们将研究声音的基础知识,掌握声音数字化的两个最基本的概念;了解基本的音频信号编码技术。第1节声音声音是通过空气传播的一种连续的波,叫声波。反射(reflection)、折射(refraction

2、)和衍射(diffraction)声音信号是由许多频率不同的分量信号组成的复合信号。复合信号的频率范围称为带宽。声音的本质带宽为20Hz-20kHz的信号称为音频(audio)信号,可以被人的耳朵感知。话音信号带宽在80Hz~3400Hz。频率决定音调。响度(音量)表示的是声音能量的强弱程度,主要取决于声波振幅的大小。用声压(达因/平方厘米,牛顿/平方米)或声强(瓦特/平方厘米)来计量。声压的单位为帕(Pa)。人耳对lkHz、10-16W/cm2的纯音刚能听到。声强级表示响度的相对量,它定义为某响度与10-16W/cm2比值的对数值乘以10,单位为

3、dB。正常人听觉的强度范围为0dB—120dB。声音与听觉乐音以小提琴为例,当它的A弦振动时,并不仅仅是整根弦在振动,这根弦的二分之一、三分之一、四分之一、五分之一……处都在振动着。于是,整根弦的振动产生了最主要的频率,我们称之为基音,而弦长的二分之一、三分之一、四分之一等处的振动则产生了一些次要的频率,我们称之为泛音。如果一个物体振动所发出的泛音为基音的整数倍,这个音就会具有清晰可辨的音高,我们称之为乐音,如钢琴,小提琴等发出的都是乐音;如果泛音是基音的非整数倍,这个音就不具备清晰可辨的音高,我们称之为噪音,如汽车发动机、计算机风扇等发出的都是噪

4、音。基音和混入基音的泛音决定音色。声音的三要素音调、音强、音色为声音的三要素。音强(响度)取决于声音的幅度。音调取决于声音的频率。音色是由混入基音的泛音所决定的。声音的听觉特性声音的方向性人的耳朵对声音强度和频率的反应成对数形式声音的掩蔽特性(时域掩蔽、频域掩蔽)声音质量的度量声音的质量与声音的带宽有关,一般来说频率范围越宽,声音质量也就越高。声音类型带宽电话语音200Hz-3.4kHz调幅广播(AM)50Hz-7kHz调频广播(FM)20Hz-15kHzCD10Hz-20kHz信噪比(SNR)度量指试听者要把语音编码器的输出按质量分为:优(5分)

5、、良(4分)、中(3分)、差(2分)、劣(1分)或分类为:察觉不到(5分),稍稍察觉到但无不适感(4分),能察觉且有不适感(3分),有不适感但还能忍受(2分),很不适且无法忍受(1分)主观平均判分法(MOS,MeanOpinionScore)第2节声音信号数字化声音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。声音进入计算机的第一步就是数字化,数字化过程中最重要的步骤就是采样和量化。采样(sampling):将声音信号在时间上离散化,即每隔相等的一段时间抽取一个信号样本。量化(quantization):将连续的信号幅度离散化

6、。如果幅度的划分是等间隔的,称为线性量化,否则为非线性量化。一般紧跟编码过程。电压范围量化步长量化结果编码逆量化结果5~72301163~52201041~3210012-1~1200000-3~-12-1111-2-5~-32-2110-4-7~-52-3101-6-9~-72-4100-8多媒体数据的量化一般通过除以量化步长量化为整数。逆量化就是乘以量化步长。量化步长越长,压缩字节越多,但是误差越大。量化步长越短,压缩字节越少,但是误差越小。量化除了有使幅度离散的作用外,同时:(1)压缩字节(2)产生量化误差(量化误差:逆量化的结果和原始信号幅

7、值之差,也称为量化噪声。)采样频率奈奎斯特理论指出:采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,称为无损数字化。fs>=2fmax例如话音信号最高频率约为3.4kHz,所以采样频率取为8kHz。采样精度每个声音样本的数字化位数。反映声音波形幅度的采样精度。也直接决定数据率的大小。质量采样频率(kHz)样本精度(bit)单道声/立体声数据率(kb/s)电话88单道声64AM11.0258单道声88.2FM22.05016立体声705.6CD44.116立体声1411.2人-机通信,计算机接收音频信号。获取、语音

8、识别与理解。机-人通信,计算机输出音频。音频合成;声音重构、模拟。产生真实感声音。人-机-人通信,人通过网络进行语音通信,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。