欢迎来到天天文库
浏览记录
ID:39191287
大小:2.11 MB
页数:128页
时间:2019-06-26
《《音频信息处理v》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1第二章音频信息处理多媒体技术的特点是交互式地综合处理声文图信息。在多媒体系统中语音和音乐是不可少的。没有音频的视频是不可接受的。音频和视频同步,才能使视频图像更具真实性。娓娓动听的音乐和解说,会使静态图像变得更加丰富多彩。可视电话、电视会议中的声音更为重要。2第二章音频信息处理2.1声音概述(重点)2.2音频信息数字化(重点)2.3音频文件的格式2.4语音压缩编码(重点)2.5音乐合成和MIDI(重点)32.1声音概述一、声音及其分类1、声音声音是通过空气传播的一种连续的波,称为声波。基本参数频率:声音
2、的频率,体现音调的高低振幅:声波压力的大小,体现声音的强弱42.1声音概述声音信号由许多频率不同的信号组成,是复合信号。重要参数-带宽:复合信号的频率范围例如:高保真(high-fidelityaudio)声音的频率范围为10Hz~20000Hz,其带宽约为20KHz。而视频信号的带宽是6MHz。52.1声音概述2、声音的分类声音:无规则的噪音和有规则的音频信号。音频信号携带的信息可分为:语言、音乐和音效等三类。62.1声音概述3、声音的三要素音调、音色和音强是声音的三要素。在任一时刻,模拟声波信号曲线都
3、可以分解为一系列正弦波的线性叠加。其中ω0称为基频或基音(最低的音波);n*ω0称为ω0的n次谐波分量或称为泛音,其频率是基频的整数倍。72.1声音概述⑴音调在音乐中称为音高,音高是指声波的基频。将基频取对数后与人的音高感觉成线性关系,音律中最常见的12平均律中的音阶划分,就是在频率对数坐标取等分而得来的。⑵音色取决于声波的频谱,即由混入基音的泛音所决定的。各阶谐波即泛音的幅度比例不同,随时间衰减的程度不同,则音色就不同。若中高频泛音丰富,音色就明亮,如小号;若低频泛音丰富,音色就低沉,如低音贝司。82.
4、1声音概述⑶音强取决于声波信号的强弱程度,即与声音信号的幅度成正比。人耳在辨别声音的能力只有在音强适中时才最灵敏。由于人的听觉响应与声音信号强度不是成线性关系,因此一般用声音信号幅度取对数后再乘20所得值来描述声强,以分贝(dB)为单位,此时称为音量。在处理音频信号时,一般用动态范围来定义音频信号的相对强度:动态范围=20×log(信号的最大强度/信号最小强度)单位:dB92.1声音概述二、音频信号(1)语音:具有语言内涵和人类约定成俗的特殊媒体。(2)音乐:规范的符号化了的声音。(3)音效(响):人类熟
5、悉的其他声音,如动物发声、机器产生的声音、自然界的风雨雷电声等。音频的作用:直接通过讲话表达信息、制造某种效果和气氛、演奏音乐等。102.1声音概述1、音频——人类听觉所感知范围内的频率,也称声频。音频(Audio):频率范围是20Hz~20KHz的声音信号(人耳能听到)次声波(subsonic):频率低于20Hz的信号(亚音)超声波(ultrasonic):频率高于20KHz的信号(超音频)说明1:次声波和超声波之间的音频为可听声波,属于多媒体音频信息范畴。112.1声音概述说明2:人的发音器官发出的声
6、音频率大约是80~3400Hz,但人说话的信号频率通常为300~3000Hz,人们把在这种频率范围的信号称为语(话)音(speech)信号;实际上,人最敏感的频率范围是3KHz~5KHz。对于高于18~20kHz和低于16~20Hz的声音信号,无论音强如何,一般人都听不到。122.1声音概述Q:地震来临前,狗、老鼠等动物会比我们人类早知道,并有一些异常反应,请解释原因。地震时能量主要集中在次声波狗、猫等动物的听觉范围比人广如:狗的听觉范围是15Hz~50000Hz猫的听觉范围是60Hz~56000Hz。1
7、32.1声音概述2、音频信号——用电压或电流模拟信号表示声音信号,在多媒体技术中采用的是数字化音频信息。3、音频信息处理技术(1)音频获取技术(语音的采集、识别和理解)(2)音频合成技术(音乐的合成和语音的合成)(3)音频定位技术(模拟立体声、音频/视频同步)(4)音频编码、解码技术(5)音频网络传输技术142.1声音概述4、音频信号的技术指标⑴频带宽度:音频信号的频率范围,是衡量音质的标准。频带越宽,包含的音频信号分量越丰富,则音质越好。通常将音质定义为4个等级标准:CD-DA唱盘为10Hz~22KHz
8、;FM广播为20Hz~15KHz;AM广播为50Hz~7KHz;数字电话为200Hz~3.4KHz。152.1声音概述162.1声音概述⑵动态范围动态范围=20×log(信号的最大强度/信号的最小强度)动态范围越大,说明音频信号的相对变化范围大,音响效果越好。几种音频业务的动态范围音质效果AM广播FM广播数字电话CD-DA动态范围(dB)406050100172.1声音概述⑶信噪比SRN(SignaltoNoiseRate,d
此文档下载收益归作者所有