欢迎来到天天文库
浏览记录
ID:41153144
大小:2.49 MB
页数:65页
时间:2019-08-17
《《声音媒体信息》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、声音是人们用来传递信息的一种方式,是携带大量信息的及其重要的媒体,因此音频信息的处理在多媒体技术中是十分重要的。3.1声音及其分类3.1.1声音的概念声音是通过空气传播的一种连续的波,当物体振动时会激励它周围的空气质点振动,由于空气的惯性和弹性,在空气质点的相互作用下,振动就会逐渐向外传播而产生声波。声音属于听觉媒体,其频率范围大约在20Hz~20KHz。几个重要参数:1.周期:声波每完成一次振动需要的时间称为周期,通常用T表示,单位是秒。2.频率:每秒钟所完成的振动次数称为频率,用来体现音调的高低,单位是赫兹(Hz)。3.振幅:振幅是指声波的高低幅度,表示声音的强弱。振幅用来
2、定量研究空气受到压力的大小。4.带宽:带宽指频率覆盖的范围。3.1.2声音的分类在多媒体技术中,将声音媒体分为语言、音乐和音响三类。1.语言:指具有人类约定成俗的和语言内涵的特殊媒体。2.音乐:是指规范的符号化了的声音。3.音响:是指人们熟悉的其他声音,包括自然界的风声、雨声以及机器发出的声音等。3.1.3声音的要素1.音调:人耳对声音频率高低的感觉称为音调。音调由声源振动频率所决定。2.音色:音色是用来描述声音品质的,主要决定于声音频谱结构中的泛音多少。3.音强:音强是衡量声波在传播过程中声音强弱的物理量,即与声音信号的幅度成正比。3.2数字音频基础知识3.2.1声音信号数字
3、化过程1.采样(sampling)采样是将声音信号在时间上离散化,即每隔一定的时间间隔对模拟信号进行取样。2.量化(quantization)是对采样后的声音样本在幅值上离散化,即把信号强度划分为不同的等级,然后将每一个样本归入预先编排的量化等级上。3.编码:是将量化后的离散值用二进制代码表示。3.2.1数字化声音的技术指标1.采样频率:单位时间内采样的个数称为采样频率,用fs表示。奈奎斯特定理,即fs≥2fmax。2.量化位数:每个取样点能够表示的数据范围。3.声道数:指一次同时产生的声波组数。4.数据文件格式:数据量(Byte)=(采样频率×量化位数×声道数×声音持续时间)
4、/8表采样频率、量化位数、声道数及存储容量采样频率(KHz)量化位数(bit)单声道(MB/min)双声道(MB/min)11.02580.631.2622.0581.262.5222.05162.525.0444.1165.0410.08表数字音频等级声音类型频率范围(Hz)采样率(kHz)量化位数(bit)电话话音200~340088调幅广播50~70001616调频广播20~15k22.0516高质量音频20~20k44.1163.2.3声音质量的度量声音质量的两种方法:一种是客观评价,即音频信号的技术指标,如:频带宽度、动态范围和信噪比;另一种是主观评价。对于语音和图像
5、信号使用主观评价更恰当一些。1.音频信号的技术指标:频带宽度:音频信号的频率范围,是衡量音质的标准。动态范围:音频信号最大强度与最小强度之比。信噪比:有用信号的平均功率与噪音的平均功率之比。2.主观评价法:声音质量主观评价评分标准分数质量级别失真级别5优(Excellent)无察觉4良(Good)(刚)察觉但不讨厌3中(Fair)(察觉)有点讨厌2差(Poor)讨厌但不反感1劣(Bad)极讨厌(令人反感)3.2.4数字音频的文件格式1.波形文件扩展名为*.wav,是通过对模拟音频以不同的采样频率、不同的量化位数进行数字化而得到的数字信号存入磁盘而形成的波形文件。适用于:记录讲话
6、语音、CD音质的音乐、单声道或立体声的声音信息,并能保证声音不失真。缺点是未经压缩的声音文件占用存储盘空间太大。2.PCM:由模拟音频信号直接通过A/D转换而形成的二进制序列文件,特点是保真度高,解码速度快,但编码后数据量大。3.AIFF文件:.AIF/.AIFF苹果公司开发的一种声音文件格式,被Mac平台及其应用程序所支持,NetscapeNavigator浏览器中的LiveAudio也支持AIFF格式,SGI及其他专业音频软件包也同样支持这种格式。4.VOC:多用于保存CreativeSoundBlaster系列声卡所采集的声音数据,被Windows平台和DOS平台所支持。
7、5.AU:SunMicrosystems公司推出的一种经过压缩的数字声音格式,在Internet中经常使用。6.RM:RealNetworks公司开发的一种适合于网络实时流技术的音频文件格式,主要用于在低速率的广域网上实时传输音频信息。7.MP3:MPEGAudioLayer3的简写,压缩率高达10∶1~12∶1,音质基本保持不失真。8.CD:一种数字化的声音,其采样频率为44.1KHz,量化位数为16bit,可以高质量地重现原始声音。9.MIDI:文件本身不包含任何的音频信息,主要记录指令
此文档下载收益归作者所有