欢迎来到天天文库
浏览记录
ID:48484965
大小:1.41 MB
页数:58页
时间:2020-01-22
《3-多媒体声音1.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第三部分声音声音是携带信息的极其重要的媒体,是多媒体技术研究中的一个重要内容。声音的种类繁多。本章将介绍声音的相关知识。3.1声音与听觉器官声音是通过空气传播的一种连续的波,叫声波。声音的强弱体现在声波压力的大小上,音调的高低体现在声音的频率上。声音用电表示时,声音信号在时间和幅度上都是连续的模拟信号,如图所示。声波具有普通波所具有的特性,如反射、折射和衍射等。3.1声音与听觉器官对声音信号的分析表明,声音信号由许多频率不同的信号组成,这类信号称为复合信号,而单一频率的信号称为分量信号。声音信号的一个重要参数就是带宽,它用来描述组成复
2、合信号的频率范围。高保声音信号(high-fidelityaudio)的频率范围为20Hz~20 000Hz,它的带宽约为20kHz,而视频信号的带宽是6MHz。3.1声音与听觉器官声音信号的两个基本参数是频率和幅度。信号的频率是指信号每秒钟变化的次数,用Hz表示。例如,大气压的变化周期很长,以小时或天数计算,一般人不容易感到这种气压信号的变化,更听不到这种变化。对于频率为几Hz到20Hz的空气压力信号,人们也听不到,如果它的强度足够大,也许可以感觉到。3.1声音与听觉器官人们把频率小于20Hz的信号称为亚音信号,或称为次音信号(su
3、bsonic);频率范围为20Hz~20kHz的信号称为音频(Audio)信号;虽然人的发音器官发出的声音频率大约是80~3400Hz,但人说话的信号频率通常为300~3000Hz,人们把在这种频率范围的信号称为话音(speech)信号;高于20kHz的信号称为超音频信号,或称超声波信号。超音频信号具有很强的方向性,而且可以形成波束,在工业上得到广泛的应用,如超声波探测仪,超声波焊接设备等就是利用这种信号。在多媒体技术中,处理的信号主要是音频信号,它包括音乐、话音、风声、雨声、鸟叫声、机器声等。3.1声音与听觉器官人们是否都能听到音频
4、信号,这主要取决于各个人的年龄和耳朵的特性。一般来说,人的听觉器官能感知的声音频率大约在20~20000Hz之间,在这种频率范围里感知的声音幅度大约在0~120dB之间。人的听觉器官对声音的感知还有一些重要特性,这些特性将在MPEG声音中介绍,它们在音频数据压缩中已经得到广泛的应用。3.2声音信号的数字化3.2.1从模拟过渡到数字数字精度高,模拟精度低。3.2.2模拟信号与数字信号话音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。3.2.3声音信号的数字化在某些特定的时刻对这种模拟信号进行测量叫做采样(sampl
5、ing),由这些特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个,因此幅度还是连续的。如果把信号幅度取值的数目加以限定,这种由有限个数值组成的信号就称为离散幅度信号。3.2.3声音信号的数字化我们把时间和幅度都用离散的数字表示的信号就称为数字信号。声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样一次,这种采样称为均匀采样;连续幅度的离散化通过量化来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化,否
6、则就称为非线性量化。3.2.3声音信号的数字化声音数字化需要回答两个问题:①每秒钟需要采集多少个声音样本,也就是采样频率(fs)是多少,②每个声音样本的位数(bitpersample,bps)应该是多少,也就是量化精度。3.2.4采样频率采样频率的高低是根据奈奎斯特理论和声音信号本身的最高频率决定的。奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音。采样定律用公式表示为fs2f或者TsT/2其中f为被采样信号的最高频率。可以这样来理解奈奎斯特理论:声音信号可以看成由许许多多正弦波
7、组成的,一个振幅为A、频率为f的正弦波至少需要两个采样样本表示,因此,如果一个信号中的最高频率为fMAX,采样频率最低要选择2fMAX。例如,电话话音的信号频率约为3.4kHz,采样频率就选为8kHz。3.2.5采样精度样本大小是用每个声音样本的位数bit/s(即bps)表示的,它反映度量声音波形幅度的精度。例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在0~65536的范围里,它的精度就是输入信号的1/65536。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低
8、,需要的存储空间越少。3.2.5采样精度采样精度的另一种表示方法是信号噪声比,简称为信噪比(SNR),并用下式计算:SNR=10log[(Vsignal)2/(Vnoise)2]=20log(Vsignal/Vnoise
此文档下载收益归作者所有