欢迎来到天天文库
浏览记录
ID:49604996
大小:3.49 MB
页数:43页
时间:2020-03-02
《多媒体音频及音频处理.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第五章多媒体音频及音频处理本章提要●声音媒体的有关概念●模拟声音信息的数字化处理●MIDI与音乐合成●数字音频格式及格式转换●音频卡(声卡)●音频处理软件-CoolEditPro2.0●语音识别技术音频(声音)是表达思想和情感的一种必不可少的媒体,也是多媒体信息中一个重要组成部分。声音的种类有很多,从人的说话声、乐声到风声、雨声,当它能与文字、图像等结合,一起传递信息时,计算机世界才会变得如此丰富多彩。5.1音频信息及数字音频的产生5.1.1多媒体中的音频信息图5-1声音传播示意图密疏密自然界中的声音是由于物体的振动产生的,通过空气传递振动
2、,最后这种机械运动被传递到人的耳膜而被人感知。我们下面以音叉为例,具体说明一下声音的产生和传播过程。当一个音叉受到敲击振动时,叉枝会左右摆动。当叉枝向外摆动时,叉枝会挤压周围的空气使周围空气形成一个密部,相反,当叉枝向内摆动时,会引起周围的空气拉动而形成一个疏部。空气这样密部与疏部交替运动形成一种波(声波)会向周围发散传播出去,从而形成声音的传播。传播过程如图5-1所示。这种声音的传播运动最后传递给人的耳膜并通过听小骨传递给听觉神经产生了人的听觉。听觉是人类感知自然的一种重要手段,所以音频也就成为多媒体范畴中一个重要部分。从听觉角度讲,声音
3、媒体具有三个要素:音调、音强和音色(1)音调:与声音的频率有关,频率越快,音调越高。所谓声音的频率是指每秒中声音信号变化的次数,用Hz表示。例如,20Hz表示声音信号在1秒钟内周期性地变化20次。并不是所有频率发出的声音信号都能够被人们感觉到,人的听觉范围大约为20—20000Hz,这个频率范围内的信号被称为音频或声音,多媒体技术主要研究的是这部分音频信息的使用;频率范围小于20Hz的信号被称为亚音频,这个范围内的信号人们一般感受不到。比如,大气压的变化周期很长,以小时或天数计算,人们几乎感觉不到这种气压信号的变化,更听不到这种变化所带来的
4、声音:频率范围高于20kHz的信号被称为超音频或超声波,超声波具有很强的方向性,并且可以形成波束,利用这种特性,人们制造了超声波探测仪、超声波焊接设备等;另外,人的发声器官可以发出80~3400Hz频率范围的声音,但人们平时说话的频率范围在300~3000Hz之间。了解这些知识很重要,它可以指导我们更有效地处理音频信息。(2)音强:又称为响度,它取决于声音的振幅。振幅越大,声音就越响亮。(3)音色:在介绍音色之前,先给出几个有关的概念。●纯音:一般的声音由几种振动频率的波组成,若该声音只有一种振动频率就叫做纯音;●复音:由许多纯音组成,复音
5、的频率用组成这个复音的基音频率表示,一般的乐音都是复音;●基音:是复音中频率最低部分的声音;●泛音:在一个复音中,除去基音外,所有其余的纯音都是泛音。音色则是由混入基音的泛音所决定的,每个基音又都有其固有的频率和不同音强的泛音,从而使得每个声音具有特殊的音色效果。比如,每个人讲话的声音以及钢琴、提琴、笛子等各种乐器所发出的不同声音,都是由音色不同造成的。声音的传播是以声波形式进行的。由于人类的耳朵能够判别出声波到达左、右耳的相对时差、声音强度,所以能够判别出声音的来源方向。同时又由于空间作用使声音来回反射,从而造成声音的特殊空间效果。这也正
6、是人们在音乐厅与在广场上聆听音乐感觉效果不一样的原因之一。因此,现在的音响设备都在竭力模拟这种立体声和空间感效果。声音的质量与声音的频率范围有关,即频率范围越宽,声音的质量就越好。表5-1是几种常见的声音频宽。表5-1几种常见的声音频宽声音类型频宽电话语音200~3400Hz调幅广播50~7000Hz调频广播20~15000Hz宽带音响20~20000Hz衡量声音质量单凭声音频宽判断有时比较困难,主观打分则是一种比较快捷、简单的方法。它的具体操作过程与近几年在电视节目中流行歌手大奖赛评分方法类似。首先挑选一些有代表性的人物,聆听需要评测的各
7、种声音,每个人根据感觉给出分数,最后的平均分就是相对应的声音效果的评价结果。实际上,不同的应用对象,声音质量的衡量标准也不尽相同。对于语音来说,通常用可懂度、清晰度和自然度来衡量;对于音乐来说,就要求具有一定的保真度、立体感和音响效果。声音是一种基于时间的媒体。没有时间就没有声音,因此,我们说声音具有过程性,需要有一个时间段才能表现,这也就是我们常用音乐作为伴音的原因,它可以很好地起到渲染气氛的作用。由于时间性,声音数据具有很强的前后相关性,数据量较大,且实时性要求较高。5.1.2数字音频的产生采样量化模拟音频电信号二进制序列图5-2模数转
8、换过程图自然界的声音经过麦克风后,机械运动被转化为电信号,这时的电信号由许多正弦波组成,其中正弦波的频率取决于声音中含有的频率。对于计算机来说,处理和存储的只可以是二进制所表示的
此文档下载收益归作者所有