第 4 章 音频与视频处理

第 4 章 音频与视频处理

ID:21807691

大小:13.11 MB

页数:64页

时间:2018-10-24

第 4 章  音频与视频处理_第1页
第 4 章  音频与视频处理_第2页
第 4 章  音频与视频处理_第3页
第 4 章  音频与视频处理_第4页
第 4 章  音频与视频处理_第5页
资源描述:

《第 4 章 音频与视频处理》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章音频与视频处理4.1音频处理技术4.1.1音频处理概述n声音的基本参数1.声音的基本参数(1)周期l以规则的时间间隔重复出现相同的波形,这个时间间隔称之为周期。由于声音是自然产生的,所以不可能是非常平滑和具有相同的周期。u具有可识别周期的声音通常比较悦耳,如:各种乐器的声音、歌声等。非周期性声音通常比较刺耳,如噪音、刹车声等。(2)频率l频率是指波在单位时间内重复的次数,其单位为Hz(赫兹)。u通常还使用更大的单位KHz,MHz,GHz以及THz表示,其换算关系如下所示:1KHz=1000Hz1MHz=1000KHz1GHz=1000MHz1THz=1000

2、GHzu频率和周期互为倒数的关系:周期=1/频率波段l在研究的过程中,通常还将声波划分成以下几个波段:u次声波:低于20Hz;u声波:20~20KHz(人耳能听见的声波);u超声波:20KHz以上。l日常生活中,音调实际上就是对声音的频率描述。当频率快时,也就是频率高时,声音尖锐,反之则显得低沉,粗旷。声音的质量也与频率范围有关,如果声音的可变化频率越大,则声音的质量越高。(3)振幅l和其他波一样,声波也同样有振幅。在日常生活中,音量就是对声波振幅的描述。在声学中,振幅是用来定量研究空气受到压力的大小。u对于一个具体的声波而言,在一定的时间段内,如果我们能知道每个

3、时刻波的频率和相应的振幅,就可以将这个波重新描绘出来,再现这个声波。波形分析与变换l在自然界中,声波的频率和振幅时刻都在变化,形成不规则波,但是可以将之分解成多个规则波的线性组合。u例如,在波谱分析就是通过“傅里叶变换”把波形函数分解成多个简单形的线性组合的。如下所示。对波形函数进行傅里叶变换的公式n常用的音频设备(1)音卡l声音卡是处理音频信号的PC插卡,也称音效卡,一般有ISA总线和PCI总线两种。现在常见的是基于PCI总线的64位声卡,或者直接将声卡集成到计算机的主板上。u声音卡外部设备连接主要有以下几种端口:1话筒输入口(MIC):连接话筒,用于话筒输入信

4、号。2扬声器输出口(Speaker):连接扬声设备(音箱、耳机等),用于声音输出。3MIDI和操纵杆端口:连接MIDI和标准PC操纵杆。4有的声卡还有线路输入(LineIn)端口,用于连接音频输入设备USB声音卡ExpressCard接口声卡声音卡的接口声音卡的系统构造图(2)话筒l也称麦克风(Microphone),学名为传声器。它是将声音信号转换为电信号的能量转换器件,也称微音器。(3)扬声器l扬声器又称“喇叭”,是常用的音频输出设备。u扬声器的种类繁多,而且价格相差很大。音频电能通过电磁、压电或静电效应,使其纸盆或膜片振动周围空气造成音响。按换能机理和结构分

5、动圈式(电动式)、电容式(静电式)、压电式(晶体或陶瓷)、电磁式(压簧式)、电离子式和气动式扬声器等。(4)其他音频设备l目前市面上的音频设备还有很多,如录音机、各种音乐播放器、电子乐器等等。n声音数据的数字化l要重现声波,只需要知道波的频率和振幅,就能重新描绘出波的原来形状,再现这个声波。u但是,声波是一个连续的波段,而计算机只能处理非连续的0,1两种状态,这种连续波在计算机中不能直接处理,需要将它作数字化处理。(1)采样频率l采样频率即1秒钟内采样的次数。u采样的频率越高,丢失的信息量就越少。音调越高的声音,说明声音频率高、周期短,采样的频率也要相应提高。采样

6、的频率越高,单位时间内获取的样本数目就越多,数字化后的音频信号的保真度越高。获得的听觉效果就越好,同时信息量也大大增加。在实际工作中,没有必要无限制地增大采样频率,这是因为:人的声音本身不可能无限制快地变化;人耳的分辨率有极限;高采样率意味着加大信息的存储量。音频波形数字化采样示意图声音的采样频率l根据抽样理论,对于随时间连续变化的模拟信号波形,如果采用该信号所含的最高频率的2倍进行采样,就可以保证在还原该信号时,波形基本不失真。u由于人耳听觉的上限频率大约为20KHz,因此当采样频率达到40KHz以上时,就可以达到较好的听觉效果。当前声音的采样频率主要有三种标准

7、:44.1KHz22.05KHz11.025KHz(2)量化等级l每次采样得到的声音样本都是表示声音波形的一个振幅值。量化等级即每个样本量化后共用多少个离散的数值来表示,在计算机中可以认为是用多少个二进制位来表示。u若每个样本用8位的二进制数表示,则共有2=256个量级。若每个样本用16位二进制表示,则共有65536个量级,CD盘就采用这样的标准。在量化的过程中,量化等级是用来对振幅的描述。如果量化等级越高,也就是量化时采用更多的二进制位来表示振幅,就能更真实地体现声波振幅的变化和原始状态。(3)信噪比(SNR)l在音频处理中,信噪比也称声噪比,可看成是最大不失真

8、声音信号强

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。