数字音频处理ppt课件.ppt

数字音频处理ppt课件.ppt

ID:58726222

大小:1.19 MB

页数:117页

时间:2020-10-04

数字音频处理ppt课件.ppt_第1页
数字音频处理ppt课件.ppt_第2页
数字音频处理ppt课件.ppt_第3页
数字音频处理ppt课件.ppt_第4页
数字音频处理ppt课件.ppt_第5页
资源描述:

《数字音频处理ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第2章数字音频处理本章重点:模拟音频与数字音频的概念数字音频的获取音频信号压缩编码音乐合成和语音识别第2章数字音频处理2.1概述2.2数字音频的获取2.3音频信号压缩编码2.4音乐合成和MIDI2.5语音识别2.6实例VC++播放声音的实现2.7本章小结2.1概述声音是携带信息的重要媒体。研究表明,人类从外部世界获取的信息中,10%是通过听觉获得的,因此声音是多媒体技术研究中的一个重要内容。声音是由物体振动产生的,这种振动引起周围空气压强的振荡,从而使耳朵产生听觉的印象。声音的种类繁多,人的语音是最重要的声音。此外,还有动物、乐器等发出的声音,风声、雨声、雷声

2、等自然声音,以及机器合成产生的声音等。2.1概述幅值t一个周期-+空气压强图2.1空气压强振荡的波形示意图0人耳能识别的声音频率范围大约在20~20kHz,通常称为音频(audio)信号。2.1概述音频信号所携带的信息大体上可分为语音、音乐和音效三类。语音,指具有语言内涵和人类约定俗成的特殊媒体。音乐,指规范的符号化了的声音。音效,指人类熟悉的其他声音。在多媒体系统中,处理的信号主要是音频信号。2.1概述声音包含三个要素:音调、音强和音色。基频与音调:一个声源每秒钟可产生成百上千个波,通常把每秒钟波峰所产生的数目称之为信号的频率,单位用赫兹(Hz)或千赫兹(k

3、Hz)表示。人对声音频率的感觉表现为音调的高低,在音乐中称为音高。音调正是由频率ω所决定的。2.1概述音乐中音阶的划分是在频率的对数坐标(20×log)上取等分而得的。如表所示,20×log261=48.3,20×log293=49.3等。音阶CDEFGAB简谱符号1234567频率(HZ)261293330349392440494频率(对数)48.349.350.350.851.852.853.82.1概述谐波与音色:n×ωo称为基波ωo的n次谐波分量(n就是高次谐波的方次,n×ωo就是基波ωo的n次谐波),也称为泛音。音色是由混入基音的泛音所决定的。幅度与

4、音强:信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大,声音越强。一般用动态范围定义相对强度:动态范围=20×log(信号的最大强度/信号的最小强度)(dB)2.1概述音宽与频带:频带宽度,也称为带宽,它是描述组成复合信号的频率范围。客观上,通常用频带宽度、动态范围、信噪比等指标衡量音频信号的质量。音频信号的频带越宽,所包含的音频信号分量越丰富,音质越好。动态范围越大,信号强度的相对变化范围越大,音响效果越好。CD-DA数字音乐、FM广播、AM广播和电话的带宽2.1概述声音的质量可以通过信噪比来度量。信噪比(SNR,Signal

5、toNoiseRatio)是有用信号与噪声之比的简称,定义为:信噪比越大,声音质量越好。2.2数字音频的获取2.2.1采样2.2.2量化2.2.3数字音频的技术指标2.2.4数字音频的文件格式音频信息处理结构框图2.2.1采样图2.5模拟信号的采样所谓采样就是在某些特定的时刻对模拟信号进行取值,如上图所示。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅值,把时间上的连续信号变成时间上的离散信号。2.2.1采样采样时间间隔称为采样周期t,其倒数为采样频率fs=1/t。一般来讲,采样频率越高,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也

6、越精确,声音失真越小,但用于存储音频的数据量越大。根据奈奎斯特定理,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原为原来的声音。2.2.2量化每个采样值在幅度上进行离散化处理的过程称为量化。量化可分为均匀量化和非均匀量化。均匀量化是把将采样后的信号按整个声波的幅度等间隔分成有限个区段,把落入某个区段内的样值归为一类,并赋于相同的量化值。以8bit或16bit的方式来划分纵轴为例,其纵轴将会被划分为28个和216个量化等级,用以记录其幅度大小。均匀量化2.2.2量化非均匀量化是根据信号的不同区间来确定量化间隔。对于信号值小的区间,其量化间

7、隔也小;反之,量化间隔就大。量化会引入失真,并且量化失真是一种不可逆失真,这就是通常所说的量化噪声。A律和μ律μ律压扩μ律压扩的数学解析式:其中:x为输入信号的归一化值;y为压扩后的信号。对话音信号编码,常采用μ=255,这样适量化信噪比改善约24dB。A律压扩其特性可表示为:A律压扩很明显,小信号时为线性特性,大信号时近似为对数特性。这种压扩特性常把压缩、量化和编码合为一体。A律可用13段折线逼近(相当于A=87.6),便于用数字电路实现。2.2.3数字音频的技术指标衡量数字音频的主要指标包括:采样频率量化位数通道(声道)个数数据传输率是计算机处理时基本参数

8、。未经压缩的数字音频数据传输率可按下式

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。