关于多媒体音频的探究.doc

关于多媒体音频的探究.doc

ID:56482227

大小:23.00 KB

页数:4页

时间:2020-06-24

关于多媒体音频的探究.doc_第1页
关于多媒体音频的探究.doc_第2页
关于多媒体音频的探究.doc_第3页
关于多媒体音频的探究.doc_第4页
资源描述:

《关于多媒体音频的探究.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、关于多媒体音频的探究2012221110310022姓名:叶方园摘要:关于多媒体音频,首先他有多种格式,多种用途,带来方便和娱乐,还有对波形等内容的讨论和见解,不同的格式有不同的优点和效果!关键字:音频,频率,量化与量化级,音频格式正文:一、音频基本知识1)声音的物理特征人的耳朵之所以能听到声音,是感觉到空气分子的震动的信号,通常用一种连续的波来表示。波形的最大位移称为振幅A,反映音量。波形中的两个连续的波峰(或波谷)之间的距离称为周期T。周期的倒数1/T即为频率f,以赫兹(Hz)为单位,声音按频率分为三类:亚音频(次生)

2、,频率范围为0—20Hz,音频的频率范围为20—20000Hz,频率高于20kHz的称为超音频或超声,其实还有一类,就是过音频,频率范围为1G—1T。振幅和频率不变的声音为纯音。2)音频的相关概念音频卡也称为声卡,可以把所有的声音录制下来。从处理方式看,目前多媒体计算机中的音频主要有波形音频,CD音频和MIDI音频。波形音频,就是由外部声音源通过数字化过程采集到多媒体计算机中的所有声音形式,如讲话录音,流行歌曲,自然界的各种声音等,可通过编辑(裁剪,合成,效果)、编码压缩、存储以及还原等方式进行处理。CD音频式是存储在CD

3、光盘中的数字音频,可通过CD-ROM驱动器读取并采集到多媒体计算机中,然后以波形音频的形式进行存储和处理。MIDI音乐是一种十分规范的音乐方式,也称MIDI音频,后面将仔细分析的。二音频数字化1)频率与采样率的关系首先,数字化的具体过程包括采样、量化和编码3个环节,由模拟信号通过采样、量化和编码得到数字信号,数字化后的音频质量取决与采样频率、量化位数以及编码压缩算法等因素。所谓采样就是每间隔一段时间读取一次声音信号幅度,是声音信号在时间上被离散化。采样频率的高低是根据奈奎斯特理论(Nyquisttheory)和声音信号本身

4、的最高频率决定的。奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍,这样才能把以数字表达的声音还原成原来的声音。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。电话话音的信号频率约为3.4kHz,采样频率就选为8kHz。2)量化与量化级光有频率信息是不够的,

5、我们还必须纪录声音的幅度。量化位数越高,能表示的幅度的等级数越多。例如,每个声音样本用3bit表示,测得的声音样本值是在0~8的范围里。我们常见的CD位16bit的采样精度,即音量等级有2的16次方个。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多。量化就是把采样得到的声音信号幅度转化为数字值,是声音信号在幅度上被离散化。量化位数是每个采样点能够表示数据范围,量化位数越多,所得到的量化值越接近原始波形的采样值。常用的量化位数有8位、16位、24位,分别对应的是语音,后两位是音频,量化为数越

6、高,声音越好,但是数据量越大。在多数媒体中,对于音频、量化位数可采用16位,对应有65536个量化级;对于语音编码、量化位数可采用8位,对应有256个量化级。量化级也是数字声音质量的重要指标。量化级的大小决定了声音的动态范围,即被记录和重放的声音最高与最低的差值。16位的量化级足以表示极细微的声音到巨大噪声的声音范围。3)音频数据编码根据采样率和采样大小可以得知,相对自然界的信号,音频编码最多只能做到无限接近,至少目前的技术只能这样了,相对自然界的信号,任何数字音频编码方案都是有损的,因为无法完全还原。音频数据压缩编码的方

7、法有多种,可分为无损压缩和有损压缩两大类。无损压缩主要包含各种熵编码;而有损压缩则可分为波形编码、参数编码和同时利用多种技术的混合编码。(1)波形编码在模拟音频数字化的过程中,根据人耳的听觉特性进行编码,并使用编码后的音频信号与原始信号的波形尽可能匹配,实现数据压缩。特点是适应性强,音频质量好,在较高码率的条件下可以获得高质量的音频信号,即适合于高质量的音频信号,也适合于高保真语音和音乐信号,但波形编码压缩比不大。(2)参数编码把音频信号表示成某种模型的输出,利用特征提取的方法抽取必要的模型参数和激励信号的信息,并对这些信

8、号进行编码,最后在输出端合成原始信号。压缩率很大,但计算量大,保真度不高,因此使用于一般语音信号的编码。(3)混合编码介于波形编码和参数编码之间,集中了两种的优点,可在较低的码率上得到较高的音质。三.音频文件格式1、WAV格式这是一种古老的音频文件格式,由微软开发。WAV对音频流的编码没有硬性规定,除了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。