多媒体技术基础第3版第3讲话音编码

多媒体技术基础第3版第3讲话音编码

ID:21116011

大小:823.00 KB

页数:53页

时间:2018-10-18

多媒体技术基础第3版第3讲话音编码_第1页
多媒体技术基础第3版第3讲话音编码_第2页
多媒体技术基础第3版第3讲话音编码_第3页
多媒体技术基础第3版第3讲话音编码_第4页
多媒体技术基础第3版第3讲话音编码_第5页
资源描述:

《多媒体技术基础第3版第3讲话音编码》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多媒体技术基础(第3版)第3讲话音编码张奇复旦大学计算机科学技术学院qz@fudan.edu.cn2010年3月随着数字电话和数据通信容量日益增长的迫切要求,而又不希望明显降低传送话音信号的质量。除了提高通信带宽之外,对话音信号进行压缩是提高通信容量的重要措施。本章将重点介绍话音编码的基本思想2021年8月14日第3章数字声音编码2of462021年8月14日第3章数字声音编码3of46第3讲目录3.1话音类型3.1.1话音波形的特性3.1.2话音类型3.2话音编译码器3.2.1波形编译码器3.2.2音源编译码器3.2.3混合编译码器3.4脉冲编码调制(PCM)3.

2、4.1PCM的概念3.4.2均匀量化3.4.3非均匀量化3.5PCM在通信中的应用3.5.1频分多路复用3.5.2时分多路复用3.5.3数字通信线路的数据传输率3.6增量调制与自适应增量调制3.6.1增量调制(DM)3.6.2自适应增量调制(ADM)3.7自适应差分脉冲编码调制3.7.1自适应脉冲编码调制(APCM)的概念3.7.2差分脉冲编码调制(DPCM)的概念3.7.3自适应差分脉冲编码调制(ADPCM)3.7.4G.726ADPCM编译码器3.8G.722SB-ADPCM编译码器3.8.1子带编码(SBC)3.8.2子带-自适应差分脉冲编码调制(SB-ADP

3、CM)3.9线性预测编码(LPC)的概念3.10GSM声音简介3.11话音编码标准摘要3.11.1编码算法的性能3.11.2话音编码标准参考文献和站点3.1话音类型话音波形的特性话音的产生:肺部中的受压空气沿着声道通过声门发出。短期相关(short-termcorrelation):普通人的声道从声门到嘴的平均长度约为17厘米,反映在声音信号中就相当于在1ms数量级内的数据具有相关性(声速约为340m/s)。声道也被认为是一个滤波器,有许多共振峰,其频率受随时间变化的声道形状所控制,例如舌的移动就会改变声道的形状。许多话音编码器用一个短期滤波器(shorttermf

4、ilter)来模拟声道。但由于声道形状的变化比较慢,模拟滤波器的传递函数的修改不需要那么频繁,典型值在20ms左右。2021年8月14日第3讲话音编码4of463.1话音类型话音类型浊音,清音和爆破音。根据压缩空气通过声门对声道滤波器的激励方式区分。按发音方法为:爆破音:/p/b/t/d/k/g/鼻音:/m/n/ŋ/摩擦音:/f/v/d/t/s/z/f/v/r/h/w/j/破擦音:/tF/dV/ts/dz/tr/dr/舌侧音:/l/按声带震动与否为:清音:/p/t/k/f/W/h/s/F/tF/浊音:/b/d/g/m/n/N/v/T/z/V/dV/r/w/j/l/2

5、021年8月14日第3讲话音编码5of463.1话音类型1.浊音(voicedsounds)浊音是一种称为准周期脉冲(quasi-periodicpulses)激励所发出的音,这种准周期脉冲是在声门打开然后关闭时中断肺部到声道的气流所产生的脉冲。声门打开和关闭的速率呈现为音节(pitch)的大小(音节是听觉能感受到的最自然的语音单位,一个汉字就是一个音节),它的速率可通过改变声道的形状和空气的压力来调整。浊音表现出在音节上有高度的周期性,其值在2~20ms之间,这个周期性称为长期周期性(long-termperiodicity)。2021年8月14日第3讲话音编码6

6、of463.1话音类型2021年8月14日第3讲话音编码7of46图3-01浊音段的波形举例,音节周期大约8ms图3-02浊音段的功率谱密度(powerspectraldensity,PSD)3.1话音类型清音是由不稳定气流激励所产生的,这种气流是在声门处在打开状态下强制空气在声道里高速收缩产生的。2021年8月14日第3讲话音编码8of46图3-03清音段的波形举例图3-04清音段的功率谱密度举例3.1话音类型爆破音(plosivesounds)爆破音是在声道关闭之后产生压缩空气然后突然打开声道所发出的音。某些音不能归属到上述三种音中的任何一种,例如在声门振动和声

7、道收缩同时出现的情况下产生的摩擦音,这种音称为混合音。声道的形状和激励方式的变化相对比较慢,话音在短时间周期(10~30ms)里可以被认为是准定态(quasi-stationary)的短时平稳随机过程。话音信号具有高度周期性,这是由于声门的准周期性的振动和声道的谐振引起的。话音编码器就是企图揭示这种周期性,减少数据率又尽可能不牺牲声音的质量。2021年8月14日第3讲话音编码9of463.2话音编译码器三种话音编译码器波形编译码器:话音质量高,数据率高音源编译码器:数据率很低,合成话音音质有待提高混合编译码器:使用音源编译码技术和波形编译码技术,数据率和音质介于

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。