欢迎来到天天文库
浏览记录
ID:36898479
大小:749.81 KB
页数:36页
时间:2019-05-10
《语音信号处理》讲稿第5章》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第5章语音编码与压缩本章主要讨论的问题:1.语音编码与压缩的基本方法2.语音编码与压缩的硬件实现1.语音编码与压缩的基本方法讨论两方面问题:(1)语音信号处理技术概述(2)语音编码与压缩方法介绍1.语音编码与压缩的基本方法(1)语音信号处理技术概述①模拟信号处理技术——传统处理技术例如,磁带录音机的存储处理,电话中带通滤波放大等。②数字信号处理技术——现代处理技术包括采样、量化、编码、传输、存储、译码等。其中,编码是核心技术,本章重点介绍。语音编码又分信源编码和信道编码。下面着重介绍信源编码。1.语
2、音编码与压缩的基本方法③语音信号的编码技术语音信号编码(信源编码)与语音信号压缩,实际上是同一技术两个名称。其目的是在给定编码速率条件下,如何能得到尽量好的重建语音质量(或称编码质量),同时应减小编解码延时以及算法的复杂程度。其中,编码质量、编码速率、编解码的复杂程度、编解码延时是相互关联的四个主要因素。1.语音编码与压缩的基本方法(2)语音编码与压缩方法介绍1)语音信号压缩方法分类常用的语音信号压缩方法分类:a.无损压缩。如统计编码(霍夫曼编码、算术编码)、游程编码等。b.有损压缩。又分成如下三类
3、:a)波形编码。如全频带编码(如ADPCM)、子带编码(简写SBC)、矢量量化(简写VQ)等。语音信号压缩方法分类1.语音编码与压缩的基本方法b)参数编码。它在语音信号发送端提取足够的特征参数,在接收端以某种最小的失真合成原始信号,又称为模型编码。如线性预测声码器(简写LPC)。C)混合编码。如矢量和激励线性预测(简写VSELP)、多脉冲激励线性预测(简写MP-LPC)、码本激励线性预测(简写CELP)、多带激励(简写MBE)等。目前,极低速率的语音编码通常采用混合编码。1.语音编码与压缩的基本方法
4、2)衡量语音编码性能的主要因素a.编码质量两种评价方法:客观、主观。客观评定方法。如信噪比、加权信噪比、平均分段信噪比等。适用于速率较高的波形编码类型的算法。主观评定方法。常采用平均意见得分(MeanOpinionScore,简称MOS得分),判断韵字测试(DiagnosticRhymeTest,简称DRT得分),判断满意度测量(DiagnosticAcceptabilityMeasure,简称DAM得分)等。主观评定方法因符合人类听觉对语音质量的感觉,目前得到广泛应用。MOS得分采用五级评分标准。
5、声音的质量等级评分质量尺度妨碍尺度5优不察觉4良好刚察觉但不可厌3一般察觉及稍微可厌2差可厌(但不令人反感)1很差极可厌(令人反感)1.语音编码与压缩的基本方法b.编码速率单位为“比特/秒”(b/s),一般以I表示;或单位为“比特/样点”(b/p),一般以R表示。I和R通过采样速率fs联系起来。即I=R·fs式中,R越高,语音质量越高,但对传输带宽或存储容量的要求也越高。c.编解码的复杂程度与语音编码的话音质量及硬件实现成本有关。d.编解码延时在实时通信中引起延时和回声,必须考虑。1.语音编码与压缩
6、的基本方法3)语音信号编码技术的系统实现无损压缩编码的压缩比较低,如统计编码(霍夫曼编码、算术编码)、游程编码等压缩比约为2至4倍。考虑到人类听觉特征特点(允许接收的语音信号有一定的失真度),典型应用的语音编码常采用有损压缩编码,包括波形编码、参数编码和混合编码三大类。本章仅介绍波形编码(如ADPCM)及其系统实现。参数编码(如LPC)及其系统实现,将在语音合成中介绍。1.语音编码与压缩的基本方法a.自适应差值脉冲编码调制(ADPCM)ⅰ)差值脉冲编码调制(DPCM)DPCM系统1.语音编码与压缩的
7、基本方法ⅱ)自适应差值脉冲编码调制(ADPCM)ADPCM系统1.语音编码与压缩的基本方法b.变换编码(最佳变换、KLT、DCT)变换编码是指先对信号进行某种函数变换,从一种信号(空间)变换到另一种信号(空间),然后再对变换后的信号进行编码。一种典型的变换称为正交变换。变换编码系统中压缩数据有三个步骤:变换、变换域采样和量化。变换本身并不进行数据压缩,它只把信号映射到另一个域,使得信号在变换域容易进行压缩。变换编码系统组成框图如图所示。变换编码系统框图1.语音编码与压缩的基本方法a)离散最佳变换离散
8、变换可以用矩阵表示,如图像信号。设信源序列为一个n行k列的矩阵X,对一幅图像进行扫描,从上到下共n行,从左到右取k个样值,并令xij表示第i行第j个样值,则整幅图像就可以用n行k列的矩阵X表示。1.语音编码与压缩的基本方法当经过正交变换后,协方差矩阵为一对角矩阵,且对角线上元素之外的各元素均为零,且对角线上各元素最小,即具有最小均方误差,此时,该变换称最佳变换,也称Karhunen-Loeve变换,简称KLT。即1.语音编码与压缩的基本方法其中,T为任意正交变换,x
此文档下载收益归作者所有