语音信号处理》讲稿第5章

语音信号处理》讲稿第5章

ID:36898479

大小:749.81 KB

页数:36页

时间:2019-05-10

语音信号处理》讲稿第5章_第1页
语音信号处理》讲稿第5章_第2页
语音信号处理》讲稿第5章_第3页
语音信号处理》讲稿第5章_第4页
语音信号处理》讲稿第5章_第5页
资源描述:

《语音信号处理》讲稿第5章》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第5章语音编码与压缩本章主要讨论的问题:1.语音编码与压缩的基本方法2.语音编码与压缩的硬件实现1.语音编码与压缩的基本方法讨论两方面问题:(1)语音信号处理技术概述(2)语音编码与压缩方法介绍1.语音编码与压缩的基本方法(1)语音信号处理技术概述①模拟信号处理技术——传统处理技术例如,磁带录音机的存储处理,电话中带通滤波放大等。②数字信号处理技术——现代处理技术包括采样、量化、编码、传输、存储、译码等。其中,编码是核心技术,本章重点介绍。语音编码又分信源编码和信道编码。下面着重介绍信源编码。1.语

2、音编码与压缩的基本方法③语音信号的编码技术语音信号编码(信源编码)与语音信号压缩,实际上是同一技术两个名称。其目的是在给定编码速率条件下,如何能得到尽量好的重建语音质量(或称编码质量),同时应减小编解码延时以及算法的复杂程度。其中,编码质量、编码速率、编解码的复杂程度、编解码延时是相互关联的四个主要因素。1.语音编码与压缩的基本方法(2)语音编码与压缩方法介绍1)语音信号压缩方法分类常用的语音信号压缩方法分类:a.无损压缩。如统计编码(霍夫曼编码、算术编码)、游程编码等。b.有损压缩。又分成如下三类

3、:a)波形编码。如全频带编码(如ADPCM)、子带编码(简写SBC)、矢量量化(简写VQ)等。语音信号压缩方法分类1.语音编码与压缩的基本方法b)参数编码。它在语音信号发送端提取足够的特征参数,在接收端以某种最小的失真合成原始信号,又称为模型编码。如线性预测声码器(简写LPC)。C)混合编码。如矢量和激励线性预测(简写VSELP)、多脉冲激励线性预测(简写MP-LPC)、码本激励线性预测(简写CELP)、多带激励(简写MBE)等。目前,极低速率的语音编码通常采用混合编码。1.语音编码与压缩的基本方法

4、2)衡量语音编码性能的主要因素a.编码质量两种评价方法:客观、主观。客观评定方法。如信噪比、加权信噪比、平均分段信噪比等。适用于速率较高的波形编码类型的算法。主观评定方法。常采用平均意见得分(MeanOpinionScore,简称MOS得分),判断韵字测试(DiagnosticRhymeTest,简称DRT得分),判断满意度测量(DiagnosticAcceptabilityMeasure,简称DAM得分)等。主观评定方法因符合人类听觉对语音质量的感觉,目前得到广泛应用。MOS得分采用五级评分标准。

5、声音的质量等级评分质量尺度妨碍尺度5优不察觉4良好刚察觉但不可厌3一般察觉及稍微可厌2差可厌(但不令人反感)1很差极可厌(令人反感)1.语音编码与压缩的基本方法b.编码速率单位为“比特/秒”(b/s),一般以I表示;或单位为“比特/样点”(b/p),一般以R表示。I和R通过采样速率fs联系起来。即I=R·fs式中,R越高,语音质量越高,但对传输带宽或存储容量的要求也越高。c.编解码的复杂程度与语音编码的话音质量及硬件实现成本有关。d.编解码延时在实时通信中引起延时和回声,必须考虑。1.语音编码与压缩

6、的基本方法3)语音信号编码技术的系统实现无损压缩编码的压缩比较低,如统计编码(霍夫曼编码、算术编码)、游程编码等压缩比约为2至4倍。考虑到人类听觉特征特点(允许接收的语音信号有一定的失真度),典型应用的语音编码常采用有损压缩编码,包括波形编码、参数编码和混合编码三大类。本章仅介绍波形编码(如ADPCM)及其系统实现。参数编码(如LPC)及其系统实现,将在语音合成中介绍。1.语音编码与压缩的基本方法a.自适应差值脉冲编码调制(ADPCM)ⅰ)差值脉冲编码调制(DPCM)DPCM系统1.语音编码与压缩的

7、基本方法ⅱ)自适应差值脉冲编码调制(ADPCM)ADPCM系统1.语音编码与压缩的基本方法b.变换编码(最佳变换、KLT、DCT)变换编码是指先对信号进行某种函数变换,从一种信号(空间)变换到另一种信号(空间),然后再对变换后的信号进行编码。一种典型的变换称为正交变换。变换编码系统中压缩数据有三个步骤:变换、变换域采样和量化。变换本身并不进行数据压缩,它只把信号映射到另一个域,使得信号在变换域容易进行压缩。变换编码系统组成框图如图所示。变换编码系统框图1.语音编码与压缩的基本方法a)离散最佳变换离散

8、变换可以用矩阵表示,如图像信号。设信源序列为一个n行k列的矩阵X,对一幅图像进行扫描,从上到下共n行,从左到右取k个样值,并令xij表示第i行第j个样值,则整幅图像就可以用n行k列的矩阵X表示。1.语音编码与压缩的基本方法当经过正交变换后,协方差矩阵为一对角矩阵,且对角线上元素之外的各元素均为零,且对角线上各元素最小,即具有最小均方误差,此时,该变换称最佳变换,也称Karhunen-Loeve变换,简称KLT。即1.语音编码与压缩的基本方法其中,T为任意正交变换,x

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。