语音编码应用与发展

语音编码应用与发展

ID:12696456

大小:93.50 KB

页数:6页

时间:2018-07-18

语音编码应用与发展_第1页
语音编码应用与发展_第2页
语音编码应用与发展_第3页
语音编码应用与发展_第4页
语音编码应用与发展_第5页
资源描述:

《语音编码应用与发展》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、语音编码语音编码(speechcoding)将模拟话音信号变为数字信号的过程。是数字通信中的一项重要技术。目的在保持一定的算法复杂程度和通信时延的前提下,运用尽可能少的信道容量传递尽可能高质量的语音。高质量低速率的语音编码技术在各类通信网中得到了广泛应用。近年来,为了适应数字移动通信网的发展,提出了一些适合移动信道的语言编码技术,主要包括欧洲GSM系统使用的规则脉冲激励长期预测编码(RPE-LTP)与美国提出的矢量和激励线性预测编码(VSELP)。分类语音编码技术通常分为3类:波形编码、参量编码和混合编码,其中波形编码和参量编码是2种基本类型。波形编码将时间域信号直接变换为数字代码,其目的是

2、尽可能精确地再现原来的话音波形。波形编码的基本原理是在时间轴上对模拟话音按一定的速率抽样,然后将幅度样本分层量化,并用代码表示。解码是其反过程,将收到的数字序列经过解码和滤波恢复成模拟信号。对于比特速率较高的编码信号(例如:从16~64kbit/s),波形编码技术能够提供相当好的话音质量。但对于低速语音编码信号(即比特率低于16kbit/s),波形编码的话音质量显著下降。因而,波形编码在对信号带宽要求不太严格的通信中得到应用。但对频率资源相当紧张的移动通信来说,这种编码方式显然不适合。脉冲编码调制(PCM)和增量调制(ΔM)以及它们的各种改进型都属于波形编码技术。参量编码又称为声源编码,将信

3、源信号在频率域或其他正交变换域中提取特征参量,并将其变换为数字代码进行传输;解码为其反过程,将接收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。具体地说,声源编码以发音机制的模型作为基础,用一套模拟声带频谱特性的滤波器系数和若干声源参数来描述这个模型。在发送端从模拟话音信号中提取各个特征参量并进行量化编码,在接收端根据接收到的滤波器系数和声源参数恢复原来的语音。这种编码技术可实现低速率语音编码,比特速率可压缩到2~4.8kbit/s)5,甚至更低,但语音质量只能达到中等。线性预测编码(LPC)及其各种改进型都属于参量编码。混合编码近年来提出的一类新的语言编码技术,它将波形编码和

4、参量编码结合起来,力图保持波形编码的高质量的优点以及参量编码的低速率的优点。混合编码数字语音信号中既包括若干语音特征参量又包括部分波形编码信息。混合编码可将比特速率请压缩到4~16kbit/s,在8~16kbit/s范围内能达到良好的话音质量。规则码激励长期预测编码就是一种混合编码方案。可以看出,混合编码是适合于数字移动通信的语音编码技术。要实现低速、高质量的语音编码,必须采用信息压缩技术。一般说来信息压缩技术可分为2类:波形处理技术和量化技术。波形处理技术的目标是消减语音波形的冗余度,包扩线性预测分析,频带分割、正交变换和分析合成等。量化技术的目标是在幅度量化上实现优化,包括自适应量化、自

5、适应比特分配和矢量量化。典型的语音编码方式与信息压缩技术的关系如下图所示。语音编码方式与信息压缩技术的关系框图APC-自适应预测编码;ADPCM-自适应差分脉码调制;APC-AB-带自适应比特分配的自适应预测编码;SBC-子带编码;ATC-自适应变换编码;TC-WVQ-变换编码(波形矢量量化);MPC-多脉冲激励编码;CELP-码激励线性预测编码。语音质量在语音编码技术中,对语音质量的评价是一个重要问题。语音质量高低的直接感受是听者的主观感觉,所以要客观对语音质量进行测量是一个长期存在的难题。目前,广泛采用的评定方法是所谓主观评定等级(SubjectiveOpinionScale),或称为平

6、均评价得分(MeanOpinionScore,MOS)。其方法是,有数十名试听者在不同信道环境中试听并给予评分,然后对评分进行统计处理,求出平均得分,分数等级采用五级分制。需要指出的是,听者对语音质量的主观感觉往往是和其注意力集中的程度相联系的,因而,对应于主观评定等级,还有一个收听注意力等级(ListeningEffortScale)。语音解码在接收端将收到的数字还原为模拟话音的过程。语音解码的原理、方法和过程与语音编码相反。语音编码技术的应用与发展语音数字化的技术基本可以分为两大类:第一类方法是在尽可能遵循波形的前提下,将模拟波形进行数字化编码;第二类方法是对模拟波形进行一定处理,但仅对

7、语音和收听过程中能时候到的语音进行编码。其中语音编码的三种最常用的技术是脉冲编码调制(PCM)、差分PCM(DPCM)和增量调制(DM)。通常,公共交换电话网中的数字电话都采用这三种技术。第二类语音数字化方法主要与用于窄带传输系统或有限容量的数字设备的语音编码器有关。采用该数字化技术的设备一般被称为声码器,声码器技术现在开始展开应用,特别是用于帧中继和IP上的语音。除压缩编码技术外,人们还应用许多其它节省带宽

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。