语音编码技术的现状与发展

语音编码技术的现状与发展

ID:5280203

大小:132.40 KB

页数:4页

时间:2017-12-07

语音编码技术的现状与发展_第1页
语音编码技术的现状与发展_第2页
语音编码技术的现状与发展_第3页
语音编码技术的现状与发展_第4页
资源描述:

《语音编码技术的现状与发展》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2000年6月天津通信技术Jun.2000第2期TIANJINCOMMUNICATIONSTECHNOLOGYNo.2语音编码技术的现状与发展王少勇王秉钧(天津大学电子信息工程学院,天津300072)摘要:介绍了语音压缩编码技术的概念和分类,简述了语音压缩编码的常用技术,讨论了语音压缩编码的现状和发展。关键词:语音编码;声码器;矢量量化中图分类号:TN912.31文献标识码:A文章编号:1006-7442(2000)02-0001-04近年来,随着人类社会信息化进程的加快,语特征参量,并由特征参量重建语音信号的一种编码音压缩编码技术也正在迅速发展,在移动通信、卫方式。这种方式在提取语音特征

2、参量时,往往会利星通信和IP电话通信中得到了广泛的应用。本文用某种语音生成模型在幅度谱上逼近原语音,以使即对语音压缩编码技术的现状与发展予以讨论。重建语音信号有尽可能高的可懂性,即力图保持语音的原意,但重建语音的波形与原语音信号的波形1语音压缩编码的概念和分类却有相当大的区别。这种方式的特点是编码速率现代通信的重要标志是实现数字化,而要实现低(1.2kbit/s~2.4kbit/s或更低),但只能达到数字化首先得把模拟信号转变为数字信号,这种变合成语音的质量(即自然度、讲话者的可识别性都换对语音信号来说就是语音编码。为了提高语音编较差的语音),并当码率提高到与波形编码相当时,码和语音信号数

3、字传输的有效性,通常还要进行语语音质量也不如波形编码。利用参量编码实现语音压缩编码,这就是本文所要讨论的中心课题。音通信的设备通常称为声码器,例如通道声码器、语音压缩编码技术有多种,归纳起来大致可分共振峰声码器、同态声码器以及广泛应用的线性预为三类,即波形编码、参量编码和混合编码。另外,测(LPC)声码器等都是典型的语音参量编码器。根据编码速率的高低还可分为中速率和低速率两1.3混合编码大类。当前,由参量编码与波形编码相结合的混合编1.1波形编码码的编码器正在得到人们较大的关注。这种编码波形编码是将时间域信号直接变换为数字代器既具备了声码器的特点(利用语音生成模型提取码进行传输,也就是说这

4、种编码是将语音信号作为语音参数),又具备了波形编码的特点(优化激励信一般的波形信号来处理,力图保持重建的语音波形号,使其与输入语音波形相匹配),同时还可利用感与原语音信号波形一样。这种编码方式的特点是适知加权最小均方误差的准则使编码器成为一个闭应能力强、重建语音的质量高,例如PCM、ΔM、环优化的系统,从而在较低的比特率上能获得较高ADPCM和自适应预测编码(APC)、子带编码的语音质量。例如,多脉冲激励线性预测(MPLPC(SBC)及自适应变换编码(ATC)等均属于这一种。或MPC)编码,正规脉冲激励线性预测(RPE-但这种方式所需的编码速率较高,在16kbit/s~LPC)编码和码激励

5、线性预测(CELP)编码都属于64kbit/s速率范围能得到较高的重建质量,而当这一种,这种编码方式能在4kbit/s~16kbit/s速率进一步降低时,语音重建质量就会急剧下降。中低编码的速率上得到高质量的重建语音。1.2参量编码1.4中速率和低速率语音压缩编码参量编码,又叫声码化编码,是在信源信号频(1)中速率语音压缩编码率域或其它正交域提取特征参量并将其变换为数所谓中速率编码是指数码率为4.8kbit/s~字代码进行传输,以及在接收端从数字代码中恢复16kbit/s范围内的语音编码。其语音质量较好(能收稿日期:1999-09-152天津通信技术2000年达到常用数字语音通信的质量要求

6、)、清晰度较高、自然度也能达到基本要求,但少许有点失真,与语音特征有一定的关系。例如谐波压扩ADPCM、子带编码、自适应变换域编码(ATC)等都属于这一种。对于低速率压缩编码,又称为声码器技术,数码率从100bit/s左右到4.8kbit/s。这种编码方式,语音质量比中速率编码要差,图1线性预测语音生成模型尤其是自然度比较差,难以辨别出讲话人声音的特点。因为不同的人,讲话的语音特征不同,其语音质射的作用全可简化为一个全极点滤波器(声道滤波量也就不同。研究结果表明,语音压缩编码的极限器),此滤波器是时变的,即声道参数和增益随时间压缩率为80bit/s~100bit/s,在这范围内,只能的变化

7、而变化。通常认为激励信号和滤波器系数传送句子内容,而对讲话人不同的语音特征和情绪之间大约5ms~40ms更新一次。就分辨不出来了。根据上述原理构成的LPC声码器原理框图如图2所示:2语音压缩编码常用的基本技术2.1线性预测语音生成模型语音信号相邻样点之间有很强的相关性,因此,可以用过去样点的线性组合来预测未来的样点,如式(1):M^S(n)=∑aiS(n-i)(1)图2LPC声码器原理框图i=12.2矢量量化式中,ai为

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。