ip网络电话中常用的语音压缩编码技术的性能分析

ip网络电话中常用的语音压缩编码技术的性能分析

ID:22629082

大小:52.00 KB

页数:8页

时间:2018-10-30

ip网络电话中常用的语音压缩编码技术的性能分析_第1页
ip网络电话中常用的语音压缩编码技术的性能分析_第2页
ip网络电话中常用的语音压缩编码技术的性能分析_第3页
ip网络电话中常用的语音压缩编码技术的性能分析_第4页
ip网络电话中常用的语音压缩编码技术的性能分析_第5页
资源描述:

《ip网络电话中常用的语音压缩编码技术的性能分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、IP网络电话中常用的语音压缩编码技术的性能分析

2、第1  IP网络电话中常用的语音压缩编码技术的性能分析

3、第1力图使重建语音信号具有尽可能的可懂性,即保持原语音的语义。而重建的信号的波形同原语音信号的波形可能会有相当大的差别。参数编码的典型例子语音信号的线性预测编码(LPC)已被公认为是目前参数编码中最有效的方法,它能够在2.4kb/s的低比特速率下获得清晰、可懂的合成音。并且易于硬件实现。这种方法的优点是不但能极为精确地估计参数,还在于它的计算速度比较快。另外多带激励(MBE)编码,余弦变换编码(STC)均属参数

4、编码。由于参数编码是保护语声模型,重建清晰可识别的语声,而不注重波形的拟合,所以这类编码技术实现的是合成语声质量下的低速或极低速的编码。参数编码的优点是:编码速率低,编码速率通常小于4.8kb/s,可以低至600b/s至2.4kb/s。缺点是:合成语音质量差,特别是自然度较低,连熟人之间都不一定能听出讲话人是谁;另外,这类编码器对讲话环境噪声较敏感,需要安静的讲话环境才能给出较高的可懂度,且时延大。(3)混合编码混合编码是将波形编码与参数编码结合而产生的一种编码方式。使语音编码技术有了突破性的进展。其中提出了一些

5、非常有效的处理方法,产生了新一代的参数编码算法,构成了新一代的声码器。混合编码结合了以上两种编码方式的优点,采用线性技术构成声道模型,不只传输预测参数和清浊音信息,而是将预测误差信息和预测参数同时传输,在接收端构成新的激励激去激励预测参数构成的合成滤波器,使得合成滤波器输出的信号波形与原始语声信号的波形最大程序的拟合,从而获得自然度较高的语声。这种编码技术的关键是:如何高效地传输预测误差信息。依据对激励信息的不同处理,这类编码主要有:多脉冲线性预测编码(MPLPC)、规则脉冲激励线性预测编码(RPELPC)、码激

6、励线性预测编码(CELPC)、低时延的码激励线性预测编码(LD-CELPC)。混合编码克服了原有波形编码器与声码器的弱点,而结合了它们的优点,在4~16kb/s速率上能够得到高质量合成语音。在本质上具有波形编码的优点,有一定抗噪和抗误码的性能,但时延较大。2语音压缩编码的原理IP网络中的语音处理需要解决的两个问题之一是在保证一定话音质量的前提下,尽可能降低编码比特率。这主要依靠语音编码技术来解决。IP网络宜使用ITU-T定义的低比特率编码标准,其比特率为5.3~16kbit/s,均为低复杂度编码算法,话音分组长度

7、在30ms以下,话音质量较好。从前面列举的几种编码方式也可看出,同一段语音信号,采用不同的编码方式,其编码后的比特率各不相同。那么为什么我们能够对语音信号进行压缩编码从而达到降低语音信号的比特率呢?(1)利用了语音信号的相关性语音信源是相关信源,因此经过采样和量化的信号之间还有很强的相关性,为了降低编码速率,人们就希望尽可能多地去除语音信号之间的相关性。线性预测编码技术(LPC)就是一种用来去除语音信号之间相关性的常用技术。语音信号中存在两种类型的相关性:其一是在样点之间短时相关性。语音信号在某些短时段中呈现出随

8、机噪声的特性,在另一些短时段中,则呈现出周期信号的特性,其它一些是二者的混合。500)this.style.ouseg(this)">简而言之,语音信号的特征是随时间而变化的,只是在一短段时间中,语音信号才保持相对稳定一致的特征,也就是语音信号的短时平稳性。其二是相邻基音周期之间存在的长时相关性。由于语音信号中的短时相关性和长时相关性很强,通过减弱这些相关性,使语音信号之间相关性降低,然后再进行编码,这样就可以实现语音压缩编码,降低比特率。例如差分脉冲编码(DPCM)就是利用了语音信号的相关性来降低比特率的。所谓

9、语音信号的相关性,就是相邻样点之差很小,其包含的信息量远小于抽样值本身,对差值编码而不是对抽样值本身进行编码,这样所需的比特率必然下降,这就是DPCM能够降低比特率的原因。(2)利用了人耳的听觉特性利用人耳的掩蔽效应也可以进行语音压缩编码,降低比特率。两个响度不等的声音作用于人耳时,则响度较高的频率成份的存在会影响到对响度较低的频率成份的感觉,使其变得不易被察觉,这就是我们所说的掩蔽效应。在语音频谱中,能量较高的频段即共振峰处的噪声相对于能量较低频段的噪声而言不易被感知。因此在度量原始语音与合成语音之间的误差时可

10、计入这一因素。在语音能量高的频段,允许二者的误差大一些,从而进一步降低编码比特率。为此引入一个频域感觉加权滤波器P-MLQ)法进行量化,对低速率(5.3kbit/s)编码器,其激励信号采用代数码激码线性预测(ACELP)法量化。编码过程是首先选速率为kbit/s的PCM语音信号转化成均匀量化的PCM信号,然后把输入语音信号的每240个样点组成一个帖,也就是30ms的帧长。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。