资源描述:
《语音编码总结》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、语咅编码总结一、历史与概念1、模拟的声音信号话音信号:(口语发声的)200Hz~3400Hz调幅广播信号:(无线广播)50Hz到7000Hz调频广播信号:(无线广播)20Hz到16000Hz激光唱机信号(CD):10Hz~20000Hz2、话音编码技术的历史回顾;高保真立体音频16位44」k905.6kPCMISO;64k-128kMPEG每声道在32k〜448k!!无线JZMI';;:无靈AM14後16k224kPCM64k[I:;■;64kPCM88k;子带ADPCM;I;!■!!(Toll)G.711:88年G.722:
2、]10205(
3、)20034007000160020000Hz话音编码研究的历史表明,这一领域的研究成果直接为通信产业发展提供了源动力。目前IP电话所用的编码的标准有G.723.1,G.728,G.729o具有低延迟、低码率、低复杂性、高音质的话音编码算法将是未来IP电话网络的奠基石。3、若干概念术语(1)数字信号:标称的不连续信号。它可以用离散的步差从一个状态转变到另一个状态。(2)釆样:按周期T对模拟信号进行测量,称为采样。采样频率Fs=l/T.在满足奈奎斯特定理时,从采样值可准确的恢复原信号。(1)量化用数字信号表示话音的过程称为量化。(4)非均匀量化
4、非均匀量化可以兼顾动态范围和小信号的系统精度。Reeves提出概念。即对大信号取较大的量化步长。对小信号取较小的量化步长。二、矢量量化将k个样点构成的有序集(信源矢量集合)映射为M个恢复失量构成的有限集A(码书,码本)中的某个矢量Yi(码字,码元)的映射,称为矢量量化,它是对标量量化在K维空间的一个推广。标量量化矢量量化量化对象单个釆样点K个采样点集合划分在一维幅度轴上划分有限个区间1=[aOa1)…n=[an-1an)在k维空间里,划分成有限个子空间S={S/
5、/=1,2,-M}量化过程在毎个区间里,选一个代表值fii1=1,2,...n在
6、每个子空间里,选一个代表矢量Yi={Yil,Yi2,Yii}Yi{Si}i=1,2,...M最化方法对任一模拟信号,当其标称值属于区间i时,就用数字信号fi代表值对任一k维模拟信号的矢量。当其标称值属于子区间Si时,就用代表矢量Yi去量化之。1>码本设计的LBG方法(1)在矢量空间X屮,进行最佳划分,即,把X划分成M个子空间Si使平均失真最小。(2)对划分后的了空间Si求出其形心作为新的最佳代表矢量Yi,从而构成新的码本。将上述步骤反复迭代,最终求出最佳码本和量化器。(3)初始码本的选择:A、随机选取,迭代时间较长B、分裂法(4)LBG方法不
7、是最优化方法,即迭代过程不能保证收敛到全局最小值。后來有人提出模拟退火法,将LBG方法收敛到局部最小值吋,采用某种扰动将迭代过程继续进行下去。2、空间分布对矢量量化的影响LBG算法把问题简化为:在矢量空间中,样点的分布是均匀的。但实际的应用场合往往不满足这个前提。因此应考虑空间分布,空间分布对量化值的选择有很重要的影响。对矢量的情况,影响依然存在。3、语音编码方案的三种类型语音编码的主要任务:对量化的话音信号施加某种数字变化,使其具有适于数字信道传输的形式,同时尽可能多信号所承载的信息。话音信号的剩余度主要表现在三个方面:(1)相邻样点存在较
8、强的相关性(2)对浊音信号存在周期(准周期)性(3)信号短时平稳,时不变性此外,人类听觉对话音有选择效应,即当一个强音与一个弱音同时存在时,人类听觉能够自动抑制弱音的效果,称为人耳的“掩蔽效应”。这些是话音压缩编码的出发点。3.1波型编码:对话音信号的每一个样点进行量化、编码和传输。因此,波型编码是没有延迟的话音编码方案。3.1.1差值脉码调制(DPCM和△■调制)一位的DPCM系统成为△■调制或增量调制DMo流程图如下:Si编码器解码器这里,八表示对应的量化值,上标~表示对应的预测值,用ei表示差值di的量化误差。收端恢复的量化信号只与差值
9、信号的量化误差有关,而与预测器性质无关。(1)当信号变化快时,恢复波形跟不上信号的变化,称为”斜率过载“(2)对于零信号,DM方法交替输出一串0和1,这种随机交变电平成为“颗粒噪声”o解决办法是在量化器引入自适应阶矩调整机制(ADM)o如果口适应调整依据输入信号,称为前向口适应。如果口适应调整依据是量化器输,称为后向自适应。前向自适应将导致延迟的产生,后向自适应有可能不稳定。3.1.2连续可变斜率增量调制(CVSD)其原理可用下图说明:当反馈冋路屮,出现连续四个“T或连续四个“0”时,表明系统出现斜率过载的情况,此时或门输出一个高电平,驱动触
10、发器改变量化的阶矩的大小,以便适应输入信号的变化。3.1.3自适应差值脉码调制(ADPCM)PCM:非均匀量化。D:调制。差值调制。CVSD:口适应概念将脉码调制、