语音信号矢量量化编码技术分析

语音信号矢量量化编码技术分析

ID:33955387

大小:1.36 MB

页数:46页

时间:2019-03-02

语音信号矢量量化编码技术分析_第1页
语音信号矢量量化编码技术分析_第2页
语音信号矢量量化编码技术分析_第3页
语音信号矢量量化编码技术分析_第4页
语音信号矢量量化编码技术分析_第5页
资源描述:

《语音信号矢量量化编码技术分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、长存1=业人学硕I:学位论文第一章引言1.1语音编码技术发展概况到目前为止,语音的压缩编码可以分为波形编码、参数编码以及混合编码三大类。波形编码使重建语音波形与原始语音波形尽量保持一致。这种压缩编码具有适应能力强、语音质量好、编码算法简单等优点,但是编码速率高,例如PCM编码,速率为64Kbps。为了降低数码率,CCITT于1984年lO月提出了ADPCM编码算法02721),建议在l路64Kbit/sPCM话路中传输2路话音信号,即将输入的PCM数字话音信号经过差分后对差值进行4bit编码,因此数码率为32Kbit/s,其语音质量达到了P

2、CM语音的质量。经过三年多时间的修改,CCITT使32Kbit/s的ADPCM能够实现16/24/32/40Kbiffs四种数码率。至此,波形编码已经形成了一个完整的系列,并且得到了广泛的应用。然而,在16Kbit/s数码率以下继续进行波形编码,其话音质量将迅速下降。因此,要在更低的速率下进行语音压缩编码,必须找到新的算法,参数编码就是在这样的背景下提出来的。参数编码又称为声源编码,是将话音信号在频域或其他正交变换域中提取能够表征语音信号的特征参数,并将其变换成数字序列进行传输。解码是将接收到的数字序列经过变换恢复出特征参数,再根据特征参数

3、重建语音信号。参数编码是以人的发音机制模型为基础,用一系列模拟声道频谱特性的滤波器系数和若干声源参数来描述这个模型,将通过语音线性分析后得到的特征参数编码后进行传输。线性预测编码(LPC)及其各种改进型都属于参数编码。这种编码方式的速率可达到2Kbit/s--4.8Kbit/s,甚至更低,语音的清晰度尚可,但自然度不好,即有时分辨不出男、女声,对背景噪声很敏感,所以主要用于军事通信系统中。近些年来,人们在LPC研究基础上对16Kbit/s以下的高质量语音编码技术进行了深入的研究,发现混合编码能解决波形编码和参数编码两者的缺点,即将两者结合起

4、来,尽量保留波形编码和参数编码的优点。在混合编码中,数字语音信号中既包括了若干语音特征参数又包括了部分波形编码信息。混合编码可将数码率压缩到4Kbit/s~8Kbit/s。在8Kbiffs-一16Kbit/s范围内能达到良好的语音质量。目前以混合编码技术为基础的压缩编码方案包括:多脉冲线性激励预测编码(Multi.PulseLinearPredictiveCoding),欧洲GSM中的规则脉冲激励预测编码(Regular-PulseExcitationCoding),码激励线性预测编码(CodeExcitedLinearPredictive

5、Coding),多带激励语音编码(Multi.BandExcitation)。长存‘r业人学硕1:学位论文1.2论文研究的主要内容和目标本论文的内容主要涉及低速率语音编码的基本概念和原理。把重点放在语音编码中的矢量量化技术原理的研究和应用方面。并以FSl016语音编解码器为基础,将FSVQ用于CELP声码器中,即用FSVQ算法代替CELP声码器的参数量化编码功能模块。通过这种思想改善原来声码器的语音编码质量。以下是论文的主要内容:第一章简要讲述了语音编码技术的发展历史。第二章从语音产生的离散时域模型出发,接着讲述了语音压缩的理论依据,语音编

6、码性能的评价指标以及语音的时域分析。第三章详细讲述了低速率语音压缩编解码中矢量量化技术的基本概念,矢量量化的分类及关键技术。它是本论文的理论基础。第四章讲述了码激励线性预测编码的原理及其中的矢量量化技术。第五章对典型的CELP算法进行了改进,即将FSVQ技术应用于CELP的参数量化编码模块。最后对全文作了总结。2K备T业人学硕I:学位论文第二章语音压缩编解码技术基础2.1语音产生的离散时域模型在对语音进行压缩之静,需要了解语音信号的产生机理以及它的一些重要特点,在此基础上得出语音信号产生的离散时域模型。根据产生方式的不同,人的语音可以分为浊

7、音和清音两种。区分这两种不同性质的语音,对于语音编码及语音合成都有非常重要的意义。人的发音器官包括肺、气管、喉、咽、鼻和口等,这些器官共同形成一条形状复杂的通道。其中喉以上的部分包括咽、口腔和鼻腔称为声道,其形状随发出声音的不同而变化。喉部两片声带之间的空隙称为声门,当人说话时,两声带合拢因而受声门下气流的冲击而张开,又由于声带的韧性迅速闭合。这一过程周而复始的进行,就形成了一串周期性的脉冲气流进入声道。这一周期脉冲串的周期称为“基音周期”,用品表示,它表示声门每开启和闭合一次的时间;其倒数称为“基音频率”,用无表示。声带振动的频率即基音决

8、定了声音频率的高低,频率快则音调高,频率慢则音调低。男性说话者的以值大约在60~200Hz范围,女性和小孩说话者的无值在200---450Hz之间。用上述方式发出的语音称为“浊音

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。