语音信号处理及其在IP网络电话中的应用

语音信号处理及其在IP网络电话中的应用

ID:43573409

大小:32.50 KB

页数:4页

时间:2019-10-11

语音信号处理及其在IP网络电话中的应用_第1页
语音信号处理及其在IP网络电话中的应用_第2页
语音信号处理及其在IP网络电话中的应用_第3页
语音信号处理及其在IP网络电话中的应用_第4页
资源描述:

《语音信号处理及其在IP网络电话中的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、语音信号处理及其在IP网络电话屮的应用作者:徐止伟汤静引言从技术角度讲,语音信号处理是信息高速公路、多媒体技术、办公自动化、现代通信及智能系统等新兴领域应用的核心技术之一。用数字化的方法进行语音的传送、存储、识别、合成、增强等是整个数字化通信网中最重要、最基本的组成部分之一。作为语咅信号处理最重要应用之一的IP网络电话,由于具有价格低廉,可以灵活地提供各种增值业务,有利于企业建立高效综合服务内部网,有利于运营商开拓新的市场,有助于和新技术的融合以及促进网络技术发展等许多独特的应用优势而在近年里得到迅猛发展。IP网络电话屮的语音处理主要需

2、解决两个问题,一是在保证一定话音质量的前提下尽可能降低编码比特率,二是在IP网络环境下保证一定的通话质量。前者主要是语音编码技术,包括静音检测;后者包括分组丢失补偿和回波抵消技术。在语咅编码方面,如何在屮低速率上获得高质量的语音且算法复杂度较小,一直是研究的主要口标。70年代屮期,特别是80年代以来,语音编码技术有了突破性进展,提出如多脉冲激励等一些有效的算法,产生了新-•代的声码器,在16kbit/s以下速率上能够得到高质量的语音。计算机和集成电路技术的发展,推动了语音信号处理的实用化。目前有很多专用语音处理芯片,这些芯片与微处理器或

3、微型计算机相结合可以组成各种复朵的语音处理系统。语音信号的基本特点及其产生模型1.语音信号的特点语咅是由一连串的音所组成,它是组成语言的声音。语音具有称为声学特征的物理性质。语咅屮各个咅的排列由一些规则所控制。形成文章的基础是单词,各单词由音节组成,咅节又由咅素组成。音素分为两类:元音和辅音。重音、语调和声调也是构成语音学的一部分。声道(由咽、口腔和鼻腔组成)是一个分布参数系统,它有许多自然谐振频率(在这些频率上其传递函数具有极大值),所以声道是一谐振腔,它放大某一频率而衰减其他频率分量。谐振频率由每一瞬间的声道外形决定。讲话吋,舌和唇

4、连续运动,使声道常常改变外型和尺寸,随即改变谐振频率。这些谐振频率称为共振峰频率,简称为共振峰,它是声道的重要声学特征。1.语音信号的数字模型(1)激励模型(发声模型)发浊音吋,整个激励模型可表示为:发清音吋,声道可模拟成随机白噪声。(2)声管模型(声道模型一)最简单的声道模型是将其视为rti多个不同截面积的管子串联而成的系统,在语音信号的某一“短吋”期间,声道可表示为形状稳定的管道。每个管子可看作为一个四端网络,这个网络具有反射系数,这吋声道可rti—组截面积或一组反射系数来表示。(3)共振峰模型(声道模型二)将声道视为一个谐振腔,共

5、振峰就是这个腔体的谐振频率。可以建立三种实用模型:级联型、并联型和混合型。(4)辐射模型(终端模型)口唇的辐射效应可表示为R(z)=RO(l-z-l)。由上所述,完整的语音信号数字模型可以用三个子模型:激励模型、声道模型和辐射模型的串联来表示。其转移函数为H(z)=U(z)V(z)R(z)这里,U(z)是激励信号,V(z)是声道传递函数。R(z)如上式所示。语音信号的分析根据所分析的参数不同,语音信号分析可分为吋域、频域、倒谱域等方法。吋域分析具有简单、运算小、物理意义明确等优点;但更为有效的分析多是围绕频域进行的。另一方面,按照语咅学

6、观点,可将语音分析分为模型分析法和非模型分析法两种。贯穿于语音分析全过程的是“短吋分析技术”。相应于不同的分析方法,也就有不同的语音编码方法和标准。语音编码标准±IITU-T制定的IP电话使用的语音编码标准如下表所示:(1)G.711G.711是电话网中广为使用的64kbit/sPCM编码,属波形编码。目前TP网络电话一般采用5〜16kbit/s比特率的中低速率编码器,但一般都支持G.711PCM编码。虽然波形编码理论上只要预测阶数足够高、量化误差足够小,重建信号将收敛于原信号,而参数编码无论怎样都不能使重建信号将收敛于原信号;但是参数

7、编码的一个重耍优势是可以有效降低编码比特率,从而得到越来越广泛的应用。下面的标准都是参数编码。(2)G.728G.728比特率为16kbit/s,对具有背景噪声的信号或音乐具有很好的健壮性,抗随机比特差错能力优TG.711,可通过所有的网络信号音,还能通过2.4kbit/s的低比特率modem信号。(3)G.723.1G.723.1为双速率语音编码器,其屮6.3kbit/s比特率采用多脉冲LPC编码,对于一般的语音信号,其语音质量相当于G.721,但对于童声、音乐和具噪声背景的语音输入,其质量不如ADPCMo5.3kbit/s比特率采用

8、多脉冲码木激励,定义该速率的口的是增加系统设计的灵活性。如用于低速率通道吋,可为视频编码器留击一些比特空间;可为复用系统提供lkbit/s的“虚信道”以传递附加信息。(4)G.729和G.729AG.729

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。