欢迎来到天天文库
浏览记录
ID:23908735
大小:728.00 KB
页数:5页
时间:2018-11-11
《多带激励语音编码的实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、----------专业最好文档,专业为你服务,急你所急,供你所需-------------文档下载最佳的地方多带激励语音编码的实现时间:2009-05-3110:26:37 来源:现代电子技术 作者:侯红芳张太镒0引言 语音作为人类交流信息的主要手段之一,在通信系统中占据重要的地位。随着数字通信技术的发展和多样化商业应用的需求,语音信号处理成了数字通信中最重要、最基本的组成之一。虽然现在已经有光纤通信等大容量通信手段,但是,在移动通信、卫星通信、军事通信中,节省带宽仍然非常重要。传统的PCM等占用大量信道带宽的语音编码技术,已远远不能满足现代数字通信的需要。欧美、日本
2、等国一直在努力通过降低语音编码速率来扩大通信系统的容量。在我国,对低速率语音编码技术也有迫切的需要,如保密通信、短波信道、水声信道等对码率要求严格的应用场合。但现有语音编码的国际标准传输速率都较高(一般在8Kb/s以上),而现有的一些低速率语音编码方案的话音质量又不尽人意。因此,如何有效地降低编码速率将一直是重要的研究课题。多带激励语音声码器(Multi-BandExcited,MBE)在2.4~4.8Kb/s速率上能合成出音质比传统声码器好得多的语音,而且具有较好的自然度和容忍环境噪声的能力,是目前这一速率范围内比较理想的参数编码方案。1MBE编码(语音分析)1.1MBE模
3、型 美国MIT大学林肯实验室1988年提出了多带激励(MBE)语音编码方案。 MBE语音模型如图1所示,把激励频谱分成许多互不交迭的频带,对每一频带分别进行二元清、浊音判决,这就是多带激励的由来。这样就允许特定语音帧的激励信号可以是周期能量(浊音)和噪声能量(清音)的混合,在一定程度上增加了模拟激励的自由度,因而使MBE语音模型能产生高质量的语音,而且使MBE语音模型有更强的抗背景噪声能力。1.2参数提取算法 MBE语音模型主要参数包括:基音周期;各谐波带清浊音判决信息;各谐波对应谱包络幅度。按照MBE算法原理图(图2),参数提取算法的实现分为如下四个步骤:---
4、-------专业最好文档,专业为你服务,急你所急,供你所需-------------文档下载最佳的地方----------专业最好文档,专业为你服务,急你所急,供你所需-------------文档下载最佳的地方 (1)基音周期粗估 基音周期的粗估采用在时域内进行的方法。因为实际计算中证明,频域中计算量特别大,并不好用。为解决这一问题,本文采用时域自相关函数来估计基音周期的方法,这个方法的计算量比频域法少得多,但只能在基音周期的整数点值上进行。MBE算法就是对每一帧语音信号,在基音周期预估值范围内(一般在P=20~147之间),计算误差函数Ep(P),使误差函数最小
5、的频率值P就是基音估计的粗估值P1。误差函数: (2)基音周期细搜索 基音周期的细搜索采用在频域内进行的方法,可以进一步在频域范围内进行非整数基音周期的估计,从而提高基音周期估计的精度。即在粗估基音P1邻域内进行细搜索,确定更精确的基音周期候选值Pt:P1-9/8,P1-7/8,…,P1+7/8,P1+9/8。通过上述算法,可以得到真正基音周期P0。 (3)谐波带清浊音判决(U/V判决) 研究证明,清音带与浊音带不会频繁交替,而是保持着一定的连续性,这样在编码速率较低时,可以将相邻的几个谐波频带划分在一起,共同进行清浊音判决。本文将相邻的3个谐频带划分
6、在一起,整个频带采用最多分成12个带的方法进行清浊判决。判决阈值采用自适应值,如果拟合误差小于阈值,判为浊音,否则判为清音。 (4)谱幅度估计 确定U/v后,就可以对各谐波的包络幅度做最后的确定: ----------专业最好文档,专业为你服务,急你所急,供你所需-------------文档下载最佳的地方----------专业最好文档,专业为你服务,急你所急,供你所需-------------文档下载最佳的地方2MBE解码(语音合成) 多带激励模型语音合成的方法大体分为两类,即频域合成法与时域合成法。频域合成法先用收到的参数构成重建语音谱,然后利用傅里
7、叶反变换得到时域序列,相当于分析过程的逆过程。这种方法比较直接,但不能保证合成语音基音周期的平滑变化,特别当帧长比较长的时候会产生基音周期跳变,使合成语音不自然。时域合成法能利用插值实现帧与帧之间基音周期平滑过渡,合成出更自然的语音。因此在实际的MBE算法中都采用这种方法。如图3所示,浊音Sv(n)与清音Su(n)是分开合成的,最后将他们相加,形成完整的合成语音SR(n)。 本文对于浊音部分的语音采用时域合成法,因为该方法可利用插值实现帧与帧之间基音周期的平滑过渡,合成出更自然的语音。而对于清音部分
此文档下载收益归作者所有