语音信号的带宽扩展.docx

语音信号的带宽扩展.docx

ID:48995752

大小:10.62 KB

页数:4页

时间:2020-02-26

语音信号的带宽扩展.docx_第1页
语音信号的带宽扩展.docx_第2页
语音信号的带宽扩展.docx_第3页
语音信号的带宽扩展.docx_第4页
资源描述:

《语音信号的带宽扩展.docx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2.3带宽扩展的基本方法首先有个待限语音信号snb(n),和窄带激励信号enb(n),然后从窄带激励信号enb(n)中生产处宽带激励信号e^bb(n).下一步就是用估计的宽带谱包络来对宽带激励信号进行频谱整形。原始信号是窄带语音信号,因此需要一个高通滤波器来除掉冗余的频率分量。最后,估计得到的高频成分结合原始窄带信号中的低频成分得到宽带语音信号,实现了带宽扩展。3.1线性预测分析基本思想:语音信号的每个取样值都能够用过去若干个取样值的线性组合(预测值)来逼近,通过最小化是基于语音信号取样值和线性预测值之间的均方误差,赖觉决定一组预测器

2、的系数。为明确语音信号的时段和平均平方误差,本文提供了两种方法:方法自相关方法协方差方法适用条件限制输入的语音信号限制平均平方误差做法用长度是N的矩形窗用长度是N的矩形窗矩阵特性对称并且是Toeplitz结构对称;在计算误差范围外的语音采样点也是需要的3.2谱包络的参数表示1.自回归系数(AR):用离散时变滤波器来模拟嘴和鼻窍,适用于语音编码和语音分析,2.倒谱系数:语音信号是激励信号和声道响应卷积得来的,利用倒谱法可以分别计算每个源信号和参数对语音的影响,倒谱法是对语音信号求FFT,然后在对其求对数,再求逆运算。3.MFCCs:是利

3、用人的听觉系统,人类对单个音调的感知强度与MEL频域的对数成正比;当同时发出两个频率相近的音调时,人类只能识别一个,一次两个频率必须相差一定带宽时,一定要有临界带宽。MFCC求取过程:a、语音信号的预处理:对语音进行预加重、有音无音检测、分帧及加窗处理、得到可以用于提取特征参数的语音向量。b、对已经预处理的语音向量进行DFT;c、将上步得到的离散频谱用序列三角滤波器进行滤波处理,得到一组系数;d、利用DCT将滤波器输出变换到倒谱域。MEL尺度把声音信号的频域空间向人的感知的频域空间进行映射,以使滤波器的空间尺度接近人类听觉的感知尺度。

4、在语音频带扩展方面,MFCCs不如LPC及倒谱系数;在语音识别方面MFCCs却比LPC及倒谱系数更有优势。4、线谱频率:在对频率量化时LFS的稳定性要好于LPC3.3标量语音特性这些特性独立于谱包络:过零率:包含了一帧内信号穿过过零电平的次数信息,清音和噪音的过零率较高,浊音的过零率较低。梯度指数:这个特型描述了关于信号方向改变的信息,在没有很大起伏的浊音帧时,梯度指数的值很小,在清音帧时,梯度指数很大。基音频率:其语发音者的性别有关,提取基频的基本方法是自相关法:语音的短时自相关函数在基音周期的整数倍点上有很大的峰值,只要找到最大峰

5、值点的位置,便能估计出基音周期。问题是—最大峰值点的位置有时不能同基音周期相吻合,原因是a、可能是因为窗的长度太短,一般认为窗长至少应大于两个基音周期,才有好效果,语音中最长基音周期约为20ms,因此窗长应大于40ms。b、可能是声道特性的影响,主要是省道共振峰的影响,解决问题是用电平消波法,消波电平的确定方法:将输入的语音数据分为3个等长的子帧,分别在第一和第三子帧中寻找最大波峰值,消波电平取为两个峰值中较小的峰值和一个比例因子的乘积。峰度:无量纲,一般浊音的峰度较低,在爆破音和元音的开始,局部峰度有很大的峰值,局部峰度很难区分强的

6、浊音和清音,因此一般不用这个特性。谱质心:谱质心定义为带限语音幅度谱的重心,谱质心的取值范围是0—1,谱质心的大小主要取决于语音的浊音,对于浊音,谱质心的值是0.28左右。基于能量特征:主要是在标量上可以整个语音的平均值。能够区分语音与停顿;能够区分元音和擦音,元音>擦音;可以运用在标量和矢量上。归一化帧能量:在长期的估计中通过归一化短时能量,可以消除由于不同说话人、不同的记录和传播环境带来的能量差别。相对帧能量:依于噪声检测,主要应用于背景噪声。归一化相对帧能量:独立于短时能量的差异高通能量与低通能量的比值:用于区分清浊音,对清音此

7、值很增大,应用的是高通滤波器与低通滤波器的比值,来保证系统的稳定性。3.4距离测量在语音质量的测评,语音编码的码本训练,频带扩展和码书的研究都有重要作用。对数谱偏差:主要比较谱包络对数谱的均方根偏差:倒谱距离:似然比距离:其他的谱距离测量:人类感觉系统的特性:频率越高,人类的分辨率越低;如果估计谱的幅度高于原始谱的幅度,就会有人工语音的产生4激励信号的扩展4.1窄带激励信号的估计从窄带语音信号中提取出窄带激励信号,首先运用低阶的预测误差滤波器来移动谱包络,也可以估计出窄带谱包络,窄带激励信号运用在时间域内,若要要运用在频域,可以运用D

8、FT/FFT来转换到频域4.2用非线性特性扩展窄带激励信号1、Half-wayrectificationa、信号的平均值不在为0;b、不在节省能量;c、可能产生含有基带频率的谐波。2、Full-wayrectificat

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。