欢迎来到天天文库
浏览记录
ID:17952530
大小:84.00 KB
页数:9页
时间:2018-09-11
《共振峰提取的几种方法解析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、题目:共振峰提取技术的理论研究作业题目与要求:题目:共振峰提取技术的理论研究要求:(1)大量查阅关于共振峰提取技术的资料(通过Internet或图书馆,在Internet上可以通过搜索:formantEstimation等关键字来查找相关的信息)。(2)分析总结各种共振峰分析方法及其应用领域;(3)写一篇关于共振峰提取技术及其应用技术现状的论文。一、共振峰的概念共振峰是反映声道谐振特性的重要特征,它代表了发音信息的最直接的来源,而且人在语音感知中利用了共振峰信息。所以共振峰是语音信号处理中非常重要的特征参数,已经广泛地用作语
2、音识别的主要特征和语音编码传输的基本信息。共振峰信息包含在频率包络之中,因此共振峰参数提取的关键是估计自然语音频谱包络,一般认为谱包络中的最大值就是共振峰。与基因检测类似,共振峰估计也是表面上看起来很容易,而实际上又受很多问题困扰。这些问题包括:(1)虚假峰值。在正常情况下,频谱包络中的极大值完全是又共振峰引起的。但在线性预测分析方法出现之前的频谱包络估计器中,出现虚假峰值是相当普遍的现象。甚至在采用线性预测方法时,也并非没有虚假峰值。为了增加灵活性会给预测器增加个额外的极点,有时可利用这些极点代表虚假峰值。(2)共振峰合并
3、。相邻共振峰的频率可能会靠的太近而难以分辨。这时会产生共振峰合并现象,而探讨一种理想的能对共振峰合并进行识别的共振峰提取算法存在很多实际困难。(3)高音调语音。传统的频谱包络估计方法是利用由谐波峰值提供的样点。高音调语音的谐波间隔比较宽,因而为频谱包络估值所提供的样点比较少,所以谱包络的估计就不够精确。即使采用线性预测进行频谱包络估计也会出现这个问题。在这样的语音中,线性预测包络峰值趋向于离开真实位置,而朝着最接近的谐波峰位移动。共振峰参数包括共振峰频率、频带宽度和幅值,共振峰信息包含在语音频谱的包络中。因此共振峰参数提取的
4、关键是估计语音频谱包络,并认为谱包络中的最大值就是共振峰。利用语音频谱傅里叶变换相应的低频部分进行逆变换,就可以得到语音频谱的包络曲线。依据频谱包络线各峰值能量的大小确定出第1~第4共振峰,如图所示。二、提取共振峰的方法提取共振峰的几种常用方法包括:(1)基于线性预测(LPC)的共振峰求取方法。一种有效的频谱包络估计方法是从线性预测分析角度推导出声道滤波器,根据这个声道滤波器找出共振峰。虽然线性预测法也有一定的缺点,例如其频率灵敏度与人耳不相匹配,但对于许多应用来说,它仍然是一种行之有效的方法。线性预测共振峰通常有两种途径可
5、供选择:一种途径是利用一种标准的寻找复根的程序计算预测误差滤波器的根,称为求根法;另一种途径是找出由预测器导出的频谱包络中的局部极大值,称为选峰法。(2)倒谱法。声道响应的倒谱衰减很快,在[-25,25]之外的值相当小,因此可以构造一个相应的倒谱滤波器,将声道的倒谱分离,对分离出来的倒谱做相应的反变换,就可以得到声道函数的对数谱,对此做进一步处理即可求得所需的各个共振峰。三、提取共振峰的实现(1)基于线性预测(LPC)在语音信号的LPC模型中,语音信号样本s(n)可由如下差分方程表示:式中,u(n)为激励函数,G是增益,{a
6、k;k=1,2,……P}是LPC系数。相应的数字滤波器传递函数H(z)为上式还可表示为P个极点的级联形式:式中,是H(z)在Z平面上第k个极点:若H(z)是稳定的,其所有极点都在z平面的单位圆内。则第k个共振峰的频率和带宽分别为和,T为语音信号采样周期。语音信号的共振峰能由数字激光器传递函数H(z)进行估计,最直接的方式是对H(z)进行多项式求根,由所求的根来判断共振峰或谱形状极点。然而,该方法难以快速而有效地找到根值。另一有效的获取共振峰的途径是语音信号LPC谱的谱峰检测的方法进行估计共振峰,该方法需要解决共振峰台并的问题
7、。McCandless试图采用在z平面单位圆内重复计算H(z)的方式来分离合并的共振峰,另一个有效的方法是采用对数LPC谱的二阶导数进行估计共振峰,取得较好效果。(2)倒谱法语音信号不是加性信号,而是卷积信号。为了能用线性系统对其进行处理,可以先采用卷积同态系统处理。经过卷积同态系统后输出的伪时序序列称为原序列的“复倒频谱”。它的定义式可以表示为:倒谱或称“倒频谱”的定义为:它和复倒谱的主要区别是对序列对数幅度谱的傅立叶逆变换,它是复倒谱中的偶对称分量。它们都将卷积运算,变为伪时域中的加法运算,使得信号可以运用满足叠加性的线
8、性系统进行处理。复倒谱涉及复对数运算,而倒谱只进行实数的对数运算,较复倒谱的运算量大大减少。如果和分别是和的倒谱,x(n)=*,那么x(n)的倒谱c(n)=+。(2)倒谱法选择最普遍的极零模式来描述声道相应x(n),其z变换的形式为:经过傅立叶变换,取对数和逆傅立叶变换后可以得到其复倒谱:
此文档下载收益归作者所有