语音信号的时域和频域特征

语音信号的时域和频域特征

ID:40069523

大小:351.49 KB

页数:36页

时间:2019-07-19

语音信号的时域和频域特征_第1页
语音信号的时域和频域特征_第2页
语音信号的时域和频域特征_第3页
语音信号的时域和频域特征_第4页
语音信号的时域和频域特征_第5页
资源描述:

《语音信号的时域和频域特征》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第一章语音信号的时域及频域特征1.语音信号的主要特点1.1.语音信号带宽语音信号的带宽约为5KHz,主要能量集中在低频段。1.2.语音信号是典型的随机信号1)人的每次发音过程都是一个随机过程。很难得到两次完全相同的发音样本。2)在信号处理中,通常假设语音信号是短时平稳的。例如,可以认为在语音的浊音段部分,语音的二阶矩统计量是平稳的(在5~10mS内),即二阶矩平稳,或称为宽平稳。12.语音信号的时域波形语音信号的波形(shi4)2语音信号波形(shi4)的局部细节32.1.语音时域信号特征2.1

2、.1.语音时域信号的特点1)清音段:能量低,过零率高,波形特点有点像随机的噪声。这部分信号常与语音的辅音段对应。2)浊音段:能量高,过零率低,波形具有周期性特点。所谓的短时平稳性质就是处于这个语音浊音(元音)段中。3)过渡段:一般是指从辅音段向元音段信号变化之间的部分。信号变化快,是语音信号处理中最复杂、困难的部分。42.1.2.语音的短时能量、短时平均幅度和短时过零率N−12(1)短时能量:E=∑Sw(n)n=0N−1(2)短时平均幅度:M=∑Sw(n)n=0(3)短时过零率:N−1⎧⎫Z=1

3、sgn[S(n)]−sgn[S(n−1)]2⎨∑ww⎬⎩n=0⎭⎧1x≥0其中sgn[n]=⎨⎩−1x<053.语音信号的短时谱特征3.1.短时傅立叶谱分析对于能量受限的时域信号f(t),它的傅立叶变换可以写成∞−jωtfˆ(ω)=∫f(t)⋅e−∞以上这个傅立叶变换,在“宏观上”给出信号f(t)的频谱信息,但是却无法确定某个“局部”时间段频谱的确切信息。或者也可以说,我们不能通过观测局部的时域信号来了解整个f(t)的频谱信息。为此我们引入了所谓的短时傅立叶谱分析技术。6有许多技术都可以用来完成

4、信号的短时谱分析。最典型的就是小波变换和我们现在常采用FFT短时谱分析技术。傅立叶短时谱分析与窗的形状和位置有关(与时刻有关)。假设窗函数为w(t),那么信号f(t)的短时傅立叶变换为∞−jωtfˆ(ω)

5、=f(t)⋅w(t−t)⋅ewt0∫0−∞例如,如果选择窗的形式为一个高斯函数2t1−w(t)=e4a2πa7由于∞∞w(t−t)⋅dt=w(t)⋅dt=1∫00∫−∞−∞所以有∞fˆ(ω)

6、⋅dt=fˆ(ω)∫wt00−∞这说明fˆ(ω)可以被加窗后的短时谱fˆ(ω)

7、所精确地分解。wt0这

8、正是我们所希望的性质。8对于时域离散信号x(n),短时傅立叶变换定义:∞jω−jωmXn(e)=∑x(m)⋅w(n−m)⋅em=−∞这里w(n)为窗函数。例如,常用的窗函数有⎧1,0

9、分析。10∞jω−jωmXn(e)=∑x(m)⋅w(n−m)⋅em=−∞x(n)X(ejω)nw(n)−jωne11实现形式二:对具有低通性质的w(n)滤波器进行调制,得到带通滤波器,用此带通滤波器对信号x(n)进行分析。∞jω−jωnjωmXn(e)=e∑x(n−m)⋅w(m)⋅em=−∞X(ejω)nx(n)jωnw(n)⋅e−jωne123.2.语谱图:横轴表示时间,纵轴表示频率,用灰度表示对应频谱分量的信号强度。133.3.浊音谱特征3.3.1.浊音谱的谱线结构谱线结构是与浊音信号中的周

10、期信号密切相关的。具有与基音及其谐波相对应的谱线。3.3.2.浊音谱的共振峰结构频谱包络中有几个凸起点,与声道的谐振频率相对应。这些凸起点称为共振峰(Formant)。其频率称为共振峰频率。按频率由低到高依次为第一共振峰、第二共振峰…。相应频率用F1、F2、F3…来表示。14浊音信号的傅立叶分析谱153.3.3.元音三角形图所谓的元音三角形图就是指不同元音的F1、F2共振峰频率在平面图上的关系。163.4.清音谱特征清音的频谱无明显的规律,比较平坦。在语音识别中使用统计模型的方法加以解决。174

11、.基音与四声4.1.基音周期与基音频率1)基音的周期就是声带振动的周期。基音周期的倒数就是基音频率。2)基音是与人的声带长度、质量等物理量有关。因此与人的年龄、性别、情绪等生理状态有关。[注意]:音高(Pitch)与基音的关系。音高是听觉量,基音是物理量。正如冷热与温度的关系一样。18基音周期示意图194.2.基音的检测4.2.1.时域上的基音检测方法(1)AMDF法:定义平均幅度差函数N−l−1γ(l)=∑Sw(n+l)−Sw(n)n=0在这里S(n)是加窗截取的一段语音信号。w假设T为语音信

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。