语音信号采集与时频域分析正文

语音信号采集与时频域分析正文

ID:16518188

大小:476.00 KB

页数:17页

时间:2018-08-13

语音信号采集与时频域分析正文_第1页
语音信号采集与时频域分析正文_第2页
语音信号采集与时频域分析正文_第3页
语音信号采集与时频域分析正文_第4页
语音信号采集与时频域分析正文_第5页
资源描述:

《语音信号采集与时频域分析正文》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、燕山大学课程设计说明书第一章引言语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和频域等处理方法。语音信号可以认为在短时间内(一般认为在10~30ms的短时间内)近似不变,因而可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。任何语音信号的分析和处理必须建立在“短时”的基础上,即进行“短时分析”。时域分析:直接对语音信号的时域波形进行分析,提取的特征参数有短时

2、能量,短时平均过零率,短时自相关函数等。频域分析:对语音信号采样,并进行傅里叶变换来进行频域分析。主要分析的特征参数:短时谱、倒谱、语谱图等。本文采集作者的声音信号为基本的原始信号。对语音信号进行时频域分析后,进行加白噪声处理并进行了相关分析,设计滤波器并运用所设计的滤波器对加噪信号进行滤波,绘制滤波后信号的时域波形和频谱。整体设计框图如下图所示:图1.1时频域分析设计图图1.2加噪滤波分析流程图第17页共17页燕山大学课程设计说明书第17页共17页燕山大学课程设计说明书第二章语音信号时域分析语音信号的时域分析可直接对语音信号进行时域波形分析,

3、在此只只针对语音信号的短时能量、短时平均过零率、短时自相关函数进行讨论。2.1窗口选择由人类的发生机理可知,语音信号具有短时平稳性,因此在分析讨论中需要对语音信号进行加窗处理进而保证每个短时语音长度为10~30ms。通常选择矩形窗和哈明窗能得到较理想的“短时分析”设计要求。两种窗函数的时域波形如下图2.1所示:图2.1矩形窗和Hamming窗的时域波形矩形窗的定义:一个N点的矩形窗函数定义为如下(2.1)哈明窗的定义:一个N点的哈明窗函数定义为如下(2.2)这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现(如图2.2):矩形

4、窗的主瓣宽度小(4*pi/N),具有较高的频率分辨率,旁瓣峰值大(-13.3dB),会导致泄漏现象;哈明窗的主瓣宽8*pi/N,旁瓣峰值低(-42.7dB),可以有效的克服泄漏现象,具有更平滑的低通特性。因此在语音频谱分析时常使用哈明窗,在计算短时能量和平均幅度时通常用矩形窗。表2第17页共17页燕山大学课程设计说明书.1对比了这两种窗函数的主瓣宽度和旁瓣峰值。图2.2矩形窗和哈明窗的频率响应表2.1矩形窗和哈明窗的主瓣宽度和旁瓣峰值窗函数主瓣宽度旁瓣峰值矩形窗4*pi/N13.3dB哈明窗8*pi/N42.7dB2.2短时能量短时能量主要分析

5、语音信号能量随时间的变化,由于语音信号的清音和浊音之间能量有较大的差距,进而可通过短时能量对语音的清浊音进行分析。定义短时能量为:(2.3)其中N为窗长,当选用矩形窗时则有:(2.4)由式(2.3)能量函数反应语音信号的幅度,同时由图2.3~2.4可知窗长对能量函数起着决定性作用。窗长太大,不能反应能量的变化,窗长太小,不能得到平滑的能量函数。短时能量函数的应用:1)可用于区分清音段与浊音段。值大对应于浊音段,第17页共17页燕山大学课程设计说明书值小对应于清音段。2)可用于区分浊音变为清音或清音变为浊音的时间(根据值的变化趋势)。3)对高信噪

6、比的语音信号,也可以用来区分有无语音(语音信号的开始点或终止点)。无信号(或仅有噪声能量)时,值很小,有语音信号时,能量显著增大。图2.3不同矩形窗长的短时能量函数图2.4不同哈明窗长的短时能量函数2.3短时平均过零率短时过零率可以粗略估计语音的频谱特性。高频率对应着高过零率,低频率对应着低过零率,那么过零率与语音的清浊音就存在着对应关系:清音的过零率高,浊音的过零率低。定义短时平均过零率:(2.5)其中为符号函数,。在矩形窗条件下,可以简化为:(2.6)第17页共17页燕山大学课程设计说明书图2.5矩形窗(N=320)条件下的短时平均过零率由

7、图2.5可知为某一语音在矩形窗条件下求得的短时能量和短时平均过零率。分析可知:清音的短时能量较低,过零率高,浊音的短时能量较高,过零率低。清音的过零率为0.5左右,浊音的过零率为0.1左右,两但者分布之间有相互交叠的区域,所以单纯依赖于平均过零率来准确判断清浊音是不可能的,在实际应用中往往是采用语音的多个特征参数进行综合判决短时平均过零率的应用:1)区别清音和浊音。例如,清音的过零率高,浊音的过零率低。此外,清音和浊音的两种过零分布都与高斯分布曲线比较吻合。2)从背景噪声中找出语音信号。语音处理领域中的一个基本问题是,如何将一串连续的语音信号进

8、行适当的分割,以确定每个单词语音的信号,亦即找出每个单词的开始和终止位置。3)在孤立词的语音识别中,可利用能量和过零作为有话无话的鉴别。2.4短时自相

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。