欢迎来到天天文库
浏览记录
ID:35225109
大小:640.00 KB
页数:26页
时间:2019-03-22
《生产实习任务书2016》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、语音信号处理MATLAB实验24目录实验一语音信号预处理1实验二基于语音短时时域分析的应用2一、端点检测2二、基音周期估计6实验三语音信号频域特征分析13实验四语音信号线性预测分析17实验五谱减法语音增强方法研究2124实验一语音信号预处理1.实验目的掌握语音信号的预处理方法,包括对信号进行预加重,分帧、加窗、输入输出方法,语谱图等。熟悉语音信号处理中常用的MATLAB命令。2.实验原理由于语音信号从整体上来看是一个非平稳过程,但是在一个短的时间内,其特性保持相对不变,所以语音信号具有短时平稳性,对语音信号的分析和处理必须建立在“
2、短时”的基础上,将信号分为一段来分析其特征参数。人发音时存在口唇的辐射效应,口唇的辐射模型相当于一阶高通滤波器,所以在对实际信号进行分析处理时,常用“预加重技术”,目的提升信号的高频部分,使信号的频谱更加平坦,方便信号的分析。3.实验过程(1)读语音数据wavread,load(2)听语音sound(3)写语音wavwrite(4)对语音进行预加重(filter)一阶FIR高通数字滤波器,a为预加重系数,0.93、s,xlabel,title,wavwrite)(9)画频谱图specgram(signal,512,16000,hamming(512),256)4.实验结果24实验二基于语音短时时域分析的应用一、端点检测1.实验目的在理解语音信号短时能量和短时过零率的基础上掌握基于语音短时时域分析的端点检测方法。2.实验原理在复杂的应用背景下,从信号流中分辨出语音信号和非语音信号,是语音处理的一个基本问题。端点检测就是指从包含语音的一段信号中确定出语音的起始点和结束点。准确的端点检测对于语音识别和语音编码系统都有重要的意义,它可以使采集的数据4、真正是语音信号的数据,从而减少数据量和运算量并将少处理时间。判别语音段的起始点和终止点的问题主要归结为区别语音和噪声的问题。如果能够保证系统的输入信噪比很高,那么只要计算输入信号的短时能量就基本能够把语音段和噪声背景区别开来。但是,在实际应用中很难保证这么高的信噪比,仅仅根据能量来判断是比较粗糙的。因此,还需要进一步利用短时平均过零率进行判断,因为清音和噪声的短时平均过零率比背景噪声的平均过零率要高出好几倍,一般采用基音能量和过零率的语音端点检测方法——两级判决法。A.短时平均能量由于语音信号的能量随时间变化,清音和浊音之间的能量5、差别相当显著。因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。定义短时能量为:,其中N为窗长。可见,短时能量为一帧采样点值的加权平方和。特殊地,当采用矩形窗时,可简化为:窗函数的选择直接影响着短时能量的计算。如窗长N很大,这样的窗等效为很窄的低通滤波器,平滑作用非常显著,使得短时能量几乎没有多大变化,无法反映语音的时变特性。反之,若N过小,那么窗又不能提供足够的平滑,以至于语音振幅瞬时变化的许多细节仍然被保留了下来,从而看不出振幅包络的变化规律。通常N的选择与语音的基音周期相联系,一般要求窗长为几个基音周期的数量级。6、由于语音基音频率范围为50-500Hz,因此折中选择帧长为10-30ms。短时能量函数的应用:1)可用于区分清音段与浊音段。En值大对应于浊音段,En24值小对应于清音段。2)可用于区分浊音变为清音或清音变为浊音的时间(根据En值的变化趋势)。3)对高信噪比的语音信号,也可以用来区分有无语音(语音信号的开始点或终止点)。无信号(或仅有噪声能量)时,En值很小,有语音信号时,能量显著增大。B.短时平均过零率过零率可以反映信号的频谱特性。当离散时间信号相邻两个样点的正负号相异时,我们称之为“过零”,即此时信号的时间波形穿过了零电平的横7、轴。统计单位时间内样点值改变符号的次数具可以得到平均过零率。定义短时平均过零率:其中为符号函数,,在矩形窗条件下,可以简化为短时过零率可以粗略估计语音的频谱特性。由语音的产生模型可知,发浊音时,声带振动,尽管声道有多个共振峰,但由于声门波引起了频谱的高频衰落,因此浊音能量集中于3KHz以下。而清音由于声带不振动,声道的某些部位阻塞气流产生类白噪声,多数能量集中在较高频率上。高频率对应着高过零率,低频率对应着低过零率,那么过零率与语音的清浊音就存在着对应关系。.短时平均过零率的应用:1)区别清音和浊音。例如,清音的过零率高,浊音的过8、零率低。2)从背景噪声中找出语音信号。语音处理领域中的一个基本问题是,如何将一串连续的语音信号进行适当的分割,以确定每个单词语音的信号,亦即找出每个单词的开始和终止位置。3)在孤立词的语音识别中,可利用能量和过零作为有话无话的鉴别。C.端点检测研究
3、s,xlabel,title,wavwrite)(9)画频谱图specgram(signal,512,16000,hamming(512),256)4.实验结果24实验二基于语音短时时域分析的应用一、端点检测1.实验目的在理解语音信号短时能量和短时过零率的基础上掌握基于语音短时时域分析的端点检测方法。2.实验原理在复杂的应用背景下,从信号流中分辨出语音信号和非语音信号,是语音处理的一个基本问题。端点检测就是指从包含语音的一段信号中确定出语音的起始点和结束点。准确的端点检测对于语音识别和语音编码系统都有重要的意义,它可以使采集的数据
4、真正是语音信号的数据,从而减少数据量和运算量并将少处理时间。判别语音段的起始点和终止点的问题主要归结为区别语音和噪声的问题。如果能够保证系统的输入信噪比很高,那么只要计算输入信号的短时能量就基本能够把语音段和噪声背景区别开来。但是,在实际应用中很难保证这么高的信噪比,仅仅根据能量来判断是比较粗糙的。因此,还需要进一步利用短时平均过零率进行判断,因为清音和噪声的短时平均过零率比背景噪声的平均过零率要高出好几倍,一般采用基音能量和过零率的语音端点检测方法——两级判决法。A.短时平均能量由于语音信号的能量随时间变化,清音和浊音之间的能量
5、差别相当显著。因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。定义短时能量为:,其中N为窗长。可见,短时能量为一帧采样点值的加权平方和。特殊地,当采用矩形窗时,可简化为:窗函数的选择直接影响着短时能量的计算。如窗长N很大,这样的窗等效为很窄的低通滤波器,平滑作用非常显著,使得短时能量几乎没有多大变化,无法反映语音的时变特性。反之,若N过小,那么窗又不能提供足够的平滑,以至于语音振幅瞬时变化的许多细节仍然被保留了下来,从而看不出振幅包络的变化规律。通常N的选择与语音的基音周期相联系,一般要求窗长为几个基音周期的数量级。
6、由于语音基音频率范围为50-500Hz,因此折中选择帧长为10-30ms。短时能量函数的应用:1)可用于区分清音段与浊音段。En值大对应于浊音段,En24值小对应于清音段。2)可用于区分浊音变为清音或清音变为浊音的时间(根据En值的变化趋势)。3)对高信噪比的语音信号,也可以用来区分有无语音(语音信号的开始点或终止点)。无信号(或仅有噪声能量)时,En值很小,有语音信号时,能量显著增大。B.短时平均过零率过零率可以反映信号的频谱特性。当离散时间信号相邻两个样点的正负号相异时,我们称之为“过零”,即此时信号的时间波形穿过了零电平的横
7、轴。统计单位时间内样点值改变符号的次数具可以得到平均过零率。定义短时平均过零率:其中为符号函数,,在矩形窗条件下,可以简化为短时过零率可以粗略估计语音的频谱特性。由语音的产生模型可知,发浊音时,声带振动,尽管声道有多个共振峰,但由于声门波引起了频谱的高频衰落,因此浊音能量集中于3KHz以下。而清音由于声带不振动,声道的某些部位阻塞气流产生类白噪声,多数能量集中在较高频率上。高频率对应着高过零率,低频率对应着低过零率,那么过零率与语音的清浊音就存在着对应关系。.短时平均过零率的应用:1)区别清音和浊音。例如,清音的过零率高,浊音的过
8、零率低。2)从背景噪声中找出语音信号。语音处理领域中的一个基本问题是,如何将一串连续的语音信号进行适当的分割,以确定每个单词语音的信号,亦即找出每个单词的开始和终止位置。3)在孤立词的语音识别中,可利用能量和过零作为有话无话的鉴别。C.端点检测研究
此文档下载收益归作者所有