欢迎来到天天文库
浏览记录
ID:13279350
大小:6.49 MB
页数:120页
时间:2018-07-21
《语音信号处理 第2版 赵力 语音信号处理第3章新》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、3.1概述3.2语音信号的数字化和预处理3.3语音信号的时域分析3.4语音信号的频域分析3.5语音信号的倒谱分析3.6现代通信中的线性预测分析3.7基间周期估计3.8共振峰估计第三章语音信号分析6/25/202113.1概述语音信号分析语音信号处理的前提和基础,只有分析出可表示语音信号特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。贯穿于语音分析全过程的是“短时分析技术”语音信号从整体来看其特征及表征其本质特征的参数均是随时间而变化的,所以它是一个非平衡态过程,不能用处理平衡信号的数字信号处理技术对其进行分析处理。但是在一个短时
2、间范围内(一般认为在10-30ms的短时间内),其特性基本保持不变即相对稳定,因而可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。6/25/202123.1概述根据所分析出的参数的性质的不同可以分为:时域分析、频域分析、倒频域分析,线性预测分析等;分析方法的不同:模型分析方法和非模型分析方法不论是分析怎么样的参数以及彩什么分析方法,在按帧进行语音分析,提取语音参数之前,有一些经常使用的、共同的短时分析技术必须预先进行,如语音信号的数字化、语音信号的端点检测、预加重、加窗和分帧等,这些也是不可忽视的语音信号分析的关键技术。6/25/202133.2语音
3、信号的数字化和预处理语音信号的数字化一般包括放大及增益控制、反混叠滤波、采样、A/D变换及编码(一般就是PCM码);预处理一般包括预加重、加窗和分帧等。带通滤波器自动增益控制(AGC)模/数转换(A/D)脉冲编码调制(PCM)语音信号存入计算机6/25/20214预滤波、采样、A/D变换预滤波的目的有两个:抑制输入信号各频域分量中频率超出fs/2的所有分量(fs)为采样频率,以防止混叠干扰。抑制50Hz的电源工频干扰。这样,预滤波器必须是一个带通滤波器,设其上、下截止频率分别是fH和fL:绝大多数语音编译码器:fH=3400Hz,fL=60-100Hz,fS
4、=8kHz6/25/20215预滤波、采样、A/D变换语音信号经过预滤波和采样后,由A/D变换器变换为二进制数字码。A/D变换中要对信号进行量化,量化不可避免地会产生误差。量化后的信号值与原信号值之间的差值称为量化误差,又称为量化噪声。若信号波形的变化足够大,或量化间隔Δ足够小时,可以证明量化噪声符合具有下列特征的统计模型:①它是平稳的白噪声过程②量化噪声与输入信号不相关③量化噪声在量化间隔内均匀分布,即具有等概率密度分布6/25/20216预滤波、采样、A/D变换若用σx2表示输入语音信号的方差,2Xmax表示信号的峰值,B表示量化字长,σe2表示噪声序列
5、的方差,可以证明量化信噪比SNR(信号与量化噪声的功率比)为:假设语音信号的幅度符合Laplacian分布,此时信号幅度超过4σx的概率很小,只有0.35%,因而可取Xmax=4σx,则上式表明量化器中的每bit字长对SNR的贡献为6dB。6/25/20217预处理已数字化的语音信号序列将依次存入一个数据区,在语音信号处理中一般用循环队列的方式来存储这些数据,以便用一个有限容量的数据区来应付数量极大的语音数据,已处理完提取出了语音特征参数的一个时间段的语音数据可以依次抛弃,让出存储空间来存储新数据。由于语音信号的平均功率谱受声门激励和口鼻辐射影响,要在预处理
6、中进行预加重(Preemphasis)处理。预加重的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参数分析。6/25/20218预处理进行过预加重数字滤波处理后,接下来就要进行加窗分帧处理。一般每秒的帧数约为33-100帧,视实际情况而定。分帧虽然可以采用连续分段的方法,但一般要采用如图3-1所示的交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性。前一帧和后一帧的交叠部分称为帧移。帧移与帧长的比值一般取为0-1/2。6/25/20219预处理6/25/202110预处理分帧是用可
7、移动的有限长度窗口进行加权的方法来实现的,这就是用一定的窗函数ω(n)来乘s(n),从而形成加窗语音信号sω(n)=s(n)*ω(n)。在语音信号数字处理中常用的窗函数是矩形窗和汉明窗等,它们的表达式如下(其中N为帧长):矩形窗:汉明窗:6/25/202111预处理1.窗口的形状虽然,不同的短时分析方法(时域、频域、倒频域分析)以及求取不同的语音特征参数可能对窗函数的要求不尽一样,但一般来讲,一个好的窗函数的标准是:在时域因为是语音波形乘以窗函数,所以要减小时间窗两端的坡度,使窗口边缘两端不引起急剧变化而平滑过渡到零,这样可以使截取出的语音波形缓慢降为零,减
8、小语音帧的截断效应;在频域要有较宽的3dB带宽以及较
此文档下载收益归作者所有