欢迎来到天天文库
浏览记录
ID:33546481
大小:2.41 MB
页数:52页
时间:2019-02-27
《基于dsp的语音信号频谱分析系统》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于DSP的语音信号频谱分析系统2语音信号的时域分析语言是语音的声学表现,是人类信息交流最自然、最有效、最方便的手段,也是人类进行思维的一种依托。人类开始进入了信息化时代,用现代手段研究语音处理技术,使人们能够更加有效地产生、传输、存储和获取语音信号,这对于促进社会的发展具有十分重要的意义。语音信号是一个时间序列,进行语音分析时,最直观的就是它的时域波形。时域分析直观明了,计算简单且运算量小(相比后面将要介绍的频谱分析)。时域分析提供了最基本也是很重要的用于语音分析的参数,广泛用于语音的预处理等方面【3】。2.1语音信号的抽样及其数字化模拟语音信号是连续信
2、号,无法被DSP处理。因此语音处理的第一步是将模拟信号转化为数字信号,也就是常说的模/数转换,这其中主要包括两个步骤:采样和量化。语音信号是随时间而变的信号,它所占据的频率范围可达10kHz以上,但是对语音信号清晰度和可懂度有明显影响的成份,最高频率约为5.7kHz。但语音信号本身冗余度是比较大的,少数辅音清晰度下降并不明显影响语句的可懂度【4】。一个正常人语音的频率一般在40Hz~4000Hz的范围内,成年男子的语音频率较低,妇女和儿童的语音频率较高。电话语音频率范围在60Hz-3400Hz左右。现代的语音合成或识别系统中,需将语音频率的上限提高到10k
3、Hz左右。根据奈奎斯特采样定律(NyquistSamplingTheorem),采样频率应为原始语音频率的两倍以上,考虑到滤波器性能的影响,这个阈值还应该提高。一般来说,电话语音的采样率为8kHz(G.711标准),普通语音的采样率在15kHz。20kH左右。否则,如果采样率不满足采样定律,将会产生频谱混叠,使信号中的高频失真。考虑到高频噪音的存在,为了防止频率高于二分之一采样频率的高频噪音产生频谱混叠,通常语音信号在采样前要进行一次预滤波以滤掉高频噪音。预滤波还有一个目的是避免50Hz的电源干扰,因此预滤波是一个带通滤波烈51,其下截止频率.力=50Hz
4、,上截止频率厂Ⅳ根据需要定义。采样后的语音数据要能为DSP所存储和处理还必须进行量化处理。量化过程中,不可避免地会引入误差。量化时,如果采用较多的量化级数来记录样点的幅度,量化误差就较小,相应的比特(Bit)数就会增多。但是这是以增加存储容量和处理时的计算量为代价的,因此必须根据应用场合合理地选择量化字长。大连理j二人学专业学位硕七学位论文2.2语音信号的时间依赖由于人自身的发音器官的运动,语音信号是一种典型的非平稳信号。但是,由于语音的形成过程是与器官的运动密切相关的,这种物理运动比起声音振动速度来要缓慢得多,因此语音信号常常可假设为短时平稳的,即在10
5、---30ms这样的时间段内,其频谱特性和某些物理特征参量可近似地看作是不变的【6】。几乎所有的语音信号处理方法都是基于这个假设。这样,我们就可以采用平稳过程的分析处理方法来处理了。以后的几乎所有的处理方法都立足于这种短时平稳的假定。本章所要讨论的短时能量、短时平均差幅度以及自相关函数,都是在这种短时平稳假设下从时域来分析一些物理参量。这种时间依赖处理【7】的基本手段,是用一个长度有限的窗序列{以m))截取一段语音信号来进行分析,并让这个窗滑动以便分析任一时刻附近的信号,其一般表达式为:.生Q=≥:玎x(m)】w(行一,,z)(2.1)ram-oo其中丌·
6、]表示某种运算,x(m)为输入信号序列。几种常用时间依赖处理方法【8】是:当玎x(研)】为z2(m)时,Q相应于短时能量,I当研x(m)】=lsgn[x(m)]一sgn[x(m一1)』时,Q就是短时平均过零率;当研工(m)】为x(m)x(m+k)时,Q就是短时自相关函数。式(2.1)是卷积形式的,因此Q可以理解为离散信号研z(聊)]经过一个单位冲激响应为{似,,1)}的FIR低通滤波器产生的输出,如图2.1所示。百磊怔堕圈卜一臣亘]_—屯堕乎Qn图2.I短时分析原理的一般表示F喀2.1Thegeneralrepresentationofshorttimea
7、nalysisprinciple由于窗函数一般取为x(,z)中间大两头小的光滑函数,这样的冲激响应所对应的滤波器具有低通特性。其带宽和频率响应取决于窗函数的选择。用得最多的三种窗函数是矩形(Rectangular)窗、汉明(Hamming)窗和汉宁(hanning)窗,其定义分别为:r1,0≤n≤L一1矩形窗以,z)={10,其它r0.54-0.46cos(2ztn/(L-1)),汉明窗W(以)=_{L0,0≤n≤L一1其它基于DSP的语音信号频谱分析系统汉宁窗以,z,={≥5n—co文2万州。卜0≤珂≤L一1其它其中£为窗长,这些窗函数都有低通特性。例如
8、,汉明窗的频率响应幅度特性如图2.2所示。它们的主瓣宽度b和旁瓣高
此文档下载收益归作者所有