欢迎来到天天文库
浏览记录
ID:5337983
大小:792.32 KB
页数:20页
时间:2017-12-08
《语音信号的短时时域分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、实验2语音信号的短时时域分析一、实验目的语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中都需要提取语音中包含的各种信息。语音处理的目的是对语音信号进行分析,提取特征参数,用于后续处理;加工语音信号。总之,语音信号分析的目的就在于方便有效的提取并表示语音信号所携带的信息。根据所分析的参数类型,语音信号分析可以分成时域分析和变换域(频域、倒谱域)分析。其中时域分析方法是最简单、最直观的方法,它直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量和平均幅度、短时平均过零率、短时自相关函数和短
2、时平均幅度差函数等。二、实验要求本实验要求掌握语音信号的短时时域分析方法,会利用已学的知识,编写程序计算语音的短时能量和平均幅度、短时平均过零率、短时自相关函数和短时平均幅度差函数等。三、实验设备PC微机一台四、实验原理1语音信号的预处理在对语音信号进行数字处理之前,首先要将模拟语音信号s(t)离散化为s(n).实际中获得数字语音的途径一般有两种,正式的和非正式的。正式的是指大公司或语音研究机构发布的被大家认可的语音数据库,非正式的则是研究者个人用录音软件或硬件电路加麦克风随时随地录制的一些发音或语句。语音信号的频率范围通常是300~3400Hz,一般情
3、况下取采样1率为8kHz即可。本实验的数字语音处理对象为语音数据文件,是已经数字化了的语音。有了语音数据文件后,对语音的预处理包括:预加重、加窗分帧等。1.1语音信号的预加重处理预加重目的:为了对语音的高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率。可通过一阶FIR高通数字滤波器来实现:1Hz()1z设n时刻的语音采样值为x(n),经过预加重处理后的结果为:yn()xn()xn(1)高通滤波器的幅频特性和相频特性如下:图1预加重前和预加重后的一段语音信号时域波形:2图2预加重前和预加重后的一段语音信号频谱:图3例一:语音信号预
4、加重clearall;fid=fopen('voice2.txt','rt')%打开文件e=fscanf(fid,'%f');%读数据ee=e(200:455);%选取原始文件e的第200到455点的语音,也可选其他样点r=fft(ee,1024);%对信号ee进行1024点傅立叶变换3r1=abs(r);%对r取绝对值r1表示频谱的幅度值pinlv=(0:1:255)*8000/512%点和频率的对应关系yuanlai=20*log10(r1)%对幅值取对数signal(1:256)=yuanlai(1:256);%取256个点,目的是画图的时候,维数
5、一致[h1,f1]=freqz([1,-0.98],[1],256,4000);%高通滤波器pha=angle(h1);%高通滤波器的相位H1=abs(h1);%高通滤波器的幅值r2(1:256)=r(1:256)u=r2.*h1'%将信号频域与高通滤波器频域相乘相当于在时域的卷积u2=abs(u)%取幅度绝对值u3=20*log10(u2)%对幅值取对数un=filter([1,-0.98],[1],ee)%un为经过高频提升后的时域信号figure(1);subplot(211);plot(f1,H1);title('高通滤波器的幅频响应');xla
6、bel('频率/Hz');ylabel('幅度');subplot(212);plot(pha);title('高通滤波器的相位响应');xlabel('频率/Hz');ylabel('角度/radians');figure(2);subplot(211);plot(ee);title('原始语音信号');xlabel('样点数');ylabel('幅度');axis([0256-3*10^42*10^4]);subplot(212);plot(real(un));title('经高通滤波后的语音信号');xlabel('样点数');ylabel('幅度
7、');axis([0256-1*10^41*10^4]);figure(3);subplot(211);plot(pinlv,signal);title('原始语音信号频谱');xlabel('频率/Hz');ylabel('幅度/dB');subplot(212);plot(pinlv,u3);title('经高通滤波后的语音信号频谱');xlabel('频率/Hz');ylabel('幅度/dB');1.2语音信号的加窗处理由于发音器官的惯性运动,可以认为在一小段时间里(一般为10ms~30ms)语音信号近似不变,即语音信号具有短时平稳性。这样,可以
8、把语音信号分为一些短段(称为分析帧)来进行处理。语音信号的分帧实现方法采用可移动
此文档下载收益归作者所有