资源描述:
《语音信号处理实验》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、实验一特征提取1.1语谱图程序语音信号随时间变化的频谱特性可以用语谱图直观的表示,语谱图的纵坐标对应频率,横坐标对应时间,而图像的黑百度对应于信号的能量。所以,声道的谐振频率在图上就表示成为黑带,浊音部分则以出现条纹图形为其特征,这是因为此时的时域波形有周期性,而在浊音的时间间隔内图形显得很致密。clearall;[x,sr]=wavread('***.wav');%sr为采样频率if(size(x,1)>size(x,2))%size(x,1)为x的行数,size(x,2)为x的列数x=x';ends=length(x);w=
2、round(44*sr/1000);%窗长,取离44*sr/100最近的整数n=w;%fft的点数ov=w/2;%50%的重叠h=w-ov;%win=hanning(n)';%哈宁窗win=hamming(n)';%哈宁窗c=1;ncols=1+fix((s-n)/h);%fix函数是将(s-n)/h的小数舎去d=zeros((1+n/2),ncols);forb=0:h:(s-n)u=win.*x((b+1):(b+n));t=fft(u);d(:,c)=t(1:(1+n/2))';c=c+1;endtt=[0:h:(s-n)
3、]/sr;ff=[0:(n/2)]*sr/n;imagesc(tt/1000,ff/1000,20*log10(abs(d)));colormap(gray);axisxyxlabel('时间/s');ylabel('频率/kHz');1.2预加重(高频提升)对输入的语音信号进行预加重,其目的是提升语音信号的高频部分,去除口唇辐射的影响,增强语音的高频分辨率。-1H(Z)=1-z[x,sr]=wavread('***.wav');%读数据ee=x(200:455);%选取原始文件e的第200到455点的语音,也可选其他样点r=
4、fft(ee,1024);%对信号ee进行1024点傅立叶变换r1=abs(r);%对r取绝对值r1表示频谱的幅度值pinlv=(0:1:255)*8000/512%点和频率的对应关系yuanlai=20*log10(r1)%对幅值取对数signal(1:256)=yuanlai(1:256);%取256个点,目的是画图的时候,维数一致[h1,f1]=freqz([1,-0.98],[1],256,4000);%高通滤波器pha=angle(h1);%高通滤波器的相位H1=abs(h1);%高通滤波器的幅值r2(1:256)=r
5、(1:256)u=r2.*h1'%将信号频域与高通滤波器频域相乘相当于在时域的卷积u2=abs(u)%取幅度绝对值u3=20*log10(u2)%对幅值取对数un=filter([1,-0.98],[1],ee)%un为经过高频提升后的时域信号figure(1);subplot(211);plot(f1,H1);title('高通滤波器的幅频响应');xlabel('频率/Hz');ylabel('幅度');subplot(212);plot(pha);title('高通滤波器的相位响应');xlabel('频率/Hz');yl
6、abel('角度/radians');figure(2);subplot(211);plot(ee);title('原始语音信号');xlabel('样点数');ylabel('幅度');axis([0256-3*10^42*10^4]);subplot(212);plot(real(un));title('经高通滤波后的语音信号');xlabel('样点数');ylabel('幅度');axis([0256-1*10^41*10^4]);figure(3);subplot(211);plot(pinlv,ee);title('
7、原始语音信号频谱');xlabel('频率/Hz');ylabel('幅度/dB');subplot(212);plot(pinlv,u3);title('经高通滤波后的语音信号频谱');xlabel('频率/Hz');ylabel('幅度/dB');1.3短时能量语音信号的能量随时间而变化,清音和浊音之间的能量差别相当显著,因此对短时能量进行分析,可以描述语音的这种特征变化的情况。n2En[()(xmwnm)]mn(N1)n时刻语音信号的短时平均能量,其中N为窗长。[x,sr]=wavread('*.wav');%
8、读入语音文件%计算N=50,帧移=50时的语音能量s=fra(50,50,x);s2=s.^2;%一帧内各样点的能量energy=sum(s2,2);%求一帧能量subplot(2,2,1)%定义画图数量和布局plot(energy);%画N=50时的语音能量图