资源描述:
《语音信号的短时分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、实验一 语音信号的短时分析一、实验目的 1.在理论学习的基础上,进一步地理解和掌握语音信号短时分析的意义,短时时域分析的基本方法。 2.进一步理解和掌握语音信号短时平均能量函数及短时平均过零数的计算方法和重要意义。二、实验原理及方法 一定时宽的语音信号,其能量的大小随时间有明显的变化。其中清音段(以清音为主要成份的语音段),其能量比浊音段小得多。短时过零数也可用于语音信号分析中,发浊音时,其语音能量约集中于3kHz以下,而发清音时,多数能量出现在较高频率上,可认为浊音时具有较低的平均过零数,而清音时具有
2、较高的平均过零数,因而,对一短时语音段计算其短时平均能量及短时平均过零数,就可以较好地区分其中的清音段和浊音段,从而可判别句中清、浊音转变时刻,声母韵母的分界以及无声与有声的分界。这在语音识别中有重要意义。三、实验仪器 微型计算机,Matlab软件环境四、实验步骤 1.上机前用Matlab语言完成程序编写工作。 2.程序应具有加窗(分帧)、计算、以及绘制曲线等功能。 3.上机实验时先调试程序,通过后进行信号处理。 4.对录入的语音数据进行处理,并显示运行结果。 5.依据曲线对该语音段进行所需要的分析
3、,并作出结论。 6.改变窗的宽度(帧长),重复上面的分析内容。五、操作步骤所用语音信号文件名为"shop.wav",拷贝到MATLAB工作目录。Matlab编程实验步骤: 1.新建M文件,扩展名为“.m”,编写程序; 2.选择File/Save命令,将文件保存在F盘中; 3.在CommandWindow窗中输入文件名,运行程序;Matlab部分函数语法格式: 读wav文件: x=wavread(`filename`) 数组a及b中对应元素相乘: a.*b 创建图形窗口命令:
4、figure 绘图函数: plot(x) 坐标轴: axis([xminxmaxyminymax]) 坐标轴注解:xlabel(`…`) ylabel(`…`) 图例注解: legend(`…`) 一阶高通滤波器: y=filter([1-0.09375],1,x)voicebox工具箱介绍: 分帧函数:f=enframe(x,len,inc) x为输入语音信号,len指定了帧长,inc指定帧移,函数返回为n×len的一个矩阵,每一行都是一帧数据。voicebox
5、工具箱安装方法: 把工具箱拷贝入.MatLabtoolbox目录下。 菜单file-setpath-"Addfolder"导入voicebox; 菜单file-Preference-General-"UpdataToolboxPathCache六、实验结果七、思考题1.语音信号短时平均能量及短时平均过零数分析的主要用途是什么?可以从语音中区别出浊音来,因为浊音时短时平均能量的值要比清音时短时平均能量的值大很多;可以用来区别声母和韵母的分界、无声和有声的分界等最为一种超音段信息,用于语音识别中。浊
6、音时能量集中于较低频率段内,具有较低的过零率,而清音时能量集中于较高频率段内,具有较高的过零率2.窗的宽度(帧长)的改变,对的特性产生怎样的影响?窗口的长度,无论什么形状的窗口,窗口序列的长度N将起决定性的作用。N选得太大,滤波器的通带变窄,波形的振幅变化细节就看不出来,反之,如果N太小,则滤波器的通带变宽,信号得不到足够的平均八、程序[x,z]=wavread('shop.wav');figure;sound(x,z);subplot(4,1,1);plot(x);axis([1length(x)-11]);
7、ylabel('Speech');enhance=filter([1-0.9375],1,x);%高频预加重FrameLen=240;FrameInc=80;yframe=enframe(x,FrameLen,FrameInc);amp1=sum(abs(yframe),2);subplot(4,1,2);plot(amp1);axis([1length(amp1)0max(amp1)]);ylabel('Amp');legend('amp1=∑│x│');amp2=sum(abs(yframe.*yframe
8、),2);subplot(4,1,3);plot(amp2);axis([1length(amp2)0max(amp2)]);ylabel('Energy');legend('amp1=∑│x*x│');tmp1=enframe(x(1:end-1),FrameLen,FrameInc);tmp2=enframe(x(2:end),FrameLen,FrameInc);signs=(t