资源描述:
《基于matlab 的语谱图显示与分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、基于MATLAB的语谱图显示与分析11,21李富强万红黄俊杰(1.郑州大学;2.郑州解放军信息工程大学)摘要:文章给出了一种基于MATLAB的语谱图显示原理及实现方法。该法可对语音信号(或其它类型的似平稳信号)进行频谱图的伪彩色映射及显示。语谱图的类型有宽带和窄带两种,可按需求设置伪彩色显示的映射。文中介绍了语谱图显示的原理,MATLAB的相关功能函数,并给出了一个程序实例及其实验结果。在MATLAB中进行了仿真,结果表明宽带及窄带语谱图对时间分辨率和频率分辨率的不同反映,并且该法对设备要求低,编
2、程简单,可以在普通通用计算机上实现。关键字:语谱图;宽带语谱图;窄带语谱图;伪彩色显示;MATLABTheDisplayandAnalysisofSonogramBasedonMATLABLiFuqiangWanHong(SchoolofElectronicEngineering,ZhengzhouUniversity,Zhengzhou450002China)Abstract:Thisarticleintroducesthedisplayprincipleandrealizationofspec
3、trogrambasedonMATLAB.Thespectrogramofspeechsignalsandothersimilarquasi-stationaryonescanbedonebythismethod.Therearetwokindsofspectrogram:wide-bandandnarrow-bandspectrograms.Inaddition,differentpseudo-color-mappingdisplaysareoptional.Itcoversthedisplay
4、principleofspectrogram,thecorrelativefunctionsofMATLABandthesourceprogram,aswellastheexperimentalresults.ThesimulationinMATLABturnsoutthatwide-bandandnarrow-bandspectrogramsrepresentdifferentdegreesoftimeandfrequencyresolution,respectively.Thismethodc
5、anbeimplementedeasilywithoutcomplicatedprogrammingbasedonuniversalPC.Keywords:spectrogram;wide-bandspectrogram;narrow-bandspectrogram;pseudo-colordisplay;MATLAB1语谱图语音的发音过程中,声道通常都是处于运动状态的,因此它的共振峰特性也是时变的。不过这个时变过程比起振动过程来说要缓慢得多,因此一般可以假定它是短时平稳的,每一时刻我们都可以用这
6、时刻附近的一短段(例如15ms)语音信号分析得到一种频谱。对语音信号连续地进行频谱分析就可以得到一种二维图谱,其横坐标表示时间,纵坐标表示频率,而每像素的灰度值大小反映相应时刻和相应频率的信号能量密度。这种时频图称为语谱图[1](Sonogram或Spectrogam),这种反映语音信号动态频谱特性的时频图在语音分析中有重要实用价值,被视为可视语言。从语谱图上不仅能看出任一时刻发音器官的共振峰特征,而且可以看出语音的基音频率,是否清音、爆破音等。语谱分析在语音识别、合成及编码中很有意义。1.1语谱
7、图的产生基理语音信号是一种典型的非平稳信号,但是其非平稳性是由发音器官的物理运动过程而产生的,此过程与声波振动的速度相比较缓慢,可以假定在10~30ms这样的短时间内是平稳的。傅立叶分析是分析线性系统和平稳信号稳态特性的强有力的手段,而短时傅里叶分析,也叫时间依赖傅立叶变换,就是在短时平稳的假定下,用稳态分析方法处理非平稳信号的一种方法。设离散时域采样信号为x()n,nN=0,1,L,−1,其中n为时域采样点序号,N是信号长度。然后对信号进行分帧处理,则x()n表示为x()m,mN=0,1,L,−
8、1,其中n是帧n序号,m是帧同步的时间序号,N为帧长(一帧内的采样点数)。信号{x()n}短时傅里叶变[2]换为:∞jjω−ωmXen()=−∑xmwnme()()gg(1)其中{wn()}m为窗序列,则信号=−∞x()n的离散时域傅里叶变换(DTFT)[3]为:N−1jjω−ωmXne(,)=∑xmen()(2)m=0采用离散傅立叶变换(DFT)得:N−12πkm−jXnk(,)=∑xme()N(3)nm=0其中01≤≤−kN,则X(,)nk就是x()n的短时幅度谱估计,而时间m