欢迎来到天天文库
浏览记录
ID:36747132
大小:1.45 MB
页数:51页
时间:2019-05-14
《基于小波变换与GMM的说话人识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要本文详细分析了小波理论的基础知识,研究了小波分析在语音信号处理中的应用,提出了基于小波包分析的两种新语音特征参数,这两种特征参数分别命名为SBC和WPP。把小波变换和小波包变换结合起来对语音信号进行频带划分,这种划分与人耳的临界频带相似,由此得出语音特征参数SBC。根据小波变换是比离散余弦变换更好的子带能量分离器,得出WPP。实验证明新特征参数WPP的语音识别性能优于SBC,而SBC的识别性能优于MFCC。高斯混合模型(GMM)是在说话人识别中广泛使用的识别方法,文中提出了一种新的改进模型OGMM。在OGMM中,有一个正交变
2、换矩阵,在应用到GMM模型之前,特征向量先要变换到由对角线协方差矩阵的特征矢量张成的线性空间上。通过实验得知对于相同的阶数,OGMM,e2,是表现出更好的性能,为了达到同一识别性能,OGMM仅需要标准GMM阶数的1/4。关键字:语音信号小波分析小波包分析高斯混合模型ABSTRACTThispaperdescribesindetailthebasicknowledgeofwavelettheory,studiestheapplicationofwaveletanalysistospeechsignalprocessingandpr
3、esentstwonewspeechfeatureparametersbasedonwaveletpacketanalysis,thetwoparametersarenamedSBCandWPPrespectively.Thispaperalsodescribesafrequencybandsdivisionofthespeechsignalbycombiningthewavelettransformandwaveletpackettransform,thisdivisionmethodissimilartothecritica
4、lbandsofhumanbeing’Sear,fromwhichwecouldgetspeechfeatureparametersSBC.Wavelettransformisabetterdecorrelatorofsubbandenergiesthandiscretecosinetransform.fromwhichwecouldgetWPP.TheexperimentresultsindicatethatthenewfeatureparameterWPPisabletooutperformSBCandSBCiSbetter
5、thanMFCC.TheGaussianmixturemodeling(GMM)techniquesareincreasinglybeingusedinspeakerrecognition.WehaveproposedamodificationtothestandarddiagonalGMM.Inthenewmodel(namedasOGMM),thereisanorthogonaltransformmatrix.,featurevectorsarefirsttransformedtothespacespannedbyeigen
6、vectorsofthecovariancematrixbeforeapplyingtothediagonalGMM.Itisshownthatwiththesamenumberofmixtures,theOGMMalwaysgivesabetterperformance.Toreachaspecificperformancelevel,theOGMMneedsonlyone—fourththenumberofmixturesusedbythestandardGMM.Keywords:speechsignalwaveletana
7、lysiswaveletpacketanalysistheGaussianmixturemodeling(GMM)第一章绪论说话人识别是利用语音信号和预先提取的说话人特征来确定或鉴别说话人身份的技术【⋯11113I。语音信号中不仅包含语义内容方面的信息,同时也包含有关说话人身份的个人信息。每个人由于自己独特的声道特性和发音特点,使其讲话具有区别于他人的特征,这就是说话人识别的基本依据。说话人识别的研究可以追溯到1937年,以C.A.Linderbergh先生的儿子被拐骗事件为开端,对语音中的说话人个性展开了科学的测量和研究。19
8、62年,Bell实验室的LG.Kersta第一次介绍了采用声纹进行说话人识别的可能性。1966年,美国法院第一次采用此方法进行了取证。随着计算机、DSP芯片应用的日益广泛和成熟,以及数字信号处理和模式识别等理论的发展,说话人识别技术已越来越为人们所瞩目,并且取得
此文档下载收益归作者所有