基于小波变换与GMM的说话人识别研究

基于小波变换与GMM的说话人识别研究

ID:36747132

大小:1.45 MB

页数:51页

时间:2019-05-14

基于小波变换与GMM的说话人识别研究_第1页
基于小波变换与GMM的说话人识别研究_第2页
基于小波变换与GMM的说话人识别研究_第3页
基于小波变换与GMM的说话人识别研究_第4页
基于小波变换与GMM的说话人识别研究_第5页
资源描述:

《基于小波变换与GMM的说话人识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要本文详细分析了小波理论的基础知识,研究了小波分析在语音信号处理中的应用,提出了基于小波包分析的两种新语音特征参数,这两种特征参数分别命名为SBC和WPP。把小波变换和小波包变换结合起来对语音信号进行频带划分,这种划分与人耳的临界频带相似,由此得出语音特征参数SBC。根据小波变换是比离散余弦变换更好的子带能量分离器,得出WPP。实验证明新特征参数WPP的语音识别性能优于SBC,而SBC的识别性能优于MFCC。高斯混合模型(GMM)是在说话人识别中广泛使用的识别方法,文中提出了一种新的改进模型OGMM。在OGMM中,有一个正交变

2、换矩阵,在应用到GMM模型之前,特征向量先要变换到由对角线协方差矩阵的特征矢量张成的线性空间上。通过实验得知对于相同的阶数,OGMM,e2,是表现出更好的性能,为了达到同一识别性能,OGMM仅需要标准GMM阶数的1/4。关键字:语音信号小波分析小波包分析高斯混合模型ABSTRACTThispaperdescribesindetailthebasicknowledgeofwavelettheory,studiestheapplicationofwaveletanalysistospeechsignalprocessingandpr

3、esentstwonewspeechfeatureparametersbasedonwaveletpacketanalysis,thetwoparametersarenamedSBCandWPPrespectively.Thispaperalsodescribesafrequencybandsdivisionofthespeechsignalbycombiningthewavelettransformandwaveletpackettransform,thisdivisionmethodissimilartothecritica

4、lbandsofhumanbeing’Sear,fromwhichwecouldgetspeechfeatureparametersSBC.Wavelettransformisabetterdecorrelatorofsubbandenergiesthandiscretecosinetransform.fromwhichwecouldgetWPP.TheexperimentresultsindicatethatthenewfeatureparameterWPPisabletooutperformSBCandSBCiSbetter

5、thanMFCC.TheGaussianmixturemodeling(GMM)techniquesareincreasinglybeingusedinspeakerrecognition.WehaveproposedamodificationtothestandarddiagonalGMM.Inthenewmodel(namedasOGMM),thereisanorthogonaltransformmatrix.,featurevectorsarefirsttransformedtothespacespannedbyeigen

6、vectorsofthecovariancematrixbeforeapplyingtothediagonalGMM.Itisshownthatwiththesamenumberofmixtures,theOGMMalwaysgivesabetterperformance.Toreachaspecificperformancelevel,theOGMMneedsonlyone—fourththenumberofmixturesusedbythestandardGMM.Keywords:speechsignalwaveletana

7、lysiswaveletpacketanalysistheGaussianmixturemodeling(GMM)第一章绪论说话人识别是利用语音信号和预先提取的说话人特征来确定或鉴别说话人身份的技术【⋯11113I。语音信号中不仅包含语义内容方面的信息,同时也包含有关说话人身份的个人信息。每个人由于自己独特的声道特性和发音特点,使其讲话具有区别于他人的特征,这就是说话人识别的基本依据。说话人识别的研究可以追溯到1937年,以C.A.Linderbergh先生的儿子被拐骗事件为开端,对语音中的说话人个性展开了科学的测量和研究。19

8、62年,Bell实验室的LG.Kersta第一次介绍了采用声纹进行说话人识别的可能性。1966年,美国法院第一次采用此方法进行了取证。随着计算机、DSP芯片应用的日益广泛和成熟,以及数字信号处理和模式识别等理论的发展,说话人识别技术已越来越为人们所瞩目,并且取得

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。