欢迎来到天天文库
浏览记录
ID:37089456
大小:3.23 MB
页数:66页
时间:2019-05-17
《基于频谱上下文的语音识别及情感分类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码:1〇697分类号:TP39131439:2015密级:公开学号_颀士专业字位i2文DissertationfortheProfessionalDegreeofMaster泉于频谱上下文的语音识别及情感分类算法研究学科名称:电子与通信工程专业学位类别:工程颂士指导老师:曹正文教授作者:张晓西北大学学位评定委员会二〇一八年六月SpeechRecognitionandEmotionClassificationAlgorithmBasedon
2、SpectralContextFeatureAthesissubmittedtoNorthwestUniversityinpartialfulfillmentoftherequirementsforthedegreeofMasterinElectronicsandCommunicationEngineeringByZhangXiaoSupervisor:CaoZhengwenProfessorJune2018摘要摘要语音识别系统经过多年的发展已经在很多场合取得了良好的应用效果,但是普及程度并不理想。特定环境
3、下搭建的语音识别系统,在实际复杂应用场景中往往很难实现有效的识别结果。由于背景噪声干扰、说话人情绪变化以及信道畸变等因素的影响,使得实验室环境下训练好的语音识别系统在实际应用中性能急剧恶化,难以达到令人满意的结果。本文根据语音识别及情感分类中一些关键步骤和上述研究现状及难点,着重对噪声干扰和情绪变化下的语音识别系统进行研究。主要内容包括:(1)提出一种基于上下文特征描述符的特征提取方法。在噪声环境下以及不同情感环境中,传统语音特征难以提供有效的动态信息。因此,本文构建出一种频谱序列的上下文(SSC)的
4、特征方法,对比传统的动态信息处理方式,系统性能有显著的提高,在噪声环境及语音情感识别中都取得了良好的效果。而且在其他频谱过程中都可引入此特征,方法具有一定的普适性。(2)研究噪声环境下的语音识别,提出一种基于递归图压缩距离的语音识别算法。语音信号作为一个随时间变化的序列,通过研究递归图模型在时间序列中的显著作用,将语音特征序列进行递归图压缩,利用MPEG-1压缩算法计算不同递归图之间的CK-1距离,完成整个语音识别过程。(3)研究情绪变化中的分类决策,提出一种基于多特征深度置信网络的语音情感识别算法。针对不
5、同特征对情感描述能力的不同,我们提取多种鲁棒的低级特征,然后将其馈入DBN网络中提取高层特征描述符,进而采用集成学习的思想,对ELM分类结果投票融合,在三种公开数据集上证明了本文算法的有效性。关键词:语音识别,语音情感识别,频谱上下文,递归图压缩距离,多特征融合IABSTRACTABSTRACTAfteryearsofdevelopment,speechrecognitionsystemshavehadmanypromisingapplications,buttheirpopularityisnotidea
6、l.Inpracticalapplications,speechrecognitionsystemsinspecificenvironmentsareoftendifficulttoachieveeffectiverecognition.Itisdifficulttoachievesatisfactoryresultsfromtheinterferencewithotherfactorswhichthespeechrecognitionsystemwastrainedbylaboratoryenvironm
7、ent,suchasbackgroundnoise,speaker'semotionalchanges,channeldistortion,etc.Basedonthekeystepsofspeechrecognitionandemotionclassification,andinlightoftheaboveresearchstatusanddifficulties,thispaperfocusesontheresearchofrecognitionsysteminnoisyenvironmentande
8、motionalenvironment.Themaincontentsinclude:(1)Spectrumsequencecontext(SSC)featureisproposed.Inthenoiseenvironmentanddifferentemotionalenvironments,thetraditionalspeechfeaturesaredifficulttoprovideeffectivedyn
此文档下载收益归作者所有