欢迎来到天天文库
浏览记录
ID:33940587
大小:4.19 MB
页数:78页
时间:2019-03-01
《鲁棒语音识别中基于矢量泰勒级数的特征补偿算法改进与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、隶。初大·譬硕士学位论文万方数据鲁棒语音识别中基于矢量泰勒级数的特征补偿算法改进与实现研究生姓名:鱼曼红万方数据ImprovementandRealizationofFeatureCompensationinRobustSpeechRecognitionbasedonVectorTaylorSeriesDissertationSubmiRedtoSoutheastUniversityFortheAcademicDegreeofMasterofEngineeringBYBAOXiahongSupervisedbyAssociateProfe
2、ssorZHOULinSchoolofInformationScience&EngineeringSoutheastUniversityMarch2014万方数据东南大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名::包重i∑日期:塑壁:生型东南大
3、学学位论文使用授权声明东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布(包括以电子信息形式刊登)论文的全部内容或中、英文摘要等部分内容。论文的公布(包括以电子信息形式刊登)授权东南大学研究生院办理。研究生签名:<塾塞i兰导师签名:日期:丛!兰竺!纠万方数据摘要在实际环境中,由于环境噪声的干扰和语音自身的变异性,语音识别系统的识别性能并不理想。鲁棒语音识别技术是
4、语音识别系统从实验室迈向实际应用的关键技术,用于解决语音训练环境与测试环境失配导致的识别性能下降问题。论文主要从特征补偿方面针对实际环境中的加性噪声问题,对鲁棒语音识别技术进行分析和研究,以提高语音识别系统在实际环境下的识别性能。论文的主要工作包括:(1)分析了鲁棒语音识别系统结构。其中端点检测使用短时能量和短时过零率作为判决条件,特征提取使用美尔倒谱频率系数表示语音信号的特征参数,声学模型包括高斯混合模型(GMM:GaussianMixtureModel)和隐马尔可夫模型(HMM:HiddenMarkovModel),两类声学模型分别用
5、于特征补偿和模式识别。(2)提出了一种基于矢量泰勒级数(VTS:VectorTaylorSeries)的多环境模型特征补偿算法。该补偿算法在不同信噪比环境下建立多个GMM和HMM模型,其中GMM用来描述整个语音信号空间的分布,HMM用来描述每个孤立词模型的分布。多环境特征补偿算法首先使用矢量泰勒级数特征补偿算法估计测试语音中噪声的均值和方差;然后,根据测试语音找到与其最匹配的含噪训练语音的GMM模型;最后,利用最小均方误差准则,计算测试语音映射到最优模型环境下的含噪语音特征参数。该算法通过建立基本环境模型集,根据测试语音在补偿阶段选择最优
6、GMM模型,在识别阶段选择最优HMM模型,有效降低训练环境和测试环境之间的失配性,因此能取得更好的识别结果。(3)实现了动态双门限的端点检测方法,将语音信号的短时能量和短时过零率结合,根据实时的信号调整检测时的阈值,以提高端点检测的准确性。为提高语音识别系统的可用性,将系统的词汇量从20个孤立词扩展到100个孤立词,并通过实验分析孤立词数量、训练样本数、GMM混合数和识别性能之间的关系,从而得到针对中词汇量语音识别系统理想的训练样本数目和GMM混合数。(4)分别实现了基于MATLAB和C平台的语音识别系统。在MATLAB平台上进行仿真实验
7、,通过大量离线实验验证多环境特征补偿算法的有效性。将系统移植到C平台,实现了实时的非特定人孤立词识别系统。实验证明,改进后的语音识别系统在噪声环境下能取得更高的识别性能。关键词:鲁棒语音识别;矢量泰勒级数;特征补偿;端点检测;多环境模型万方数据AbstractTheperformanceofspeechrecognitionsystemsdegraderapidlyinrealapplicationsduetotheenvironmentalnoiseandthevariabilityofthespeechitself.It’Simpor
8、tanttoimprovethespeechrecognitionsystemrobustforrealapplications.Therobusttechniqueistoreducethe
此文档下载收益归作者所有