欢迎来到天天文库
浏览记录
ID:36771752
大小:1.74 MB
页数:114页
时间:2019-05-15
《基于听觉感知模型和统计学习的语音鲁棒处理》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、上海交通大学博士学位论文基于听觉感知模型和统计学习的语音鲁棒处理摘要语音技术被广泛应用于多样环境之前依然面临着各种挑战例如如何在具有环境噪声和通道失真的情况下加强语音处理技术的鲁棒性语音鲁棒处理的研究是开展包括语音识别语音合成语种识别以及说话人识别在内的语音学研究的基础和关键也是语音库建立过程中的重要工作目前语音处理系统的识别率和语音合成的自然度还不能令人满意其根本原因是对自然语音的研究不够深入不能准确归纳描述和模拟自然语音的规律语音处理技术的进展必须依靠现实环境中各种语音数据的语料库的收集整理和发布本文主要目的是研究语音鲁棒处理技术提高噪声环境中语音切分的鲁棒性然后在此
2、基础上具体实现语音库建设辅助工具本文首先基于人类的听觉感知模型研究了语音信号的时频分析方法构造了满足听觉感知模型的非均匀完全重构滤波器组完成了基于最大似然估计的子带语音去噪算法实现了基于MDL最小描述长度的自适应平滑子带语音鲁棒端点检测算法其次讨论了基于隐马尔可夫模型语音切分的缺陷指出了韵律因素对语音切分的影响提出了语音鲁棒切分的贝叶斯框架最后描述了标注图的主要思想提出了基于XML的语音标注体系结构并利用可扩展标注语言XMLVisualBasic和SQL实现了语音库建设辅助工具的原形系统具体标注了孤立数字语音库连续数字串语音库和用于说话人识别的特殊语音库本文的主要贡献包括
3、Ø基于人类听觉感知模型在完全重构滤波器组的时域条件基础上利用Bark变换和全通系统实现了满足听觉感知模型的非均匀完全重构滤波器组Ø根据小波去噪的基本原理在最大似然谱估计的基础上引入了自适应机制调整不同子带的门限得到了适合于缓变非平稳噪声的子带语音去噪方法概率密度的计算利用了正交基下概率密度的计算思想Ø通过启发式边缘聚焦的思想首先通过双门限方法得到语音的低能量区然后采用基于最小描述长度MDL的自适应平滑算法确定不同子带的边缘最后利用模糊决策模型综合了不同子带的结果实现了鲁棒的子带语音端点检测i上海交通大学博士学位论文Ø基于贝叶斯决策方法分析了语音分割中韵律因素的影响和基于隐
4、马尔可夫模型语音切分的缺陷提出了语音鲁棒分割的贝叶斯框架实现了用于贝叶斯框架的语音分割模型Ø基于XML的语音标注体系结构利用标注图的理论框架建立了语音库建设辅助工具的原形系统并实现了孤立数字语音库连续数字串语音库和用于说话人识别的特殊语音库本文进行了大量的仿真研究和实验同时将改进后的算法同原算法进行了比较结果表明我们提出的算法是有价值的关键词子带语音最小描述长度MDL听觉模型贝叶斯方法语音切分标注图小波去噪端点检测ii上海交通大学博士学位论文RobustSpeechProcessingBasedonAuditoryModelandStatisticalLearningAb
5、stractBeforeappliedintheadverseenvironmentfarandwide,speechtechniqueisstillconfrontedwithvarietiesofchallenge,forexample,howtoenhancetherobustnessofspeechtechniqueintheconditionofnoiseandchanneldistortion.Thestudyofrobustspeechprocessingplaythekeyroleinspeechrecognition,speechsynthesisand
6、speakerrecognition,itisalsotheimportantbasisofproducingspeechcorpora.Theultimatereasonwhyspeechapplicationspresentlydoesnotturnuptrumpsisthatourstudyofnaturalspeechisnotthoroughenoughtoinduce,depictandsimulatetheruleofnaturalspeechbyruleandline,sothedevelopmentofspeechtechniquebuildsupont
7、hecollection,settlementandissuanceofvarietiesofspeechcorporainreal-lifeenvironment.Ourstudyaimsatstudyingrobustspeechprocessinginordertosatisfytherobustnessofspeechsegmentationinadverseenvironment,andimplementingtoolsforassistingspeechcorporaproductionbasedonannotat
此文档下载收益归作者所有