资源描述:
《matlab编程代做短时幅度谱估计在语音增强中的研究和应用》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、短时幅度谱估计在语音增强中的研究和应用摘要语音处理过程中受到各种各样噪声的干扰,不但降低了语音质量,而且还将使整个系统无法正常工作。因此,为了消除噪声干扰,在现代语音处理技术中,工业上一般采用语音增强技术来改善语音质量从而提高系统性能。本论文基于短时幅度谱估计来研究语音增强,主要介绍了功率谱相减、维纳滤波法,并介绍了这几种语音增强方法的基本原理和实现方法。通过研究,我们得到在白噪声的条件下,这些语音增强方法具有很好的增强效果,可作为开发实用语音增强方法的基础。关健词:语音增强,短时幅度谱估计,功率谱相减,维纳滤波,白噪声Abstracth
2、slogicVoiceprocessingisalwaysinflucencedbyavarietyofnoise,whichnotonlyreducesthevoicequality,butalsomakethewholesystembreak.Therefore,inordertoeliminatethenoiseinterference,inthemodernvoiceprocessingtechnology,wegenerallyusethevoiceenhancementtechnologytoimprovevoicequali
3、tyandsystemperformance.Inthispaper,wewillstudythespeechenhancementwhichisbasedshort-termratespectralestimation,wemainlyintroducespectralphase,Wienerfilteringmethod,andalsointroducedseveralmethodsoftherealizationandbasicprinciplesofspeechenhancement.Throughresearching,wege
4、ttheresultthatintheconditionsofwhitenoise,thesespeechenhancementmethodhasabesteffect,canbeusedasthebasementofspeechenhancementrealiaztion.Keywords:speechenhancement,short-termratespectralestimation,powerspectralsubtraction,Wienerfiltering,whitenoisehslogic第一章语音增强的研究背景及意义1
5、.1语音增强的应用背景hslogic人们在语音通信过程中不可避免的会受到来自周围环境和传输媒介引入的噪声、通信设备内部电噪声乃至其他讲话者的千扰。这些干扰最终将使接收者接收到的语音己非纯净的原始语音信号,而是受噪声污染的带噪语音信号。例如安装在汽车、飞机或舰船上的电话,街道、机场的公用电话,常受到很强背景噪声的干扰,严重影响通话质量。又如有历史价值的旧唱片、旧录音带的噪声和失真等,都是带噪语音信号的例子。而且环境噪声的污染,使得许多语音处理系统的性能急剧恶化。例如,语音识别己取得重大进展,正步入实用阶段。但目前的语音识别系统大都是在安静环
6、境中工作的。在噪声环境中,尤其是强噪声环境,语音识别系统的识别率将受到严重影响。低速率语音编码,特别是参数编码,也遇到类似问题。由于语音生成模型是低速率编码的基础,当模型参数的提取受到混杂在语音中背景噪声严重干扰时,重建语音的质量将急剧恶化,甚至变得完全不可懂。在上述情况下,语音增强或者作为一种预处理,,不失为解决噪声污染的一种有效手段。因此,或者为抑制背景噪声,提高语音质目前,语音增强已在语音处理系统、通信、研究语音增强技术在实际中有重要价多媒体技术、数字化家电等领域得到了量值越来越广泛的应用。语音增强的一个主要目标,就是从带噪语音信号
7、中提取尽可能纯净的原始语音。然而,由于干扰通常是随机的,从带噪语音中提取完全纯净的语音几乎是不可能。在这种情况下,语音增强的目的主要有两个:一是改进语音质量,消除背景噪声,使听者乐于接受,没有疲劳感,这是一种主观测量:二是提高语音的可懂度,这是一个客观测量。但这两个目的往往不能兼得,所以实际应用中总是视具体情况而有所侧重的。在语音信号的理论和应用中,所用的语音数据大部分都是在接近理想的条件下采集的。大多数语音识别和语音编码在开始研究时都要在高保真设备上录制语音,尤其要在无噪环境下录音。然而,在语音通信过程中会不可避免的受到各种噪声的干扰,
8、这种干扰将最终导致接收者接收到的语音信号已非纯净的原始语音,而是受到噪声污染后的带噪语音。正是由于这些污染,使得许多语音处理系统的性能急剧恶化。语音识别正在步入实用阶段,但识别系统大都是在安静