资源描述:
《语音增强方法综述》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、计算机与现代化2007年第3期JISUANJIYUXIANDAIHUA总第139期文章编号:100622475(2007)0320016205语音增强方法综述黄苏雨1,梁声灼1,黄苏园2(1.南昌大学信息工程学院,江西南昌330031;2.天津电气传动设计研究院,天津300180)摘要:环境噪声会影响语音质量,严重的情况下语音将完全淹没到噪声中,无法分辨。语音增强就是从带噪语音信号中提取尽可能纯净的原始语音。本文对目前一些主要的语音增强方法做了研究,分析了各种方法的优缺点。在实际应用时,要根据具体的噪声情况和特定环境,选用不同的语音增强方法或语音增强方法的组合,来达
2、到最好的语音增强的效果。关键词:语音增强;去噪;信噪比;可懂度中图分类号:TP301.6文献标识码:AOverviewofSpeechEnhancementAlgorithmsHUANGSu2yu1,LIANGSheng2zuo1,HUANGSu2yuan2(1.InformationEngineeringSchoolofNanchangUniversity,Nanchang330031,China;2.TianjinDesing&ResearchInstituteofElectricDrive,Tianjin300180,China)Abstract:Theenvi
3、ronmentalnoisewillaffectthequalityofspeech,intheseriouscircumstances,itwillsubmergethespeech,sothespeechcan’tbedetected.Thespeechenhancementistogetthespeechasoriginalaspossiblefromthespeechsignalwithnoise.Thispaperstudiesonthemainmethodsforthespeechenhancement,andanalysestheiradvantagea
4、ndweakness.Intheactualapplication,forthebesteffectofspeechenhancementitshouldusedifferentmethodsortheircombinationaccordingtothespecificnoiseandthegivenenvironment.Keywords:speechenhancement;denoising;signalnoiseratio;intelligibility0引言语音是人类相互之间进行交流时使用最多、最自然、最基本也是最重要的信息载体。在实际环境中,语音信号总是会
5、受到外界环境噪声的干扰,这些噪声包括从周围环境、传输媒质中引入的噪声、通信设备内部电噪声乃至其他说话人的干扰等等。这些干扰会使接收端的语音成为受噪声污染的语音,当噪声干扰严重时,语音将完全淹没到噪声中,使其无法分辨。语音增强是解决噪声污染的一种有效方法,它是从带噪语音信号中提取尽可能纯净的原始语音。总的来说语音增强的目标[1]主要有:改进语音质量,消除背景噪声,使听者乐于接受,不感觉疲劳;提高语音可懂度,方便听者理解。但由于噪声来源众多,随着应用场合不同,它们的特性也各不相同,即使在实验室仿真条件下,也难以找到一种通用的语音增强算法,能适用于各种噪声环境,因此必须根
6、据不同的噪音,采取特定的语音增强策略来降低噪音。1语音和噪声的特性语音增强不仅涉及信号检测、波形估计等传统信号处理理论,而且与语音特性、人耳感知特性密切相关,同时由于实际应用中噪声的来源及种类各不相同,从而造成处理方法的多样性。因此要结合语音特性、人耳感知特性及噪声特性,根据实际情况选用合适的语音增强方法[1~2]。1.1语音特性语音信号是一种非平稳、时变的随机过程,其产生过程与发声器官的运动紧密相关。而发声器官的状态变化速度比声音振动的速度要缓慢得多,因此语收稿日期:2006212211作者简介:黄苏雨(19762),女,江西南昌人,南昌大学信息工程学院硕士研究生,
7、研究方向:语音信号处理;梁声灼,男,江西南昌人,副教授,研究方向:语言号处理,黄苏园,女,江西南昌人,天津电气传动设计研究院助理工程师,研究方向:语音信号处理。2007年第3期黄苏雨等:语音增强方法综述17音信号可以认为是短时平稳的。在一段短时间内(10~30ms)其特性基本保持不变即相对稳定,从而可以应用平稳随机过程的分析方法来处理语音信号,并可以在语音增强中利用短时频谱的平稳特性。语音信号分为清音和浊音两大类,两者在语音产生机理上和特征上有明显的差异。比如浊音在时域上有明显的周期性和较强的振幅,其能量大部分集中在低频域内,在频谱上表现出共振峰结构