《语音增强方法》PPT课件

《语音增强方法》PPT课件

ID:39713391

大小:286.30 KB

页数:25页

时间:2019-07-09

《语音增强方法》PPT课件_第1页
《语音增强方法》PPT课件_第2页
《语音增强方法》PPT课件_第3页
《语音增强方法》PPT课件_第4页
《语音增强方法》PPT课件_第5页
资源描述:

《《语音增强方法》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、语音增强方法背景及意义语音增强是解决噪声污染的一种有效方法,对受背景噪声污染的语音进行增强处理是一个具有重要实际意义的课题,是目前迫切需要解决的问题,语音增强因而成为当前语音信号处理中的一个重要研究方向。语音增强技术在许多方面有着很广泛的应用,例如:1、在国家和社会安全方面,侦听信号常常含有较大的噪声,语音增强有助于提高侦听系统的效果,可以帮助侦察破案或获取情报。2、飞机驾驶人员与地面指挥的语音通讯常常因飞机螺旋桨、发动机等强噪声而受到千扰,需要进行语音增强以保证语音信息的可靠传达。3、深水潜水员在充氦气的面罩内说话产生的语音信号会因特殊的气体环境而产生畸变,语音共振峰移动,通过语

2、音增强能够进行校正。4、在街道、机场等嘈杂环境中使用的公共电话会因严重的干扰而影响通话质量;在高速行使的汽车中使用移动电话也有类似的问题。有效的语音增强系统能够大大提高语音通讯的抗干扰能力,能有效地扩展移动通讯的适应能力和应用范围。5、室内回声在比较严重的情况下会和原语音信号一起通过广播等语音系统进行传播,影响收听效果。语音信号增强在这方面也能有所贡献。6、录音中的频率响应不平坦造成的失真,或有历史价值的旧唱片和旧录音带中的噪声,可以通过语音增强加以改善。7、有语言障碍的残疾人发出的失真语音在经过合理的语音增强补偿后能够被正常人听懂,提高了残疾人的社会交往能力。语音增强在通信、语音

3、识别、语音编码等领域有着重要的应用,是语音信号处理领域的研究热点之一。特别是应用于单声道含噪语音信号的增强技术,尤其受到重视。语音增强技术研究现状目前国内外的研究成果大体分为三类解决方法:第一类方法是采用语音增强算法等,提高语音识别系统前端预测处理的抗噪声能力,提高输入信号的信噪比。第二类方法是寻找稳健的耐噪声的语音特征参数。第三类方法是基于模型参数适应化的噪声补偿算法。例如,针对加法性噪声的合成法,法和针对乘法性噪声的法以及两方面都考虑的方法等。第2章语音增强的相关问题语音增强不仅涉及到信号检测、波形估计等传统的信号处理理论,而且它与语音特性、噪声特性和人耳的感知特性都有密切地关

4、系。因此本章首先将介绍语音、噪声和人耳感知的主要特性,然后概述了几种常用的语音增强算法以及语音增强算法的各种评价方法。2.1语音及噪声的特性1)语音特性语音信号的特点主要是指它的声学特性、语音信号的时域波形和频谱特性以及语音信号的统计特性等。下面将归纳语音信号三个主要的特点:a、语音信号具有短时平稳的特性。语音信号的短时平稳特性是语音信号分析和处理的基础,利用这一特性就可以应用平稳随机过程的分析来处理语音信号,并可以在语音增强中利用短时频谱时的平稳特性。b、任何语音都由元音与辅音(清辅音、池辅音)两种音素组成。在语音增强中可以利用池音具有明显的周期性这一特点来区别和抑制非语音地噪声

5、,而清辅音的特性则难与宽带噪声区分。c、语音信号可以用统计分析特性来描述。2)噪声特性噪声可以是加性的,也可以是非加性的。这里仅讨论加性噪声。加性噪声通常分为:冲激噪声(或脉冲噪声)、周期性噪声、宽带噪声、语音干扰噪声等。a冲激噪声:例如放电、打火、爆炸等都会引起冲激噪声。冲激噪声表现为它的时域波形中突然出现的窄脉冲。b周期性噪声:如“交流声”(交流电源的哼哼声),发动机、风扇之类的周期性运转的机械所发出的周期噪声等。周期性噪声的主要特点是在频谱图上它们具有许多离散的窄带谱,而且通常这些窄带谱都是时变的,位置也不固定。c宽带噪声:宽带噪声的来源很多,如热噪声、气流如风、说话时同时随

6、伴的呼吸等。噪声及各种随机噪声源产生的噪声,以及量化噪声等都可以视为宽带噪声。d同声道语音干扰:干扰语音信号和待传语音信号同时在一个信道中传输所造成语音干扰成为同声道语音干扰,简称语音干扰;或者在多人同时说话的情况下,混叠语音信号中不需要的语音也形成了语音干扰。e传输噪声:这是传输系统的电路噪声。与背景噪声不同,它在时间域里是语音和噪声的卷积。3)人耳的感知特性目前语音感知已经有一些重要的结论,可应用于语音增强技术:a)人耳对于声波频率高低的感觉与实际频率的高低不呈线性关系,面近似为对数关系;对频率人耳的分辨能力受声强的影响,而人耳对声强的感觉很灵敏并且有很大的动态范围,过强或者太

7、弱的声音都会导致对频率的分辨力降低;人耳对语音信号的幅度谱较为敏感,对相位不敏感。这一点对语音信号的恢复很有帮助。共振峰对语音感知很重要,特别是前三个共振峰更为重要。b)人耳具有掩蔽效应,即会产生一个声音由于另外一个声音的出现而导致该声音能被感知的阈值提高的现象。c)人耳除了可以感受声音的强度、音调、音色和空间方位外,还可以在两人以上的讲话环境中分辨出所需要的声音,这种分辨能力是人体内部语音理解机制具有的一种感知能力。人类的这种分离语音的能力与人的双耳输入效应有关,称

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。