语音增强算法的实现ppt课件.pptx

语音增强算法的实现ppt课件.pptx

ID:60844550

大小:108.27 KB

页数:22页

时间:2020-12-21

语音增强算法的实现ppt课件.pptx_第1页
语音增强算法的实现ppt课件.pptx_第2页
语音增强算法的实现ppt课件.pptx_第3页
语音增强算法的实现ppt课件.pptx_第4页
语音增强算法的实现ppt课件.pptx_第5页
资源描述:

《语音增强算法的实现ppt课件.pptx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、语音增强算法的实现TheRealizationoftheSpeechEnhancementAlgorithm目录CONTENTS基本概述BasicOverview01算法研究AlgorithmicResearch03相关特性Relevant Features02PARTONE基本概述401语音增强语音增强与语音信号处理理论有关,而且涉及到人的听觉感知和语音学。采用语音增强技术进行预处理,可有效地改善系统性能。02语音增强的目标对收听人而言主要是改善语音质量,提高语音可懂度,减少疲劳感;对语音处理系统(识别器、声码器、手机)而言是提高系

2、统的识别率和抗干扰能力。目前国内外抗噪声技术的的研究成果大体分为以下三类解决方法51.采用语音增强算法,提高语音识别系统前端预处理的抗噪声能力,提高输入信号的信噪比2.寻找稳健的语音特征作为特征参数,实验证明,这类参数对宽带语音具有较好的抗噪性3.基于模型参数自适应的噪声补偿算法PARTTWO相关特性一、语音特性70301语音信号具有短时平稳性02语音信号可以分为浊音和清音语音信号可以利用统计分析特征描述二、人耳感知特性8人耳对语音的感知主要是通过语音信号频谱分量幅度获取的,对各分量相位则不敏感,对频率高低的感受近似与该频率的对数值成

3、正比。人耳具有掩蔽效应,人耳除了可以感受声音的强度、音调、音色和空间方位外,还可以在两人以上的讲话环境中分辨出所需要的声音,这种分辨能力是人体内部语音理解机制具有的一种感知能力。人类的这种分离语音的能力与人的双耳输入效应有关,称为“鸡尾酒会效应”。语音增强的最终效果度量是人耳的主观感觉,所以在语音增强中可以利用人耳感知特性来减少运算代价。三、噪声特性9根据与输入语音信号的关系,噪声可分为加性噪声和非加性噪声两类。对某些非加性噪声而言,可以通过一定的变换转换成加性噪声。语音处理中的加性噪声大体上可以分为周期性噪声、脉冲噪声、宽带噪声和同

4、声道其他语音的干扰等。PARTTHREE算法研究目前语音增强算法大致可以分为以下四种11一参数方法二非参数方法三统计方法四其他方法一、参数方法12此类方法主要依赖于使用的语音生成模型(例如AR模型),需要提取模型参数(如基音周期、LPC系数),常常使用迭代方法。二、非参数方法13非参数方法不需要从带噪信号中估计模型参数,因此这种方法的应用范围较广。但由于没有利用可能的语言统计信息,故结果一般不是最优化的。这类方法包括自适应噪声抵消法、谱减法等。14自适应噪声抵消法15实际应用第三方面由于该方向的应用原理和上面两个有所不同,所以改变了排

5、版形式以区分这一特点。这段话原文中是三行,所以我在这里也得尽力把它编成三行的形式,这样排版才会好看些。实际应用第四方面由于该方向的应用原理和上面两个有所不同,所以改变了排版形式以区分这一特点。这段话原文中是三行,所以我在这里也得尽力把它编成三行的形式,这样排版才会好看些。设带噪语音输入为y(n)=s(n)+d(n),s(n)为语音信号,d(n)为未知噪声信号,r(n)参考噪声输入,也即自适应滤波器的输入,v(n)是该滤波器的输出。r(n)与s(n)无关,而与d(n)相关。图自适应噪声抵消原理图自适应噪声抵消法16自适应滤波器通常采用F

6、IR滤波器,系数采用最小均方误差(MMSE)准则来迭代估计。判断标准是使误差信号e(n)能量最小:其中,wk是滤波器系数,N是滤波器抽头数。MMSE准则要求噪声和语音相互独立,这时,误差信号e(n)能量最小,可保证v(n)与d(n)最接近。自适应噪声抵消法17谱减法原理:利用噪声的统计平稳性以及加性噪声与语音不相关的特点而提出的一种语音增强方法。此类语音增强方法将估计的对象放在短时谱幅度上。谱减法18优缺比较简单,只需要进行正反傅立叶变换,而且实时实现较容易。适用的信噪比范围较窄,在信噪比较低时对语音的可懂度损伤较大。所以实际应用时除

7、了要降低噪声外,还要兼顾语音的可懂度和自然度。三、统计方法19统计方法较充分地利用语音和噪音的统计特性,一般要建立模型库,需要训练过程获得初始统计参数,它与语音识别系统的联系很密切。如最小均方误差估计(MMSE)、利用听觉掩蔽效应等。对于特定的失真准则和后验概率不敏感的估计方法是很有用处的。MMSE算法20优缺达到了语音可懂度和清晰度的折衷,适用信噪比的范围较广由于需要统计各种参数,算法运算量大,实时性不好。四、其他方法21其他方法包括小波变换、卡亨南-洛维变换(KLT)、离散余弦变换(DCT)、人工神经网络等。这些方法不像前三类方法

8、那样成熟,可以概括地称为非主流方法。THANKS

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。