第12章--语音增强技术ppt课件.ppt

ID：60843031

大小：2.43 MB

页数：64页

时间：2020-12-21

资源描述：

《第12章--语音增强技术ppt课件.ppt》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、第12章语音增强技术§12.1语音增强技术的概念和研究的意义§12.2噪声度量、特性和评价§12.3语音增强的原理和方法§12.1语音增强技术的概念和研究的意义一、语音增强的定义二、语音增强研究的意义一、语音增强的定义语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后，从噪声背景中提取有用的语音信号，抑制、降低噪声干扰的技术。一句话，从含噪语音中提取尽可能纯净的原始语音。二、语音增强的意义1.日常生活中，经常会遇到在噪声干扰下进行语音通信的问题。例如在汽车、火车上使用移动电话，旁人的喧闹声，马路旁和市场

2、里的公用电话等。2.军事通信中，指挥员的作战命令和战斗员的战情汇报都需要用语音来表达，由于战斗环境中的声环境恶劣，特别是炸弹产生的冲击性噪声，使有用信号完全淹没在噪声中。（3）窃听技术中需要语音增强（4）语音识别技术需要语音增强在实际生活中，语音信号无时无地不受各种噪声干扰。人们正常的生活环境就是一个声级为60dB左右的噪声环境。被强噪声污染的场合，噪声达120dB以上。§12.2噪声度量、特性和评价一、噪声的分类和度量二、噪声的特性一、噪声的分类和度量1.噪声的定义：噪声是扣除被测信号真实值后的各种测量值

3、，可能来自外界环境、物理系统、操作人员等。广义将噪声称为干扰。按产生原因和按噪声性质分类。（1）产生原因：产生于物理系统外部，并以声、光、电、机械等方式作用于物理系统，称为外部噪声；物理系统内部产生的噪声称为内部噪声，例如量子噪声等。2.噪声的分类（2）按性质分为：脉冲噪声（爆炸、撞击和放电）和连续噪声；周期性周期（如交流电的干扰）和非周期性噪声；按统计特性分为：平稳噪声（如白噪声）和非平稳噪声（如色噪声）；按噪声和信号相关的性质分为加性噪声和乘性噪声。我们研究的噪声是声音的一种，它具有声波的一切特性，称之

4、为声噪声。3.噪声的度量声压、声强和声功率（1）声压级(SPL)：Lp=20lg(P/P0)P0＝20uPa（2）声强级：LI=20lg(I/I0)I0=1012W/m2（3）声功率级：Lw=20lg(W/W0)W0=1012W噪声源和噪声环境声压/Pa声压级/dB飞机附近200140织布车间20100地铁0.6390繁华街道0.06370普通谈话0.0260安静房间0.00240耳语0.0006330树叶沙沙声0.000220农村静夜0.00006310听阈0.000020声压和声压级表征声音在物理上的强

5、弱，它是对噪声的客观评价，不能表征人对声音的主观感觉。响应级和响度是人耳对噪声的主观评价的基本量之一。响度的单位为宋（Sone）响度级的单位为方（phon），在数值上等于1kHz纯音的声强级。噪声度量的另一个参数就是信噪比。SNR=SNRout/SNRin二、噪声的特性从统计特性的角度讲：平稳噪声和非平稳噪声。白噪声是平稳噪声中的一种，其频谱和功率谱为常数，其概率密度分布是满足正态分布。§12.3语音增强的原理和方法一、频域语音增强技术二、时域语音增强技术三、时频语音增强技术四、麦克风阵列语音降噪技术一、频

6、域语音增强技术是语音信号中的一种重要技术，由于其原理简单所以被广泛使用，如手机中的降噪处理就是采用的此方法，美国NCT的ClearSpeech产品中，就是应用的这技术。谱相减法是频域语音增强技术的常用方法。1.谱相减法的基本原理描述2.谱相减法的数学推导3.谱相减法的特点1.谱相减法（SpectralSubtraction）的基本原理描述DFT平方平方DFT＋－插入相位开方IDFT含噪语音x(n)=s(n)+d(n)

7、X(ejw)

8、d'(n)

9、D'(ejw)

10、纯噪声

11、S'(ejw)

12、ejarg(X(jw))

13、s'(n)原始语音谱幅度的估值将含噪语音信号和有声/无声判别得到的纯噪声信号进行DFT变化，从含噪语音谱幅度的平方中减去纯噪声的谱幅度的平方，然后开方，得原始语音谱幅度的估值，再借用含噪语音的相位，进行IDFT变化，得到增强的语音。2.谱相减法的数学推导首先假设语音和噪声信号是线性叠加的，且噪声是平稳的，噪声与语音信号不相关。x(n)=s(n)+d(n)X(ejw)=S(ejw)+D(ejw)简写为：X(w)=S(w)+D(w)X(w)•X*(w)=(S(w)+D(w))•(S(w)+D(w))*展开得到：

14、

15、X(w)

16、2=

17、S(w)

18、2+

19、D(w)

20、2+S(w)•D*(w)+S*(w)•D(w)对上式两边取数学期望有：E[

21、X(w)

22、2]=E[

23、S(w)

24、2]+E[

25、D(w)

26、2]+E[S(w)•D*(w)]+E[S*(w)•D(w)]由于噪声与语音信号不相关，且傅立叶变换不会改变信号之间的相关性，上式中，最后两项均为0。则上式简化为：E[

27、X(w)

28、2]=E[

29、S(w)

30、2]+E[

31、D(w)

32、2]利用语音信号的短

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 64



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

第12章--语音增强技术ppt课件.ppt

第12章--语音增强技术ppt课件.ppt

相关文章

相关标签