欢迎来到天天文库
浏览记录
ID:60843031
大小:2.43 MB
页数:64页
时间:2020-12-21
《第12章--语音增强技术ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第12章语音增强技术§12.1语音增强技术的概念和研究的意义§12.2噪声度量、特性和评价§12.3语音增强的原理和方法§12.1语音增强技术的概念和研究的意义一、语音增强的定义二、语音增强研究的意义一、语音增强的定义语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。一句话,从含噪语音中提取尽可能纯净的原始语音。二、语音增强的意义1.日常生活中,经常会遇到在噪声干扰下进行语音通信的问题。例如在汽车、火车上使用移动电话,旁人的喧闹声,马路旁和市场
2、里的公用电话等。2.军事通信中,指挥员的作战命令和战斗员的战情汇报都需要用语音来表达,由于战斗环境中的声环境恶劣,特别是炸弹产生的冲击性噪声,使有用信号完全淹没在噪声中。(3)窃听技术中需要语音增强(4)语音识别技术需要语音增强在实际生活中,语音信号无时无地不受各种噪声干扰。人们正常的生活环境就是一个声级为60dB左右的噪声环境。被强噪声污染的场合,噪声达120dB以上。§12.2噪声度量、特性和评价一、噪声的分类和度量二、噪声的特性一、噪声的分类和度量1.噪声的定义:噪声是扣除被测信号真实值后的各种测量值
3、,可能来自外界环境、物理系统、操作人员等。广义将噪声称为干扰。按产生原因和按噪声性质分类。(1)产生原因:产生于物理系统外部,并以声、光、电、机械等方式作用于物理系统,称为外部噪声;物理系统内部产生的噪声称为内部噪声,例如量子噪声等。2.噪声的分类(2)按性质分为:脉冲噪声(爆炸、撞击和放电)和连续噪声;周期性周期(如交流电的干扰)和非周期性噪声;按统计特性分为:平稳噪声(如白噪声)和非平稳噪声(如色噪声);按噪声和信号相关的性质分为加性噪声和乘性噪声。我们研究的噪声是声音的一种,它具有声波的一切特性,称之
4、为声噪声。3.噪声的度量声压、声强和声功率(1)声压级(SPL):Lp=20lg(P/P0)P0=20uPa(2)声强级:LI=20lg(I/I0)I0=1012W/m2(3)声功率级:Lw=20lg(W/W0)W0=1012W噪声源和噪声环境声压/Pa声压级/dB飞机附近200140织布车间20100地铁0.6390繁华街道0.06370普通谈话0.0260安静房间0.00240耳语0.0006330树叶沙沙声0.000220农村静夜0.00006310听阈0.000020声压和声压级表征声音在物理上的强
5、弱,它是对噪声的客观评价,不能表征人对声音的主观感觉。响应级和响度是人耳对噪声的主观评价的基本量之一。响度的单位为宋(Sone)响度级的单位为方(phon),在数值上等于1kHz纯音的声强级。噪声度量的另一个参数就是信噪比。SNR=SNRout/SNRin二、噪声的特性从统计特性的角度讲:平稳噪声和非平稳噪声。白噪声是平稳噪声中的一种,其频谱和功率谱为常数,其概率密度分布是满足正态分布。§12.3语音增强的原理和方法一、频域语音增强技术二、时域语音增强技术三、时频语音增强技术四、麦克风阵列语音降噪技术一、频
6、域语音增强技术是语音信号中的一种重要技术,由于其原理简单所以被广泛使用,如手机中的降噪处理就是采用的此方法,美国NCT的ClearSpeech产品中,就是应用的这技术。谱相减法是频域语音增强技术的常用方法。1.谱相减法的基本原理描述2.谱相减法的数学推导3.谱相减法的特点1.谱相减法(SpectralSubtraction)的基本原理描述DFT平方平方DFT+-插入相位开方IDFT含噪语音x(n)=s(n)+d(n)
7、X(ejw)
8、d'(n)
9、D'(ejw)
10、纯噪声
11、S'(ejw)
12、ejarg(X(jw))
13、s'(n)原始语音谱幅度的估值将含噪语音信号和有声/无声判别得到的纯噪声信号进行DFT变化,从含噪语音谱幅度的平方中减去纯噪声的谱幅度的平方,然后开方,得原始语音谱幅度的估值,再借用含噪语音的相位,进行IDFT变化,得到增强的语音。2.谱相减法的数学推导首先假设语音和噪声信号是线性叠加的,且噪声是平稳的,噪声与语音信号不相关。x(n)=s(n)+d(n)X(ejw)=S(ejw)+D(ejw)简写为:X(w)=S(w)+D(w)X(w)•X*(w)=(S(w)+D(w))•(S(w)+D(w))*展开得到:
14、
15、X(w)
16、2=
17、S(w)
18、2+
19、D(w)
20、2+S(w)•D*(w)+S*(w)•D(w)对上式两边取数学期望有:E[
21、X(w)
22、2]=E[
23、S(w)
24、2]+E[
25、D(w)
26、2]+E[S(w)•D*(w)]+E[S*(w)•D(w)]由于噪声与语音信号不相关,且傅立叶变换不会改变信号之间的相关性,上式中,最后两项均为0。则上式简化为:E[
27、X(w)
28、2]=E[
29、S(w)
30、2]+E[
31、D(w)
32、2]利用语音信号的短
此文档下载收益归作者所有