基于稀疏编码的语音增强方法

基于稀疏编码的语音增强方法

ID:5334551

大小:331.42 KB

页数:6页

时间:2017-12-08

基于稀疏编码的语音增强方法_第1页
基于稀疏编码的语音增强方法_第2页
基于稀疏编码的语音增强方法_第3页
基于稀疏编码的语音增强方法_第4页
基于稀疏编码的语音增强方法_第5页
资源描述:

《基于稀疏编码的语音增强方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、万方数据第22卷第1期青岛大学学报(自然科学版)2o09年3月JOURNALOFQINGDAOUNIVERSITY(NaturalScienceEdition)V01.22No.1Mar.209文章编号:1006—1037(2009)29—0031—06基于稀疏编码的语音增强方法杜军1’2(1.山东大学信息科学与工程学院,山东济南250100;2.山东师范大学传播学院,山东济南250014)摘要:利用带噪语音经特征基函数矩阵转换后所具有的稀疏特性,用最大似然估计方法对转换后得到的稀疏分量进行非线性压缩去噪,然后再经过反变换和重构恢复出原始语音信号的估计。特征

2、基函数矩阵反映了语音数据本身的统计特性。仿真结果表明,与小波消噪法相比利用稀疏编码方法能极大程度地抑制背景噪声。关键词:语音增强;稀疏编码;独立分量分析;小波消噪中图分类号:TN912.3文献标识码:A语音通信过程中不可避免会受到周围环境噪声的干扰,这些干扰使接收到的语音为被噪声污染的带噪信号。语音增强的目的就是从带噪信号中提取出尽可能纯净的原始语音。由于噪声的随机特性,完全消噪是不可能的,语音增强的作用就是要改善语音质量,消除背景噪声,提高可懂度。目前已有的语音增强算法大多是建立在语音生成模型及感知模型的基础上,主要有噪声对消法、谱相减法、维纳滤波法等n1

3、;近年来基于小波变换的语音增强方法也取得了广泛的应用。稀疏编码最初起源于独立分量分析(IndependentCorn—ponentAnalysis—ICA)特征提取,并被应用到图像增强中[2’3]。本文提出基于稀疏编码的语音增强方法主要利用了语音数据本身的统计特性。利用ICA对语音数据找到一种特征基函数转换矩阵,也即一种神经元网络表征,在这个神经元网络里,只有少数的一些神经元权值起主要作用,这样带噪语音经过该特征矩阵转换后得到的分量具有稀疏特性,然后采用最大似然估计方法对各稀疏分量进行非线性去噪,最后对去噪后的各分量进行逆变换和重构恢复出去噪后的信号,从而达

4、到语音增强的目的。稀疏编码去噪原理设一维带噪观测变量Y是由零均值平稳随机变量X和加性噪声V构成,.Y=X+V(1)式中,X为具有稀疏分布的待估计原始信号,V为方差为d2的高斯白噪声。零均值随机变量X之所以称为“稀疏”是指其概率密度函数在原点处有尖锋,两旁有较重的拖尾,实际上,稀疏分布就等同于超高斯分布[2]。图1所示的Laplace双指数分布是一种典型的超高斯分布,图中虚线为高斯分布情形。定义为p(·)为X的概率密度函数,g(·)=一logp(·)为其负的log概率密度,根据文献[2],利用最大似然估计法(MLE)可以得到X的估计式:1艾一口rgrain者(

5、Y—u)2+g(u)(2)U厶。也称作最大后验概率估计(MAP)。这样,若概率密度函数p(·)确定,则可由此式估计原始信号。当X具有Laplace稀疏分布时,其概率密度函数为p(x)=exp(一厄lx1)厢,由文献[2,3]中对最大似然估计算法的推导可知文为:艾一f(Y)=sign(Y)max(O,IYl一√2d2)(3)·收稿日期:2008一lO一20基金项目:国家自然科学基金(60572105);高等学校博士学科点专项科研基金(No.20050422017);教育部新世纪优秀人才支持计划作者简介:杜军(1973一)。女,博士生,讲师,主要从事语言信息处理

6、,盲信号处理。万方数据32青岛大学学报(自然科学版)第22卷函数f(·)即为非线性去噪函数(如图2),为作比较,虚线X—Y亦在图中给出。对于这个去噪函数的利用,可以理解为,由于Laplace超高斯分布在原点处存在着尖峰,因此可以将Y中较小的值对应的X完全看作是噪声,通过阈值处理将这些值置为零,从而达到对观测变量进行去噪的目的。非线性去噪函数f(·)实际上是一个软阈值处理器。圈1Laplace超高斯分布,/‘.//夕

7、。一∥/。。。L?/i图2非线性去噪函数2基于稀疏编码的语音增强2.1语音增强原理假设带噪语音z(N)是由纯净语音6(N)经高斯白噪声铆(N)污

8、染后产生(N为采样点数):z(N)一6(N)+可(N)(4)首先对z(N)进行无交叠分帧处理[4],设帧长为优,得到n帧短时平稳语音序列z;(i=1,⋯,咒),构成n×m维的矩阵X:X—XlX2:●工^z(2)x(m+2);z((,2—1)m+2)z(优)z(2m)z(nm)(5)定义x=Exl,x2,⋯,‰]T为一神经元网络的输入,矩阵1.,一(w1,⋯,%)(Wi是列矢量)为该神经元网络权值矩阵,在该网络中只有少数的一些神经元权值起主要作用。设*3---Es。,s:,⋯,“]T为该网络的咒个输出,则可以建立如下线性关系:S—WTX(6)这样多维矢量X经(

9、6)式转换后得到的输出分量s;具有稀疏特性,然后就可

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。