自训练过完备字典和稀疏表示的语音增强

ID：12930187

大小：195.00 KB

页数：9页

时间：2018-07-19

资源描述：

《自训练过完备字典和稀疏表示的语音增强》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、自训练过完备字典和稀疏表示的语音增强-电气论文自训练过完备字典和稀疏表示的语音增强崔晓（郑州师范学院，河南郑州450044）摘要：提出的算法利用带噪信号进行训练以获得过完备字典，通过设定较大的字典训练阈值，训练过程只对语音信号进行，使得自训练字典与语音信号之间相关性较强。利用该字典和较小的阈值对语音信号进行稀疏表示，进而实现语音增强。仿真实验表明，增强后的信号表示系数稀疏度更强，增强效果在信噪比（SNR）和感知语音质量评估（PESQ）得分方面均有较大改进。关键词：正交匹配追踪；迭代阈值；字典训练；语音增强中图分类号：TN912.3?34文献标识码：A文章编号：1

2、004?373X（2015）13?0056?03收稿日期：2015?01?22基金项目：郑州市普通科技攻关计划项目（141PPTGG365）；河南省教育厅科学技术研究重点项目（14A510023)0引言语音信号是人类交流过程中最自然、最常用的方式，语音增强能降低噪声提高信噪比，是语音信号预处理的一个重要过程。在稀疏表示中，利用过完备字典中少数原子的线性组合来表示样本信号，其优势是有更大的灵活性和噪声情况下更强的稳定性，因而成为目前研究较多的算法，在语音压缩[1]、识别[2]以及语音增强[3?4]方面均得到较为广泛的应用。在基于稀疏表示的语音增强中，过完备字典的构

3、成起着一个非常关键的作用[5]，良好的字典能够使纯净语音信号的表示更加稀疏，从而与噪声的区分度更为显著。在这个过程中，为了得到更为稀疏的系数，所采用的字典从过完备离散余弦变换、过完备小波变换等固定字典到参数化字典设计，进而采用自适应字典学习算法训练字典，使字典与被处理信号之间的相关性增强[6?7]。文献[8]利用纯净信号训练字典，将语音激活检测估计的噪声作为重构阈值，对含噪语音进行稀疏分解，将系数与字典重构得到无噪的语音信号。然而，在语音增强处理的过程中目标语音是受到噪声污染的，纯净语音只能是其他语音信号。本文算法利用阈值正交匹配追踪（OMP）和K奇异值分解算法

4、（K?svd）直接对含噪语音进行字典训练，得到的字典与语音信号有更强的相关度，因而得到的表示系数更为稀疏，在语音增强时取得更好的效果。1带噪语音信号的稀疏重构对于一个适合的过完备字典D，语音成分在其上的系数是稀疏的，而白噪声则不具备这种特性。当已知噪声方差σ2的情况下，在进行原子选择时通过设定与其有关的恰当的阈值ε，可以控制只从带噪信号中选出与纯净语音相关的系数，而摒弃与噪声有关的系数以实现语音增强。2阈值正交匹配追踪算法在信号的稀疏表示中，由于字典的过完备性，x在由D构成的冗余基上的稀疏表示系数A的求解是一个非常困难的过程。快速稳定的稀疏分解与重构算法起着重要

5、的作用，OMP属于贪婪方法的一种，在精度要求相同的情况下，OMP由于更快且更容易实现而得到广泛的应用。为得到最优的稀疏表示结果，OMP使第k个残差Rk与当前信号的近似值yk正交，此时该残差与当前yk的任意一个原子都线性无关，从而在之后的分解过程中，不会出现之前yk中已经选择过的原子，因此是最优的。传统的OMP先将选中原子进行正交化处理，然后再将残差在这些正交原子基上进行分解，以保证残差与所选中的全部原子正交。改进算法在信号投影过程中，将原信号在所选中的所有原子的列空间进行正交投影，所得残差与这些被选中的原子都正交[9]。本文采用的阈值正交匹配追踪算法中，设定迭代

6、结束的阈值条件，当原始信号与重构信号的残差小于该阈值时，停止迭代。本文阈值正交匹配追踪算法描述如下：（1）稀疏编码阶段。对给定的训练样本y，利用阈值正交匹配追踪从当前的字典D中选择最佳原子，求出稀疏表示的系数A。（2）字典更新。针对步骤（1）得到的稀疏系数A，更新字典中每一列即各个原子。K?svd算法通过对残差矩阵进行奇异值分解，用最大特征值所对应的向量更新字典的一列，同时更新该列相对应的系数A的行元素，为保证系数的稀疏性，在奇异值分解计算时只用与待更新字典的列有关的残差信号[10]。4提出算法描述及性能评估4.1算法描述综前所述，本文提出的语音增强算法可描述为

7、：（1）噪声方差估计。对观测到的带噪语音信号利用其前3000个样本估计噪声方差σ2。（2）字典训练。设定字典训练阈值ε1=k1Mσ作为K?svd字典训练时阈值OMP的迭代结束条件，初始化字典选择过完备离散余弦基，利用分帧后带噪语音信号训练字典D。（3）稀疏增强。设定稀疏表示阈值ε2=k2Mσ，对分帧后带噪语音信号根据步骤（2）训练的字典和ε2采用阈值OMP分解，得到估计的纯净语音信号系数A。（4）语音合成。由x=DA计算增强后的分帧语音信号，最后通过迭代相加法（OLA）得到增强的语音。在带噪语音字典训练和语音信号分解的过程中，均通过阈值OMP求解系数。反复实验表

8、明，为使训练的字典只与语

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 9



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

自训练过完备字典和稀疏表示的语音增强

自训练过完备字典和稀疏表示的语音增强

相关文章

相关标签