基于压缩感知重构算法及语音压缩研究

基于压缩感知重构算法及语音压缩研究

ID:32412411

大小:1.10 MB

页数:65页

时间:2019-02-04

上传者:U-22505
基于压缩感知重构算法及语音压缩研究_第1页
基于压缩感知重构算法及语音压缩研究_第2页
基于压缩感知重构算法及语音压缩研究_第3页
基于压缩感知重构算法及语音压缩研究_第4页
基于压缩感知重构算法及语音压缩研究_第5页
资源描述:

《基于压缩感知重构算法及语音压缩研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

ResearchonReconstructionAlgorithmsandCompressionofSpeechBaseonCompressedSensingThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByZhiweiLiuSupervisor:Prof.WeipingZhuApril2013 南京邮电大学学位论文原创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。本人学位论文及涉及相关资料若有不实,愿意承担一切相关的法律责任。研究生签名:_____________日期:____________南京邮电大学学位论文使用授权声明本人授权南京邮电大学可以保留并向国家有关部门或机构送交论文的复印件和电子文档;允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索;可以采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文电子文档的内容和纸质论文的内容相一致。论文的公布(包括刊登)授权南京邮电大学研究生院(筹)办理。涉密学位论文在解密后适用本授权书。研究生签名:____________导师签名:____________日期:_____________ 摘要Nyquist采样定理指出:想要不失真的将信号恢复出来,采样速率必须大于或等于信号最大带宽的两倍。随着生活水平的提高和信息技术的发展,人类对信息需求的数量与质量与日俱增,导致传输成本和存储要求大大提高。面对海量的数据处理与传输,传统的奈奎斯特采样方法显得越来越不能适应这种需求了。压缩感知是近年来国内外信号处理领域一个研究的热点,“边采样边压缩”的特点使得可以以远低于Nyquist采样率的速率对信号进行压缩采样,压缩与采样集一步完成。相关理论已经证明在满足一定条件的情况下信号几乎可以无失真的恢复,信号的采样速率以及数据的存储和传输的代价得到了非常大的降低,这种新的采样思想已经开始打破传统的采样瓶颈。本文首先阐述了压缩感知基本原理,并且重点探讨了其中的方向类追踪算法。针对最优化理论中常用的牛顿法,结合ROMP算法中的正则化思想,提出了一种改进的正则化牛顿算法,实验仿真结果表明新算法在性能上有一定的提高。其次,本文尝试将压缩感知思想应用于语音信号的时域处理,提出了一种语音的自适应压缩感知方案。与对语音信号直接进行压缩感知的“原始处理方案”相比较,所研究的方案可以进一步提高语音信号的压缩率与重构概率。除此之外,本文还对比了传统的离散余弦变换压缩与基于压缩感知的压缩,分析了基于压缩感知压缩方案的抗噪声性能。语音信号在传输前需要进行压缩编码,以减低码率。本文先简述了两种语音压缩编码方案,即脉冲编码调制和线性预测分析。本文接着尝试对语音感知观测序列进行压缩编码,并进行了实验仿真,以验证语音信号恢复的可行性。此外,本文还研究了一种基于压缩感知的压缩编码方案——基于LPC系数的压缩感知编码关键词:压缩感知,正则化,自适应,压缩,编码I AbstractTheconventionalNyquistsamplingtheoremstatesthatsignalcanbereconstructedwithoutdistortiononlywhenthesamplingfrequencyisgreaterthanorequaltotwotimesthehighestfrequencyofthesignal.Withtheimprovementoflivingstandardsandthedevelopmentofinformationtechnology,theamountandqualityofinformationblockincreasing,resultinginthesignalsamplingrateandprocessingspeedaregettinghigherandhigher.Thetheoryofcompressedsensingproposedinrecentyearsbecomesahotideainthefieldofsignalprocessing.ItcompletessignalcompressionandsamplingatthesametimesothatthecompressedsamplingratecanbemuchlessthantheNyquistsamplingrate.Itmakesuseofthesparsityofthesignaltosampleatlowerrateandreconstructthesignalalmostwithoutdistortion,whichgreatlyreducesthesignalsamplingrate,datastorageandtransmissioncosts.Thenewsamplingmethodbeginstobreakthetraditionalsampling“bottleneck”.Thecompressedsensingtheoryandtraditionalrecoveryalgorithmisresearched.AnimprovedregularizedNewtonalgorithmisproposed.Theexperimentsshowsthatreconstructionpossibilityandtheconvergencespeedisbetterthanothersimilaralgorithms.Inordertocompressthespeechbasedoncompressedsensing,thecharacterofspeechisstudiedatfirst.SimulationresultsdemonstratethatspeechsignalissparseinDCTdomain,soanadaptivecompressedmethodisproposedandexperimentsresultsshowsthattheperformanceofrecoveredspeechbasedonthemethodabovehasgoodcompressionrateandreconstructionalpossibility.ThisThesisalsocomparesthetraditionalDCTcompressionmethodandtheCScompression,thenaturalnoiserobustnessisalsoanalyzedatthesametime.Itisnecessarytoencodethespeechbeforetransmission.Twokindsoftraditionalencodingmethodarediscussedinthisthesis:PlusCodingModulationandLinearPredictionCoding.Someexperimentsbasedonothers'ideaisshown,whichistryingtoencodetheobservationsequence,butfailed,thenanewkindofcodingmethodisstudied:CompressedsensingcodingbasedonLPC.Theexperimentsresultshowsthatthecodingrateislowercomparedtothemethodmentionedabove.Keywords:CompressedSensing,Regularized,Adaptive,Compression,codingI 目录专用术语注释表...................................................................................................................................................1第一章绪论.........................................................................................................................................................11.1研究背景................................................................................................................................................21.2本文的研究工作以及章节安排............................................................................................................3第二章压缩感知简述.........................................................................................................................................32.1压缩感知基本原理..................................................................................................................................32.1.1压缩感知过程.............................................................................................................................32.1.2两种观测模型.............................................................................................................................52.2压缩感知的基本内容.............................................................................................................................62.2.1稀疏表示.....................................................................................................................................62.2.2观测矩阵的设计.........................................................................................................................82.2.3重构算法.....................................................................................................................................92.3压缩感知的应用...................................................................................................................................122.4本章小结................................................................................................................................................12第三章一种改进的正则化牛顿算法...............................................................................................................133.1算法性能指标.......................................................................................................................................153.2匹配追踪算法简介...............................................................................................................................163.2.1正交匹配追踪算法....................................................................................................................163.1.2正则化匹配追踪算法................................................................................................................173.3正则化牛顿算法...................................................................................................................................173.3.1方向追踪类算法原理................................................................................................................193.3.2改进的正则化过程....................................................................................................................193.3.3正则化牛顿算法........................................................................................................................193.2本章小结................................................................................................................................................23第四章基于语音特征的自适应压缩感知.......................................................................................................244.1语音信号的特征...................................................................................................................................244.2语音信号的初步压缩感知...................................................................................................................254.2.1语音信号的可压缩性.................................................................................................................254.2.2两种压缩方法的比较.................................................................................................................274.2.3压缩感知的抗噪性能.................................................................................................................284.3基于语音特征的自适应压缩感知......................................................................................................314.3.1自适应压缩感知算法.................................................................................................................314.3.2实验仿真分析.............................................................................................................................334.4本章小结...............................................................................................................................................36第五章基于压缩感知的语音压缩编码...........................................................................................................385.1语音编码技术简介................................................................................................................................395.1.1线性预测编码............................................................................................................................395.1.2脉冲调制编码............................................................................................................................405.2基于压缩感知的语音编码研究............................................................................................................415.2.1观测序列的PCM编码..............................................................................................................415.2.2基于压缩感知的LPC预测编码...............................................................................................48II 5.3本章小结................................................................................................................................................50第六章总结与展望............................................................................................................................................51参考文献.............................................................................................................................................................53附录1程序清单.................................................................................................................................................56附录2攻读硕士学位期间发表的学术论文....................................................................................................57附录3攻读硕士学位期间参与的科研项目....................................................................................................58致谢...................................................................................................................................................................59III 专用术语注释表符号说明:Φ观测矩阵∆传感矩阵ψ稀疏基缩略词说明:BPBasisPursuit基追踪CSCompressedSensing/CompressiveSampling压缩感知CoSaMPCompressedSamplingMatchingPursuit压缩采样匹配追踪CPChainingPursuit链式追踪CGPConjugateGradientPursuit共轭梯度追踪DCTDiscreteCosineTransform离散余弦变换DCSDistributionalcompressedsensing分布式压缩感知DPDirectionPursuit方向追踪GPGradientPursuit梯度追踪KLTKarhunen-LoeveTransform卡洛南-洛伊变换MPMatchingPursuit匹配追踪OMPOrthogonalMatchingPursuit正交匹配追踪RIPRestrictedIsometryProperty约束等距性条件ROMPRegularizedOrthogonalMatchingPursuit正则正交匹配追踪StOMPStage-wiseOMP分段正交匹配追踪SAMPSparsityAdaptiveMatchingPursuit稀疏自适应匹配追踪SPSubspacePursuit子空间追踪RNRegularizedNewtonAlgorithms正则化牛顿算法PCMPulseCodingModulation脉冲编码调制DPCMDifferentiaPulseCodingModulation差分脉冲编码调制LPCLinearPredictionCoding线性预测编码IV 南京邮电大学硕士研究生学位论文第一章绪论第一章绪论1.1本文研究背景传统的信息处理技术都是以奈奎斯特采样定理为理论基础,即采样速率必须不小于信号最高带宽的两倍。随着生活质量的飞速提高,人们对信息量需求的与日剧增,尤其是大数据的处理方面,传统方法所花费的传输成本和存储代价太大,因此基于奈奎斯特采样的信号处理技术显得很“吃力”,必须重新寻找一个打破这个必须要求“两倍”采样速率传统的方法。实际情况下在信号传输和存储之前,往往会对采集得到的数字信号进行压缩,丢弃掉一些“无关紧要”的信息,这也就是压缩的过程。最近几年专家学者提出另外一个思想:既然采集到的数据大部分都是不重要的,是否能够直接地采集重要的信号,丢弃不重要的信号——压缩采样集于一步完成。假如这些非常少量的信号能够无失真的恢复就不仅大大降低了信号采样的速率,并且使得存储、传输的成本得到了极大的降低。这相当于在同样的代价之下提高了信号处理的速率。最近几年,以Candes和Donoho为代表的数学家们提出了压缩感知(CompressedSensing,CS)的数学方法[1-6],压缩感知理论表明只要信号在某个变换域是稀疏的,那么就可以通过一个与稀疏基不相干的投影矩阵将信号投影到低维空间上,然后通过求解最优化问题从这些少量的观测值中近似无损的重构出原始信号。这样极大的降低信号的采样速率以及数据的存储和传输代价。特别是在传输环境差以及前线战场等领域显得特别有用,压缩感知将复杂的信号再现过程抛给了重构端,而传输端只要进行简单的观测运算。在实际中已经研究出一种基于压缩感知的单像素照相机[7,8,9],因此压缩感知能否体现其实用价值的一个关键,目前亟待有一个好的压缩感知重构算法。语音信号是人类最常用的一类信号,新的语音信号处理技术有利于提高人类的生活水平以及促进社会的进步,因此有效的产生,传输,存储,获得和处理语音信显得尤为重要。实验表明,语音信号在傅里叶域和DCT域具有较好的稀疏性,因此它具备了压缩感知的前提条件。绝大多数语音信号的频率在200到3400HZ之间,根据奈奎斯特采样定理,传统的语音信号采样频率一般是8KHZ,然而这种处理技术势必浪费大量的采样和数据存储资源。目前国内外对基于压缩感知的语音信号研究并不多,迄今为止有少量的研究成果,基于MP的语音信号稀疏分解的快速算法[10-12],基于压缩感知的语音分离,分布式语音压1 南京邮电大学硕士研究生学位论文第一章绪论缩感知(DCS),自适应多尺度压缩感知(AMCS)[13],Gemmeke和Cranen将压缩感知运用于噪声环境下语音识别系统,实验表明压缩感知提高了系统的抗噪性能。压缩感知理论的提出在信号处理领域有着重大的意义,各个领域都纷纷尝试将这项新理论应用到相关应用中,例如图像信号采集处理[14]、雷达信号[15]、医学图像处理[16]等领域。压缩感知理论比传统信号处理方式更加简单,展示了巨大的潜力和广阔的应用前景,但是其苛刻的条件以及复杂的重构算法亟待我们去解决和突破。1.2本文的研究工作以及章节安排本文首先研究传统的压缩感知算法,针对方向类追踪算法,提出了一种更优的重构算法。然后分析了语音信号自身的特点,提出了基于压缩感知的语音自适应压缩方案。由于语音信号在传输前要进行编码以满足信道的传输要求,本文还对压缩感知在语音编码中的应用进行了一些简单研究。本文对所提出和研究的新方案做了大量的仿真,实验表明新方法或新算法性能较优,在某些层面上具有一定的改进并且可行性较高。本文的具体章节安排如下:第一章,首先对论文的研究背景,研究目的和意义以及全文章节安排进行了系统介绍。第二章,简述了压缩感知理论基础知识,包括稀疏基,观测矩阵,重构算法三个方面。第三章,针对收敛速度较快的牛顿算法,结合正则化思想,提出了一种改进的正则化牛顿算法,仿真结果表明在收敛速度等性能上所研究的算法较好。第四章,介绍了语音的时域特征参数,将这些参数引用到压缩感知中,提出了一种基于语音特征的自适应语音压缩方案,并且用实验对比了传统的DCT压缩和CS压缩,指出了CS压缩的天然抗噪性能。第五章,简述了常见语音编码技术(参数编码和波形编码技术),并且研究了两种基于压缩感知的语音压缩编码方案,实验论证了这两种方案的可行性。第六章,全文总结以及展望2 南京邮电大学硕士研究生学位论文第二章压缩感知简述第二章压缩感知简述传统的奈奎斯特采样定理指出,信号的采样速率大于或等于信号最高带宽的两倍就可以近似无失真地恢复出原信号。面对“大数据”的处理,这种传统采样模式所需要的成本开销非常大——较为苛刻的硬件采样速率要求,较大的存储空间和传输成本,因此基于奈奎斯特采样的信号处理技术面对这些场合显得很“吃力”,必须寻找一个打破这个必须要求“两倍”采样频率传统的限制。鉴于一般信号仅仅在少量的时间段内才具有高频率信息,按照奈奎斯特理论,那么采样得到的数字信号就具有相当大的冗余(因为那些低频时间段的信号并不需要这么多点来恢复),因此人们往往在信号传输或者存储之前会对这种冗余进行消除,仅仅保留非常少量而且重要的信息。为了克服这种传统采样技术的缺陷,Candes,Donoho和Tao提出了一种新的数据处理思想——压缩感知(compressedsensing/Compressivesampling)。CS理论认为只要信号满足稀疏性或者可压缩条件,就可以用一个与变换矩阵不相关的观测矩阵对原始信号进行投影,得到一个低维度的信号,此信号的点数远远小于原始信号的点数,相当于信号直接进行了压缩处理。同时,相关理论证明了可以根据投影得到的少量数据,通过求解最优化问题重建出原始信号,因此这是在信号处理领域的一个重大理论突破,对我们人类信息技术的发展具有很重要的研究意义。2.1压缩感知基本原理2.1.1压缩感知过程N×1N设一维离散信号xR∈,假设R空间内的任意一信号都可以由空间内的一组规范正交基ψ=[,ϕϕ,...,ϕ]的线性组合表示,则x就可以用这些基的线性组合来表示:12NNx=∑ϕαii=ψα(2.1)i=1α=xϕT上式是信号x在ψ域的等价表示或者说线性分解,投影系数i,i,α=ψx为投影系数向量,ψ=[,ϕϕ,...,ϕ]为正交基矩阵,α和x是N×1的列向量,ψ是N×N的矩12N阵。3 南京邮电大学硕士研究生学位论文第二章压缩感知简述压缩感知理论认为,只要信号在变换域内的非零系数(或远大于零的系数)的个数K<的ii支撑域的势小于等于K(K≪N),则信号x是K-稀疏的[3]。前面已经明确了应用压缩感知理论的前提条件是找到一个使得信号稀疏化的稀疏基。文献[17]指出有界变差函数的TV变换、平滑信号的傅氏变换、小波变换、震荡信号的Gabor变换以及含有不连续边缘的图像的Curvelet变换都是较好的稀疏化方式,对应的变换矩阵可以作为稀疏基使用,因此这些信号都可以利用压缩感知理论来恢复出来。利用冗余字典将信号进行稀疏分解是最近几年发展起来的新方法,文献[18-20]中对字典进行了研究。冗余字典是一个超完备的冗余原子库,这个库非常巨大,需要较大的存储代价和开销。字典中所有这些原子最大限度的包含了与被逼近信号的结构相似的所有可能情况,然后必须从字典中挑选出某些原子的组合来描述原信号。如果这些原子是最优的,能够得到信号的最稀疏表现形式,此时称作信号的稀疏逼近或高度非线性逼近[19-20]。文献[12]将可分离Gabor函数做为语音的原子库,这个方法所得的原子数量很大,因此复杂度高。最近几年,冗余字典的构造是一大研究热点,其基本方法是采用不断训练和学习的方法。例如文献[22]提出的K-SVD算法,该算法是自适应的更新字典,然后不停寻找减小与目标信号的平方误差的原子组合。此算法稀疏效果非常好,但是训练的方法往往需要庞大的训练样本去更新字典,对计算量和存储空间的要求高。人们对寻找信号的稀疏分解方式做了很多的研究[24-26],但是无论是优化现有的正交基还是通过学习、训练的方构造冗余字典,信号的稀疏化这一块还有很多棘手的问题有待解决,例如目前的算法都存在不实用的弊端。7 南京邮电大学硕士研究生学位论文第二章压缩感知简述2.2.2观测(或测量)矩阵如果一个信号能够进行稀疏化,是否就可以随便找到一个M×N的矩阵将信号进行投影,然后通过投影序列就能重建出原始信号呢?根据图2.1描述的投影观测过程知道:一个N维信号经过观测后得到M维数的列向量,由于M<0,使得感知矩阵∆满足下式:Θα21−≤ε≤+1ε(2.8)α2然而判断给定的随机投影矩阵是否满足上述RIP性质是一个组合复杂度的问题,能否找到一种新的替代方法,进一步降低问题的复杂度,是构造观测矩阵的重点问题。因此相干性的概念被提出,相干的定义如下式:µ(Φ,ψ)=n⋅maxϕφk,j(2.9)1≤kjn,≤µ的取值范围满足:µ(Φ,ψ)∈⎡1,n⎤(2.10)⎣⎦µ的含义是表示两个矩阵任意两个向量之间最大的相关程度,如果Φ与ψ包含了相关的元素,则相干性大,否则便小。由于随机高斯矩阵基本和任何一个矩阵都是非相干的,因此我们可以选择随机高斯矩阵作为投影矩阵,矩阵中的每个值服从正太分布,它经常作为观测矩阵使用。其他能满足RIP性质的矩阵包括随机±1的贝努力矩阵,局部傅里叶矩阵等。有学者提出了非常稀疏投影的概念[5],另外Donoho等人提出了一种结构化随机矩阵[6]。文献[30]提出了一种用混沌序列来构造观测矩阵的方法,并且证明了构造的观测矩阵能够满足RIP准则。总之观测矩阵的选取必须得满足一个条件:就是要能保证得到的M个观测值中包含足够的能够重构出原始信号的稀疏系数α的信息,然后我们才能够进一步用稀疏系数恢复出x。8 南京邮电大学硕士研究生学位论文第二章压缩感知简述寻找好的观测矩阵一直是人们的目标,近年来不仅仅从寻找“新种类”的观测矩阵作为突破口,而且出现了许多对现有观测矩阵优化的研究。例如观测矩阵不再是每次都不变动的,而是根据一些策略和方法来对矩阵进行改进,最后得到一个性能优秀的观测矩阵。另外可以根据随时根据被观测信号的不同时期的特征参数自适应的调整观测矩阵的规模和种类,因此是否能设计出自适应的观测矩阵也是提高观测质量的一个研究方向。2.2.3信号的重构压缩感知理论中的信号重构的数学模型如(2-4),因此信号重构的过程就是求解这个数学模型的解的过程。由于方程个数M是远小于原始信号的长度N,导致方程(2-4)是一个欠定方程组,一般情况下具有不确定解,因此很难寻找到正确的那一个解。压缩感知论证了当信号满足稀疏性时,这个问题可以进行无失真的求解,前提条件是观测矩阵必须满足的RIP准则[5],这为从少量的M个观测值中重建出原信号提供了理论支撑[33]。假设向量α={ααα1,2,3,...,αN}的p-范数为:1/pN⎛p⎞αp=⎜∑αi⎟(2.11)⎝i=1⎠p=0时得到的是l范数,表示α中非零元素的个数,此时我们的目标就是找到一个使0得信号最稀疏的解。l范数的求解模型如下:0minαst.y=Φ=Φxψα(2.12)0上式计算量大的几乎很难进行求解,因此是一个NP问题但是可以用工程中的贪婪算法进行近似求解,每一步通过寻找到非零元素的位置,逐渐逼近最系数解。常用的方法有匹配追踪(MP,MatchingPursuit)[32]、基追踪(BP,BasisPursuit)[33]、正交匹配追踪(OMP,OrthogonalMatchingPursuit)[34]等等,这些算法都有各自的优缺点。[35]ψ文献指出在满足观测矩阵Φ和变换基不相关的前提情况下,l范数问题可以代替1求解l范数问题,相当于对非凸优化问题进行凸化,此时更加容易求解,因为对于凸问题,0我们可以从一个局部解去寻找到局部最优解,而这个局部最优解就是凸问题的全局最优解。l范数的求解模型如下:1minαst.y=Φ=Φxψα(2.13)1(2.14)可以看成(2.13)的凸化,可以通过线性规划的方法来求解[36]。9 南京邮电大学硕士研究生学位论文第二章压缩感知简述Tmincz()st..Az=b(2.14)上式中,A=Φ(ψ,−Φψ),b=y,c=(1;1),z⇔(uv,)对(2.14)进行转化,可以得到有噪环境下的求解模型:22minxst..y−Φψα≤ε(2.15)12N在变换域上是K阶稀疏的信号xR∈,通过M×N维观测矩阵Φ得到的观测序列个数m满足式(2.16),则有非常高的概率求解出(2.13)正确的解[27]。2m≥C⋅µ(,)Φψ⋅K⋅logN(2.16)从上式可以看出相干性决定了信号压缩的最大程度,如果观测矩阵与稀疏基元素之间的最大相关性越小,则精确重构需要的观测数就越少。从另外一个角度考虑就是想要保证信号重建效果的的情况下,要想进一步原始信号的长度,应该尽量减小这两个矩阵之间的相关性。作为压缩感知研究的重点核心,重建算法也是目前研究最多的,在这一领域确实出现了许多新颖的算法,目前的主要的重建算法有三大类:第一类是针对l的贪婪算法,第二0类是针对l的凸优化算法,最后一类是基于上述两种方法的组合算法。1匹配追踪类算法(MatchingPursuit,MP)是贪婪算法的典型算法,它基于这样的思想:每次迭代过程中,从原子库中选取与残余量最接近的原子作为支撑原子,经过多次迭代之后,信号就可以用这些支撑原子集合线性表示。实际情况是信号在选定原子集合上的投影并不是正交的,导致可能没有选择到最优的原子或再次选到者重复的原子,因此一般需要较大的迭代次数。针对MP算法的缺陷,专家学者陆续提出了许多的改进算法,包括OMP(OrthogonalMatchingPursuit),ROMP(RegularizedOrthogonalMatchingPursuit),StOMP(Stage-wiseOMP),另外还有树形匹配追踪(TMP,TreeMatchingPursuit)[39]算法等。压缩采样匹配追踪(CoSaMP,CompressedSamplingMatchingPursuit)[40]算法是利用回溯思想集合OMP重建算法的结果,这个算法与OMP算法相比较而言,具有更强的理论论证,而且在采样过程中具有很强的抗噪性能。类似的算法还有子空间追踪(SP,SubspacePursuit)[41]算法,子空间追踪具有算法重构效果好,计算复杂度低的特点。以上算法稀疏度必须是已知的,但实际情况是稀疏度K往往是未知的,由此出现了稀疏度自适应的匹配追踪算法(SAMP,SparsityAdaptiveMatchingPursuit),此类算法初始固10 南京邮电大学硕士研究生学位论文第二章压缩感知简述定一个稀疏度,通过一个自适应的过程不停的调整稀疏度,算法重构效果理想并且速度快于OMP。凸松弛法算法的思想是将非凸优化问题转换成求凸的优化问题,然后通过求解凸优化问题的全局最优解(与局部最优解同解),因此可以从某一个初始点出发逐步找到最优解。这类算法有BP(BasisPursuit),内点法(Inter-PointMethod,IP)[44]、梯度投影法(GP,GradientProjections)[42]、迭代阈值法(Iterativehardthreshold,IHT)[43]等等。组合算法的主要代表链式追踪(CP,ChainingPursuit)算法[45],此算法只有在信号的系数度非常大的时候才有较好的效果,但是当信号稀疏度减小时,则需要较多的观测点数目才能准确重建[58]。虽然目前的重建算法较多,但是需要研究的问题依然很多,一些算法缺乏理论的支撑,收敛性不能保证等,同时鲁棒性差,对含有噪声的信号重构效果较差也是现有算法的缺陷。重建算法的研究非常重要,需要我们在研究领域进一步探索和挖掘。表2.1列出了一些重建算法的性能参数[47]表2.1几种重构算法性能比较算法序列数目复杂度最小化l范数K+1NP-Hard问题0最小化l范数Klog(1+NK/)N312正交匹配追踪2logKN32NK(OMP)分段正交匹配追踪KlogNNlogN22(StOMP)其中,N代表原始信号的维度,K代表信号的稀疏度。2.3压缩感知的应用领域随着生活质量的飞速提高,人们对信息量需求的与日剧增,尤其是大数据的处理方面,传统的方法所花费的传输成本和存储代价太大,随着压缩感知理论的逐步发展与研究,也势必要求人们尝试将压缩感知理论运用到实际生活中去。目前,有研究人员提出了模拟-信息采样理论(Analog-to-information),信息压缩采样一步完成,目前初步设计出了AIC的电路架构图。在图像压缩压缩领域,美国的RICE大11 南京邮电大学硕士研究生学位论文第二章压缩感知简述学已经研制出一种单像素CS相机[48],这种相机不像传统数码相机,在拍照时不需要采集大量的数据,利用数字微镜阵列完成光学的数字投影,突破了在物理器件上的限制。另外,压缩感知技术也被广泛的用于医学成像、军事雷达信号处理领域。很多国内的研究工作者积极的将压缩感知技术应用到相关领域,如压缩感知技术在无线传感器网络中的应用[49],压缩感知在雷达成像上的一些简单应用[50],于此同时也有部分关于语音信号处理领域的应用研究成果,包括基于压缩感知的语音识别和一些去噪等。根据UUP准则和RIP准则,得知所有的测量值对重建原始信号的重要性是一样的,使得压缩感知在通信领域显得很有价值,同时随着压缩感知理论的成熟,它的潜在应用价值也会被开发出来,例如生物领域的基因科学,可以从少量的基因观测样本推断大量的未知信息;快速的挖掘数据,特别是对大数据的挖掘显得很有效。语音是人类生活中最常见的一类信号,我们有必要研究压缩感知在语音信号处理中的应用,这对人生生活的意义很大,也是本文的研究重点内容。2.4本章小结本章首先对压缩感知基础理论知识进行了阐述,运用一些较为简单的数学公式进行了说明和解释。并且从传统信号处理领域中的Nyquist采样定理出发,分析了Nyquist采样的缺陷——那就是在采样过程中浪费了大量的资源,做了“无用功”。因此针对这种缺陷,压缩感知理论应运而生,本章还将压缩感知理论与传统的信号采样(奈奎斯特采样)过程进行了对比,并且分析了压缩感知的理论的优势——压缩与采样集于一步完成,方便快捷。从阐述中可以清楚的看到压缩感知过程的包括三大步骤,三个步骤缺一不可。主要是三块内容:信号的稀疏分解、观测矩阵的构造、信号的重构算法。最后简单的介绍了压缩感知理论的应用场景以及国内外目前研究的现状,同事将展望了压缩感知的应用前景。12 南京邮电大学硕士研究生学位论文第三章一种改进的正则化牛顿算法研究第三章一种改进的正则化牛顿算法研究压缩感知重构算法可分为三类:首先是以OMP算法为代表的匹配追踪类算法,其次是以BP算法为代表的凸优化算法,最后一类是以最速下降法为代表的方向追踪算法。这三种方法都有各自的优缺点,BP算法重构精度高,但是计算复杂,计算量大;OMP算法计算简单,重构效果和计算量居中,是较为中庸的算法;方向追踪类算法具有较好的重构效果和较快的收敛速度,因此有必要研究对方向追踪类算法进行进一步研究。无约束优化方法是优化技术中极为重要的基本内容之一,它不仅可以直接用来求解无约束优化问题,而且很多约束优化问题也常将其转化为无约束优化问题,然后用无约束优化方法来求解。最速下降法和牛顿法[51]是求解无约束最优化问题的两种经典方法,在最优化理论中占有重要的地位。其中最速下降法的优点是计算量小,存储变量较少,对初始点要求不严格;缺点是收敛速度较慢导致求解速度很慢。牛顿法的优点是收敛速度快,缺点是对初始点要求严格,方向构造困难,内存占用较大。这两种方法理论已经广泛应用到了在生活中的方方面面,特别是在经济、军事、管理、生产过程自动化、工程设计和产品优化设计等方面,因此对最速下降法和牛顿思想方法及其在压缩感知这种新的理论中的应用结合研究具有很重要的意义。3.1衡量算法性能的一些标准衡量算法性能的指标有重构时间,收敛速度,信噪比和重构概率定义信噪比:原始信号与噪声干扰的比值。信噪比是衡量信号质量的一个重要指标,其计算公式:2x2snr=20log2(3.1)x−xr2其中x为原始信号,xr为重构信号。重构概率是衡量重构算法性能稳定的一个重要指标,其定义:重构信号的信噪比大于等于某个阈值(一般取经验值)的次数与实验总次数的比值,数学计算公式描述如下:∑fsnr(−λ)p=(3.2)N13 南京邮电大学硕士研究生学位论文第三章一种改进的正则化牛顿算法研究⎧1,x≥0其中fx()=⎨,N为实验总次数,λ为准确重构的信噪比阈值。⎩0,其它数列收敛的定义[52]:令{}a为一个数列,且A为一个固定的实数,如果对于任意给出n的b>0,存在一个正整数N,使得对于任意n>N,有a−A,j=1,2,...,}N(3.3)jjj然后用最小二乘法来完成信号的逼近以及余量的更新:∧x=argminy−Φx(3.4)Γnnr=y−Φx(3.5)Γ匹配追踪的思想是每一步在原字库中寻找与信号最匹配的原子进行稀疏逼近,然后通过上一次的稀疏解求得余量后继续选择与余量最为匹配的原子。但是由于信号在原子上的各投影分量之间的非正交性导致选择的原子可能是次优的,因此必须通过较多的迭代次数才能达到较理想的效果。OMP算法克服了以上缺点,在每次的迭代中将已经选择的原子集合进行正交化,保证每次选择到最优的原子。总之匹配类追踪算法对低维小尺度信号运算较快,重构效果较为理想的算法。3.2.1OMP算法正交匹配追踪(OrthogonalMatchingPursuit,OMP)[36]算法是对MP算法的一种改进,OMP算法克服了MP算法的缺陷。OMP算法中原子选择的准则与MP算法一样,但是OMP14 南京邮电大学硕士研究生学位论文第三章一种改进的正则化牛顿算法研究算法与MP算法稍微有点区别的是在每次迭代过程中,都将所选的全部原子正交化,保证每次选择不到重复的原子,保证了原子的最优性,从而大大减少了迭代的次数。其算法思想简单,计算复杂度和重构精度都比较好,OMP算法的步骤如下:输入:观测矩阵Φ,观测值y,稀疏度k;输出:信号的近似解xˆ,重构误差r;0初始化:迭代次数n=0,余量r=y,支撑索引集合Γ=∅;0步骤1:用式(3.3)计算余量r与观测矩阵Φ的内积g,g中最大元素对应的索引k作为支撑索引,公式为k=argmaxg,j=1,2,...N。jnn−1步骤2:更新支撑原子集合Φ=Φ∪{}φ以及支撑索引集Γ=Γ∪{}k;ΓΓ−1k步骤3:利用(3.4)求解得到近似解xˆ,并利用式(3.5)更新残余量。步骤4:是否满足终止条件,如果不满足,则转到步骤2;否则停止迭代,输出输出为xˆ,q=MN/。3.2.2ROMP算法ROMP算法是在OMP算法基础上进行了改进,首先在每次选择中根据相关原则进行原子的一次筛选,将得到K个原子存入候选集中以便进行进一步的二次筛选。二次筛选过程采用一个正则化的过程:g≤2gi,j∈J(3.6)ij其中J={1,2,...}N,然后选择能量最大的一组相关系数对应原子索引进行储存,这个过程可以看到ROMP每次不是选择一个原子,而是一组原子,因此ROMP最多只需要K次迭代就能得到一个Γ>2k的支撑集合,大大加快了收敛速度,具有较少的重构时间,而且这种两次筛选原子的思想也保证了原子选择的准确性,ROMP算法的步骤如下:输入:观测矩阵Φ,观测向量y,稀疏度k;输出:近似解xˆ,重构误差r;初始化:迭代次数n=0,残余量r=y,候选集索引集合I=∅,支撑索引集Γ=∅;0步骤1:利用式(3.3)求解残余量r与观测矩阵Φ中的每一个原子的内积g,找出其中K个15 南京邮电大学硕士研究生学位论文第三章一种改进的正则化牛顿算法研究最大相关系数对应的索引,存入候选集I步骤2:根据式(3.6)的原则将候选集I原子进行正则化筛选,并将结果存入I中。0nn−1步骤3:更新支撑原子集合Φ以及支撑索引集和Γ=Γ∪I;Γ0步骤4:利用(3.4)得到近似解xˆ,并利用式(3.5)更新残余量。步骤5:若Γ>2k,则停止迭代,输出xˆ,q=MN/;否则,n=+n1,转到步骤2;3.3正则化牛顿算法3.3.1方向寻优类算法原理最速下降法是是方向搜索类算法中最基础的算法,考虑无约束最优化问题xAx'minfx()=+bx,假设fx()是连续可导的,记fx()在点xk处的梯度为gk=∇fx()k,2函数的Taylor展开式为:'2fx()=fx()+g(x−x)+ox((−x))(3.7)kkkk记ad=−xx,其中d为列向量,a为一个常数,称为迭代步长,因此要是fx()下kkkkk'降方向必须满足gd.<0,当且仅当d=−g函数下降最快,因此将这种沿负梯度方向寻kkkk找函数迭代点使得目标函数下降最快的方法称为最速下降法(SteepestDescentstep-size)[51]。最速下降法的迭代公式为:x=x−ag(3.8)k+1kkk该次迭代步长由下式确定:a=argminfx(−ag)(3.9)kkka>0''ggkk对上式求a的导数,令g∇fx(−ag)=0,求解得到a=。从以上过程可以看到最速kkkk'gAgkk下降法当前迭代点的梯度与下一次迭代点的梯度相互垂直,导致最速下降法的搜索方法呈锯齿状,如图所示。16 南京邮电大学硕士研究生学位论文第三章一种改进的正则化牛顿算法研究图3.1最速下降法搜索路径一般情况最速下降法在远离极值点时函数值下降得很快,但是当迭代点逐渐向极小点靠近的过程中走的是曲折路线,易产生锯齿现象,导致每次迭代行进的距离变得越来越小,收敛速度不快。如果目标函数有连续二阶偏导数,牛顿法可以快速收敛到问题的极小点,因此牛顿法是一种收敛速度快于最速下降法的寻优算法,其收敛速度快且重建效果也较好,牛顿算法中采用类似于MP、OMP的原子选择原则,每次也是选择一个原子,但其收敛速度要低于OMP。受到ROMP中正则化思想的启发,将正则化思想引入牛顿法,则可以大大加快算法的收敛速度,并且相对较好的重建精度,其迭代公式[51]:−1x=x−H()x∇fx()(3.10)k+1kkk其中H为二阶偏导数矩阵,∇fx()梯度向量。牛顿法用到了二阶泰勒展开式,当k*xx−<1时收敛很快,否则不能保证收敛。为了解决初始点与最优解可能相差较远的问题,可采用修正的牛顿法,取迭代公式:−1x=x−aH()x∇fx()(3.11)k+1kkkk牛顿法可以利用OMP的思想,致力于每次迭代残差最小,第k次迭代误差函数2y−Φx可以等价为[53]:I21'minxGx−bx(3.12)2TT其中G=ΦΦ,b=Φy,对(3.12)式求一阶导数和二阶导数:III17 南京邮电大学硕士研究生学位论文第三章一种改进的正则化牛顿算法研究∇fx()=Gx−bkkTT=ΦΦx−ΦyIIkIT=Φ(Φx−y)IIkT=−ΦrIkTH=G=ΦΦII3.3.2改进的正则化过程[54]文献[37]中提出的ROMP算法对所有满足约束等距条件(RestrictedIsometricProperty,RIP)的矩阵和稀疏信号都可以精确重建,且具有较快的重建速度。对于稀疏度为K的信号,ROMP算法首先计算残余量r与观测矩阵Φ中各个原子(列向量)之间内积的绝对值(相关系数),然后将其中最大的K个值对应的原子挑选出来放入候选索引集合I中,然后再对候选集索引对应的的原子进行正则化处理,然后选择能量最大的一组相关系数对应的原子作为支撑原子。对于没有被选入作为支撑集的原子分组,由于正则化过程使得他们的能量远小于被选入原子分组的能量,保证了被选入原子的正确性,是一种有效的原子筛选策略。经试验发现存在被选入的原子分组不一定是最优的原子甚至是错误的原子的可能性,即使这种几率极低。例如某次内积结果如下:g=(10、7.5、4.8、4.6、4.4、4.2、4.1、3.8、3.5、3、2.5、2.4、1.2、1、0.5),根据(3-6)正则化分组原则得到如下分组:第一组:(10、7.5)第二组:(4.8、4.7、4.4、4.2、4.1、3.8、3、3、2.5、2.4)第三组:(1.2、1)第四组:(0.5)由于(10、7.5)的能量明显小于(4.8、4.7、4.4、4.2、4.1、3.8、3、2.5、2.4)的能量,导致后面一组被选中,但是实际情况是应该第一组是正确的原子(因为内积最大,与原始信号结构最相似)。为了解决这个问题,在此处提出一种筛选策略:E>λE(3.13)ii+1式中E表示第i组的平均能量,一般λ=2。选择满足上式的第i组原子,这样就保证i了无论该组总能量是否相对较小,总能能选到正确的原子组,因为正确原子组的平均能量值总是远远大于其他组的。18 南京邮电大学硕士研究生学位论文第三章一种改进的正则化牛顿算法研究3.3.3正则化牛顿算法[54]受到ROMP算法中正则化思想的启发,我们将正则化思想引入牛顿算法中,提出了一种正则化牛顿法(RegularizedNewtonAlgorithms,RN),它进一步减少了算法的重构时间,加快了算法的收敛速度,并且保证了算法的重构精度,RNT算法如下:输入:观测矩阵Φ,观测向量y,稀疏度k∧输出:稀疏解x,余量r,迭代次数iter初始化:r=y,候选索引集I=∅,支撑索引集合Γ=∅,迭代次数iter=0;0−6步骤1:若I<2k且normr()≤ε(ε可取10),iteriter=+1,转步骤2;否则停止迭代,并输出x;'步骤2:计算相关系数g=Φr,将g中K个绝对值最大的值对应的候选集索引存入I中;I步骤3:用(3.6)描述的原则对I中索引值对应的原子进行正则化处理,并将相应结果存入支撑索引集合I中,I中原子必须满足式(3.13)的要求;00步骤4:Γ=Γ∪I,更新支撑集Φ;0Γ步骤5:利用(3.10)式对x进行更新,其中H=Φ'Φ,∇fx()=−Φ'r;IIkI步骤6:更新迭代余量r=−ΦrHfx∇(),转步骤(2);Ik3.3.4实验仿真与分析由实验经验得:当SNR≥60时,重构信号与原信号包络在视觉上没有差异,认定算法实现了精确重构。事实上,若信号重构失败,SNR不超过10;而若信号能够实现精确重构,SNR都在300dB左右徘徊,所以将门限设置在60是合理的。构造一个N=500,K=50的一维稀疏信号。观测矩阵采用高斯随机矩阵,分别采用牛顿法、正则化牛顿法、OMP、ROMP对其进行重构。每次实验均取运行500次的平均值。19 南京邮电大学硕士研究生学位论文第三章一种改进的正则化牛顿算法研究图3.1压缩比与重构概率的关系从图3.1可以看出,随着压缩比的增大,重构概率呈指数增长趋势。其中牛顿法的重构性能最好,正则化牛顿法保持了牛顿法高重构率的优点,重构概率大于OMP算法和ROMP算法。图3.2不同算法迭代次数与残差的关系图3.2是残差r跟迭代次数的关系。可以看出,随着迭代次数不断增加,残差r呈指数减小趋势。正则化牛顿法和ROMP算法比牛顿法和OMP的残差衰减速度明显变快。在满20 南京邮电大学硕士研究生学位论文第三章一种改进的正则化牛顿算法研究足相同的迭代终止条件,正则化牛顿法和ROMP算法的迭代次数远远小于牛顿法和OMP方法。图3.3不同算法稀疏度K与重构概率的关系从图3.3可以看出,随着稀疏度增加,重构概率在不断下降。正则化牛顿法在不同稀疏度下的重概率高于OMP和ROMP,低于牛顿法。并且当K>50后,ROMP算法基本失效(重构概率几乎为0),但是正则化牛顿直到K>80后才彻底失效,可见正则化牛顿法对于稀疏度的要求放宽。21 南京邮电大学硕士研究生学位论文第三章一种改进的正则化牛顿算法研究图3.4稀疏度与重构时间的关系从图3.4中可以很明显看出,在相同稀疏度下正则化牛顿法的重构时间要小于其他三种算法,并且随着稀疏度K的增加,其重构时间增加很缓慢,不同的稀疏度都具有较快的重构速度,而ROMP的重构时间在K>50后迅速上升是因为ROMP算法在稀疏度较大的情况下选择原子的正确性大大降低,因此每次重构需要经历过很大的迭代次数,才能达到终止条件。3.3本章小结本文首先分别介绍了最速下降法和牛顿算法,在牛顿法和ROMP的基础上提出了正则化牛顿法,结合了牛顿法较好的重构性能以及ROMP收敛较快的特点,并对传统正则化过程进行了改进,引出了一个分组平均能量的概念,通过分组平均能量和分组的总能量两个方面共同决定原子分组,从而进一步提高了原子选择的正确性。实验证明,改进的正则化牛顿法在保证重构精度较高的基础上,重构时间得到了很大改善,可见具有较强的实用性。牛顿法涉及求矩阵的逆,计算量很大,如果我们将最优化中的拟牛顿法结合正则化思想,可以进一步提高算法的重构时间,在以后工作中值得尝试。同时鉴于牛顿法对初始值的依赖性很强,可以考虑在迭代初期用最速下降法,到了接近目标点用牛顿法,这种结合既可以降低计算复杂度又可以有较好的收敛速度,取了两者的长处,值得进一步研究。22 南京邮电大学硕士研究生学位论文第四章基于语音特征的自适应压缩感知第四章基于语音特征的自适应压缩感知4.1语音信号的特征语音信号是一个时变、非平稳的随机过程[55]。但由于人的发音器官的肌肉运动速度较慢,在10~30ms可近似看作是短时平稳的。在语音信号分析与处理中,必须先对语音分帧。语音信号的主要成分是浊音,清音部分仅仅占有很少的比例,实验中采用的一段语音,浊音信号能量占了该段语音的93%左右,同时浊音与浊音段之间存在少量的无声段,因此浊音是语音信号处理的关键部分。语音信号典型的时域参数包括短时能量,短时平均过零率,短时平均幅度差和短时自相关系数,下面就这四个参数进行简单介绍。(1)短时能量假设第k帧语音的短时能量用E表示,则其计算公式如下:knN+−12Ek=∑xik()(4.1)in=可以根据利用短时能量的大小区分清音和浊音,因为浊音的能量要比清音的能量大得多;其次可以利用短时能量对语音信号的有声和无声段进行分界,对声韵母及对连字分界等等。(2)短时平均过零率短时平均过零率是指每帧内信号通过零值的次数,在一定程度上反应出了信号跳变的快慢(频率)信息,假设第k帧语音的过零率用Z表示,其计算公式如下:knN+−11Zk=∑sgnxi[()]k−sgnxi[(k−1)](4.2)2in=浊音是依赖声带振动发声,它在经过声道时产生共振,它的能量分布主要是集中在3kHz频率范围内;反之,清音不是靠声带振动产生出来的,而是声道某写部位受到阻塞而产生类似白噪声的激励,此激励经过声道后这个特殊“信道”的传输后频率发生了变化——能量集中相对于浊音更高的频率范围,研究表明浊音的的能量主要分布在在中低频,清音的能量分布在高频段。过零率恰好是描述信号通过零点变化快慢的参数,反映了频率的高低,因此可以用短时平均过零率区分清音和浊音。23 南京邮电大学硕士研究生学位论文第四章基于语音特征的自适应压缩感知(3)零能比短时过零率和短时能量结合起来判断语音起始点的位置——端点检测。同时也可以更加进一步准确判断清音与浊音段。定义零能比为过零率与短时能量的比值,计算公式如下:ZkZER=(4.3)kEk(4)短时自相关函数相关函数用于描述两个信号在时域内的相似程度,分为互相关函数与自相关函数。互相关函数主要研究两个不同信号之间的相关程度,自相关函数用于研究信号本身的周期性,同步性等特征,短时自相关函数的计算公式表述如下:N−1Rnk()=∑xixik()k(+n)(4.4)i=0假设某段语音信号是周期性的浊音信号,那么它的自相关函数也呈现出明显的周期性,并且与原语音的周期一样。4.2语音信号的初步压缩感知本节首先压缩感知方法直接运用到语音压缩中,验证压缩感知方法在语音压缩中的可行性,然后将这个方法与传统的DCT语音压缩方法进行比较,分析两种方法的优劣势,指出基于压缩感知的语音压缩的天然抗噪性能。4.2.1语音信号的可压缩性试验一选取一段语音信号,采样频率16kHz,一帧为20ms(320个采样点值),截取该段语音的一帧浊音和一帧清音,得到其时域波形图:24 南京邮电大学硕士研究生学位论文第四章基于语音特征的自适应压缩感知10-10501001502002503003500.050-0.0505010015020025030035010-100.511.522.534x10图4.1清浊音的区别从图中发现清音具有周期性,能量幅度较大,而浊音是类似随机信号,过零率较大(波动快,单位时间内通过零点的次数多)并且能量幅度较小。然后对浊音帧进行DCT变换,得到下图:DCT210-1-20501001502002503003501.510.50050100150200250300350图4.2浊音的DCT变换图4.2表明浊音呈现出明显的周期性,并且在DCT域的大多数系数值很小,只有个别25 南京邮电大学硕士研究生学位论文第四章基于语音特征的自适应压缩感知较大的系数,系数序列按指数衰减。这表明语音信号在DCT域看可以看着近似稀疏的,并且可压缩,因此语音信号可以选用余弦矩阵作为稀疏基。4.2.2两种语音压缩方法的比较实验二将上小节中的浊音帧语音进行传统的DCT压缩与基于压缩感知的压缩,然后进行相应的重构,对比重构出的语音帧包络,两种方法的参数设置如下:(1)DCT取前50个最大的系数,储存传输50个系数大小和位置需要点数100个数据,用逆DCT变换进行重构;(2)压缩感知观测点数取为100,估计稀疏度为12,储存传输需要100个数据,观测矩阵采用随即高斯矩阵,稀疏基为DCT矩阵,采用OMP算法进行重构;10-1050100150200250300OMP10-1050100150200250300DCT10-1050100150200250300图4.3OMP重构与DCT重构的比较从图中可以看到DCT与压缩感知在相同的压缩比(100/320)情况下,DCT压缩重构效果更好,这是因为DCT算法成熟,而压缩感知OMP重构算法效果很大程度上跟观测矩阵以及稀疏度的估计值有关。但是压缩感知的优势在于压缩端只要进行简单的乘法得到观测数据,集成采样与压缩于一步完成,在一些场合这个优点显得很重要;同时下一节可以看到基于压缩感知的语音压缩具有天然的抗噪性能,这一特点使得压缩感知在噪声环境下更具有优势。26 南京邮电大学硕士研究生学位论文第四章基于语音特征的自适应压缩感知4.2.3压缩感知的抗噪性信号稀疏是压缩感知的前提,而压缩感知去噪就是利用压缩感知与信号稀疏的这种关系,基于压缩感知的去噪观测模型:y=Φx=Φ(x+z)=y+y(4.5)allxz加噪信号在在稀疏基的变换:αψ=(xz+),代入到(4.4)得到:'y=Φx=Φψα'=∆α(4.6)all重构信号模型表述如下:'minαst.y=∆α(4.7)0求得α后,经过(5.2)逆变换求解x,上式或者转化为无约束最优化为题:2'α=argminy−∆α(4.8)2α从(4.5)式可以看到由于原始信号观测前混入了噪声,信号观测值y包含了观测噪声y,压缩感知能够去噪的有三个原因:z(1)高斯白噪声在大多数变换域并不是稀疏的,不满足压缩感知的稀疏性的前提(2)进行观测运算后,噪声由原来M维值降到N维值,噪声的大部分信息丢失了(3)噪声幅度很小,噪声信息往往淹没在原信号中,恢复出出来的噪声部分往往被人耳朵忽略总之,噪声的大部分信息在经过压缩感知的过程后滤除掉了,因此不可能从仅仅从少量观测值yz中重构出z,并且观测维数M越小,损失的噪声信息更大,去噪效果也就越好,但是原始语音信号也损失了一部分信息,重构精度也随之下降。压缩感知去噪流程框图如下:图4.4压缩感知去噪的流程图实验三采用一段稀疏较好的语音帧进了加噪,语音的稀疏度为4,观测维数为80,在27 南京邮电大学硕士研究生学位论文第四章基于语音特征的自适应压缩感知matlab中用awgn命令模拟高斯白噪声,设置信噪比大小为10,采用OMP算法进行重构,实验结果如下图:20-2050100150200250300350n20-2050100150200250300350n20-2050100150200250300350n图4.5压缩感知去噪结果上图是某一次的运行结果,从上图中可以看出,通过压缩感知的方法后,大多数噪声信息被去除。反复多次试验后发:现重构语音波形有时候较好,有时较坏(与原始语音波形包络差别较大)的现象,并且在多数情况下OMP算法重构出的信号具有一定的峰值失真——去噪不稳定。分析其原因:尽管噪声很小,但是噪声经过观测后还是保留一定的信息量,干扰了OMP寻找准确的原子,导致出现峰值失真现象。文献[56]提出了一种改进的压缩感知去噪方案:根据(4.5),不同的观测矩阵得到的观测序列值不同,重构出来的信号x也不同,信号失真情况也不一样,有些峰值处是凸的,有些是凹的,将这些重构重构出来不同失真情况的信号进行加权叠加,可以最大程度的减弱信号的峰值失真,该方法流程表述如下:cscs(1)计算传感矩阵∆,计算公式:∆=Φψ,其中Φ每次都不同的高斯随机矩阵,iiiii=1,2,...,p;cs(2)计算观测值yi=y+yz,计算公式:y+yz=∆i(x+z),i=1,2,...,p;28 南京邮电大学硕士研究生学位论文第四章基于语音特征的自适应压缩感知(3)通过观测值y,重构xiipoptopt1(4)计算优化的去噪信号x,计算公式:x=∑xipi=1采用相同的信号,并且设置同样的试验参数,同上述方法进行仿真的得到下图:20-2050100150200250300350n20-2050100150200250300350n20-2050100150200250300350n图4.6基于压缩感知的加权平均去噪结果从对比图4.5与4.6图中可以看到去噪效果有所改进,并且多次仿真实验发现此种方法重构概率较高。这说明改进后的方法确实很好的弥补了峰值失真和重构概率不高的的缺陷。但是大量试验表明上述压缩感知去噪方法只能对稀疏度较好的信号进行去噪,在语音信号稀疏度较差的时候压缩感知并不能很好的去噪,因此压缩感知去噪还值得进一步探讨。4.3基于语音特征的自适应语音压缩语音信号是一类常见的信号,并且具有自己的特征和自己的研究方法,将这些特征参数引入到压缩感知中,根据这些特征参数区别对待不同的语音帧达到“分而治之”的目的,可以帮助进一步提高压缩率。29 南京邮电大学硕士研究生学位论文第四章基于语音特征的自适应压缩感知4.3.1自适应语音压缩算法[57]语音根据声带是否振动可分为清音和浊音,清音浊音在包含信息的重要性是不一样的,浊音能量占到总能量的90%以上,较为重要;各帧语音在包含信息的重要性也是不一样的。因此我们针对各帧语音的类型及重要性上的不同进行自适应分配观测点数,较为重要的帧分配给较多的观测点数,反之,则分配较少的观测点数,以达到最优分配的目的。衡量语音的重要性的参数有能量、过零率、零能比。我们对录制的一段女声‘分子结构’语音进行16kHz采样,帧长N=320,进行语音参数的求解:(a)105000.511.522.534x10(b)500000.511.522.534x10x105(c)42000.511.522.534x10(d)10-100.511.522.534x10图4.7‘分子结构’语音段参数图可以看到语音段出了开始和末尾的无声段之外(进行端点检测),其大部分主要是浊音部分,清音所占部分很少。从图4.7(a)和(b)可以看出,浊音能量远远大于清音能量,并且浊音的过零率很小,因此我们可以根据能量和过零率判断一帧语音是清音或浊音。从短时能量可以看出,浊音帧之间的能量变化明显,因此浊音帧之间可以通过能量来区分其重要性[11].[12];从(c)可以看出清音帧之间零能比变化明显,因此清音帧之间可以通过零能比来区分其重要性。首先根据能量大小区分一帧语音的性质,并且根据清浊音总能量的大小分配不同的观测点数,无声段(能量几乎为0,并且不含任何语义)直接置0处理。然后根据一帧浊音在总的浊音能量的占有比例的分配观测点数,根据一帧清音在总的清音零能比占有比例来30 南京邮电大学硕士研究生学位论文第四章基于语音特征的自适应压缩感知分配该帧观测点数。由于浊音各帧的能量差距较大,可能对于点数的分配差距相差较大,为了达到各帧分配点数均衡,对各帧能量进行对数处理,使各帧能量对比差减小(对清音的零能比也采用同样的处理方法)。如果分配的观测点数超过320点时,继续增加M不会对提高信噪比有任何帮助,反而会导致压缩比的下降,所以观测点数封顶在320点;如果分配点数低于10(低于10点,重构效果太差),直接分配10点观测,也保证非重要帧重构质量。为了便于描述,定义零能比的倒数为能零比ezr,能零比大说明该清音帧相对重要。自适应的观测点数分配方案流程图见图4.8,描述过程如下:(1)能量小于T1的帧将其归为无声,不为其分配观测点数,只要存储传输零点的数目,在恢复端直接将对应位置置零(2)如果该帧非无声帧,根据短时零能比判断其为清音帧或浊音帧N2(3)设总的观测点数为M,第n帧能量为En=∑xmn(),并且分别计算清浊音帧的总m=1能量Ez和EqEz(4)分配给浊音的总观测点数为M1=M*,则清音的观测点数M2=M−M1EzEq+(5)计算所有清音帧的能零比EZR总和(所有帧零能比的倒数之和)E(6)若一帧浊音,其短时能量为E,则该帧分配观测点数为1*ffm=M。EzEZRf若一帧清音,该帧的能零比EZRf。则该帧分配的观测点m=M2*。EZR(7)最终每一帧的观测点数m=max(10,min(320,m)),每帧语音用OMP算法进行重构(8)将所有重构出来的语音帧连接起来得到重构语音段。31 南京邮电大学硕士研究生学位论文第四章基于语音特征的自适应压缩感知图4.8基于压缩感知的自适应语音压缩流程图4.3.2实验仿真与分析实验一采用一段长度为27200点,采样率为16KHz的女声,语义为“分子结构”,见图4.1。实验采用矩形窗分帧,帧间无重叠,每帧长为320点/帧,门限参数T1=0.001,2T2=150,这些参数是经过多次试验得到的经验取值。定义信号幅度均方误差:e=x−x,将以下三种方案进行比较:方案1:分帧后,对每帧直接用固定点数OMP重构方案2:先判断该帧是浊音或清音,浊音帧分配固定观测点数m1,清音帧分配固定观测点数m2,m2<

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭