基于语音增强方法的语音端点检测

基于语音增强方法的语音端点检测

ID:21878653

大小:53.50 KB

页数:6页

时间:2018-10-25

基于语音增强方法的语音端点检测_第1页
基于语音增强方法的语音端点检测_第2页
基于语音增强方法的语音端点检测_第3页
基于语音增强方法的语音端点检测_第4页
基于语音增强方法的语音端点检测_第5页
资源描述:

《基于语音增强方法的语音端点检测》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于语音增强方法的语音端点检测摘要:语音端点检测的检测结果好坏对后续的语音处理起着决定性的作用。为了解决语音端点在低信噪比情况下检测率不高的问题,该文提出了基于深度置信X络去噪的语音增强方法与传统的端点检测方法相结合的方法。该方法首先由大量的语音数据训练深度置信X络模型,使其能够很好地映射带噪与无噪语音之间的非线性关系,进而使其成为一个良好的降噪滤波器,再对比带噪与去噪后语音对端点检测准确率的影响,以及不同信噪比的端点检测的正确率。从该实验结果可以得到,该方法在平稳噪声和非平稳噪声的低信噪比情况下都可以提高语音端点检测的准确率。  关键词:语音

2、端点检测;深层置信X络;信噪比;语音处理  :TN911.23?34;TP391:A:1004?373X(2017)22?0001?04  Abstract:Thetestresultsofvoiceactivitydetection(VAD)playadecisiveroleinthesubsequentspeechprocessing.Toresolvetheproblemofloethodofbingspeechenhancementmethodbasedondeepbeliefethodisproposed.Thedeepbeliefo

3、delistrainedbylargevolumesofspeechdatatoeffectivelymapthenonlinearrelationshipbetadetobeeagoodnoisereductionfilter.Theeffectsofnoisyspeechanddenoisedspeechonendpointdetectionaccuracy,andthecorrectnessofendpointdetectionatdifferentSNRsarepared.Theexperimentalresultsshoethodca

4、nimprovetheaccuracyofVADinthecaseofbothstationarynoiseandnon?stationarynoiseannMachine,RMB)叠加构成。RBM是一种特殊的玻尔兹曼机,只有在显层(VisibleLayer)和隐层(HiddenLayer)之间有权重连接,显层和显层间以及隐层和隐层间都没有连接。DBN的训练可以分成两个阶段进行,分别为预训练和参数优化,其训练过程如图1所示。  1.1预训练阶段  采用逐层贪心算法,将整个DBN看成一个个RMB进行训练,前一个隐层的输出可以作为下一个显层的输入,

5、见图1(a)。由于初始化RBM模型时用带噪语音去训练,第一个显层的输入为实数,因此第一个显层和隐层为高斯?伯努利RBM,其余RBM为伯努利?伯努利RBM。如果显层节点用向量[v]表示,隐层节点用向量h表示,连接用矩阵显层服从高斯分布,隐层服从伯努利分布,即[v]∈R,h∈{0,1},由能量模型(Energy?BasedModel,EBM)理论[3]可得其能量函数定义:1.2参数优化阶段  运用后向传播算法[5](BackPropagation,BP)基于最小均方误差准则来更新整个DBN的X络参数,使得无噪语音的对数功率谱特征

6、和带噪语音的对数功率谱特征之间误差最小。采用随机梯度下降算法来加快DBN的学习收敛速度,其平均平方误差为:  通过不断地更新调整,DBN能够很好地拟合带噪和无噪语音数据之间的非线性映射。  2基于倒谱距离的端点检测方法  2.1倒谱距离测量法  谱密度函数[S(ω)]和[S′(ω)]的倒谱系数分别是式(21)中的[]和[c′n]。对于检测是否是语音帧还是噪声帧,必须需要一个判决参数,而均方距离就可以作为判别参数,因为两个语音信号谱的差别通常可以用对数谱的均方距离表示。  2.2倒谱距离测量法的检测

7、流程  (1)首先在语音数据集中取一抽样语音信号,并取其前几帧信号为背景噪声。那么背景噪声倒谱系数的估计值则能够用这些已经设定好的前几帧信号的倒谱系数的平均值来表示,定义其为向量C。  (2)计算每帧信号的倒谱系数与噪声倒谱系数估计值的倒谱距离,可以对式(21)进行化简处理,近似可表示为:  (3)通过式(22)能够计算得到各信号帧倒谱距离的倒谱距离轨迹,然后通过门限判决的方法来确定抽样语音的语音帧和噪声帧。  (4)由于噪声的种类是多种多样并且不断变化,因此要得到较准确的检测,向量C必须与其变化相适应,本文所采用的自适应处理过程能够解决这个问

8、题,即将前一信号帧的倒谱向量作为向量C,并按照  3实验过程与结果分析  为了检验该文方法的效果,本实验仿真平台采用Matlab软件,实验采用的是微软

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。