语音识别中基于低秩约束的本征音子说话人自适应方法.pdf

语音识别中基于低秩约束的本征音子说话人自适应方法.pdf

ID:55746013

大小:469.80 KB

页数:7页

时间:2020-06-06

语音识别中基于低秩约束的本征音子说话人自适应方法.pdf_第1页
语音识别中基于低秩约束的本征音子说话人自适应方法.pdf_第2页
语音识别中基于低秩约束的本征音子说话人自适应方法.pdf_第3页
语音识别中基于低秩约束的本征音子说话人自适应方法.pdf_第4页
语音识别中基于低秩约束的本征音子说话人自适应方法.pdf_第5页
资源描述:

《语音识别中基于低秩约束的本征音子说话人自适应方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第36卷第4期电子与信息学报Vol_36NO.42014年4月JournalofElectronics&InformationTechnologyApr.2014语音识别中基于低秩约束的本征音子说话人自适应方法张文林张连海陈琦李弼程(解放军信息工程大学信息系统工程学院郑州450002)摘要:该文提出一种基于低秩约束的本征音子(Eigenphone)说话人自适应方法。原始的本征音子说话人自适应方法在自适应语料充分时具有很好的效果,然而当自适应语料不足时,出现严重的过拟合现象,导致自适应后的系统可能比自适应前的系统还要差。首先,

2、对协方差矩阵为对角阵的隐马尔可夫.高斯混合模型语音识别系统,推导出一种简化的本征音子矩阵估计算法;然后,对本征音子矩阵引入低秩约束,采用矩阵的核范数作为矩阵秩的凸近似,通过调节核范数的权重因子以有效控制自适应模型的复杂度;最后,给出一种加速近点梯度算法以求解新算法中引入的带有核范数正则项的数学优化问题。汉语连续语音识别的说话人白适应实验表明,引入低秩约束后,本征音子说话人自适应方法的自适应效果得到了明显提高,在5~50S的自适应数据条件下,均取得了比最大似然线性回归后接最大后验(MLLR+MAP)自适应更佳的识别效果。关键词

3、:语音识别;说话人自适应;本征音子;低秩约束;近点梯度法中圈分类号:TN912.3文献标识码:A文章编号:1009—5s96(2o14)o4—0981—07DOI:10.3724/SP.J.1146.2013.00848Low—rankConstraintEigenphoneSpeakerAdaptationMethodforSpeechRecognitionZhangWen-linZhangLian—haiChenQiLiBi—cheng(InstituteofInformationSystemEngineering,PI

4、nformationEngineeringUniversity,Zhengzhou450002,China)Abstract:Alow—rankconstrainteigenphonespeakeradaptationmethodisproposed.Originaleigenphonespeakeradaptationmethodperformswellwhentheamountofadaptationdataissuficient.However,itsuffersfromserveroverfittingwhenins

5、uficientamountofadaptationdataisprovided,possiblyresultinginlowerperformancethanthatoftheunadaptedsystem.Firstly,asimplifiedestimationalogrithmoftheeigenphonematrixisdeducedineaseofhiddenMarkovmode1Gaussianmixturemodel(HMM—GMM1basedspeechrecognitionsystemwithdiagon

6、alcovariancematrices.Then.alow—rankconstraintisappliedtoestimationoftheeigenphonematrix.ThenuclearnormisusedaSaconvexapproximationoftherankofamatrix.Theweightofthenormisadjustedtocontrolthecomplexityoftheadaptationmode1.Finally,anacceleratedproximalgradientmethodis

7、adoptedtosolvethemathematicoptimization.ExperimentsonanMandarinChinesecontinuousspeechrecognitiontaskshowthat,theperformanceoftheoriginaleigenphonemethodisimprovedremarkably.Thenewmethodoutperformsthemaximumlikelihoodlinearregressionfollowedbymaximumaposterriori(ML

8、LR+MAP1methodsunder5~50Sadaptationdatatestingconditions.Keywords."Speechrecognition;Speakeradaptation;Eigenphone;Low—rankconstraint;Proximalgradi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。