欢迎来到天天文库
浏览记录
ID:55746013
大小:469.80 KB
页数:7页
时间:2020-06-06
《语音识别中基于低秩约束的本征音子说话人自适应方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第36卷第4期电子与信息学报Vol_36NO.42014年4月JournalofElectronics&InformationTechnologyApr.2014语音识别中基于低秩约束的本征音子说话人自适应方法张文林张连海陈琦李弼程(解放军信息工程大学信息系统工程学院郑州450002)摘要:该文提出一种基于低秩约束的本征音子(Eigenphone)说话人自适应方法。原始的本征音子说话人自适应方法在自适应语料充分时具有很好的效果,然而当自适应语料不足时,出现严重的过拟合现象,导致自适应后的系统可能比自适应前的系统还要差。首先,
2、对协方差矩阵为对角阵的隐马尔可夫.高斯混合模型语音识别系统,推导出一种简化的本征音子矩阵估计算法;然后,对本征音子矩阵引入低秩约束,采用矩阵的核范数作为矩阵秩的凸近似,通过调节核范数的权重因子以有效控制自适应模型的复杂度;最后,给出一种加速近点梯度算法以求解新算法中引入的带有核范数正则项的数学优化问题。汉语连续语音识别的说话人白适应实验表明,引入低秩约束后,本征音子说话人自适应方法的自适应效果得到了明显提高,在5~50S的自适应数据条件下,均取得了比最大似然线性回归后接最大后验(MLLR+MAP)自适应更佳的识别效果。关键词
3、:语音识别;说话人自适应;本征音子;低秩约束;近点梯度法中圈分类号:TN912.3文献标识码:A文章编号:1009—5s96(2o14)o4—0981—07DOI:10.3724/SP.J.1146.2013.00848Low—rankConstraintEigenphoneSpeakerAdaptationMethodforSpeechRecognitionZhangWen-linZhangLian—haiChenQiLiBi—cheng(InstituteofInformationSystemEngineering,PI
4、nformationEngineeringUniversity,Zhengzhou450002,China)Abstract:Alow—rankconstrainteigenphonespeakeradaptationmethodisproposed.Originaleigenphonespeakeradaptationmethodperformswellwhentheamountofadaptationdataissuficient.However,itsuffersfromserveroverfittingwhenins
5、uficientamountofadaptationdataisprovided,possiblyresultinginlowerperformancethanthatoftheunadaptedsystem.Firstly,asimplifiedestimationalogrithmoftheeigenphonematrixisdeducedineaseofhiddenMarkovmode1Gaussianmixturemodel(HMM—GMM1basedspeechrecognitionsystemwithdiagon
6、alcovariancematrices.Then.alow—rankconstraintisappliedtoestimationoftheeigenphonematrix.ThenuclearnormisusedaSaconvexapproximationoftherankofamatrix.Theweightofthenormisadjustedtocontrolthecomplexityoftheadaptationmode1.Finally,anacceleratedproximalgradientmethodis
7、adoptedtosolvethemathematicoptimization.ExperimentsonanMandarinChinesecontinuousspeechrecognitiontaskshowthat,theperformanceoftheoriginaleigenphonemethodisimprovedremarkably.Thenewmethodoutperformsthemaximumlikelihoodlinearregressionfollowedbymaximumaposterriori(ML
8、LR+MAP1methodsunder5~50Sadaptationdatatestingconditions.Keywords."Speechrecognition;Speakeradaptation;Eigenphone;Low—rankconstraint;Proximalgradi
此文档下载收益归作者所有