资源描述:
《基于码本的说话人自适应方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第4期电子学报Vol.29No.42001年4月ACTAELECTRONICASINICAApril2001基于码本的说话人自适应方法吕津,赵明生,王作英(清华大学电子工程系,北京100084)摘要:本文提出了一种基于码本的说话人自适应方法.它可以将变换方法和Bayes估计法这两大类说话人自适应方法的优点有机的结合起来,既能实现快速的说话人自适应,还具有良好的一致渐进性.自适应过程可分为两个阶段:在第一阶段,用由大量参考说话人的语音码本构成的线性组合来逼近用户的语音码本.此时只需要很少的自适应训练数据就可以用基于Rosen梯度投影法的优化算法计算出线性组合中
2、各码本的最佳权值.在第二阶段,码本的最佳线性组合被用作用户码本的先验估计值.随着更多自适应训练数据的获得,系统对用户码本进一步进行Bayes估计,从而可以实现累进的自适应.作者将该方法应用于说话人无关的连续汉语语音识别系统.一系列的对比实验表明该自适应方法很有前途.关键词:语音识别;基于码本的说话人自适应方法;Rosen梯度投影法中图分类号:TN912134文献标识码:A文章编号:037222112(2001)0420456205Codebook2BasedSpeakerAdaptationLUJin,ZHAOMing2sheng,WANGZuo2ying(
3、DepartmentofElectronicEngineering,TsinghuaUniversity,Beijing100084,China)Abstract:Inthispaper,anewspeakeradaptationmethod—codebook2basedspeakeradaptation,whichcouldcombinethead2vantagesoftransformmethodwithBayesadaptivelearningmethodappropriately,ispresented.Notonlycanthespeakerada
4、ptationsys2temimproveitsperformanceforsmallamountofadaptationdata,butitcanalsoapproachasymptoticallymatched2conditionperfor2mancewithincreasingnumberofadaptationdata.Theadaptationprocesscanbedividedintotwostages.Inthefirststage,forapproxi2matingtheacousticparametersofatargetspeaker
5、,thelinearcombinationoflotsofreferencespeaker’scodebooksisproposed.Anef2fectivealgorithmbasedonRosengradientprojectionmethodisdevelopedtocounttheweightofeachcodebookinthelinearcombina2tion.Inthesecondstage,thecombinationofcodebooksisusedasthepriorprobability,thenBayesadaptivelearni
6、ngmethodisusedtolearntheexactvalueofthetargetspeaker’scodebookasmoreadaptationdataaregathered.Thusincrementalspeakeradaptationcanbeachieved.Asanillustration,thismethodisappliedtoaspeakerindependentcontinuousspeechrecognitionsystemfortheChineselanguage.Aseriesofcomparativeexperiment
7、swereconductedtoevaluatetheperformanceoftheproposedmethod.Theresultshaveshownitisquitepromising.Keywords:speechrecognition;codebook2basedspeakeradaptation;Rosengradientprojectionmethod1引言换来进行归正.比如最大似然估计线性回归方法(maximum[3][4,5]当前,尽管非特定人连续语音识别系统已经取得了令人likelihoodlinearregress),Digalakis
8、等人提出的受限估计混鼓舞的成绩,但在实际应用时说话人