基于码本的说话人自适应方法

基于码本的说话人自适应方法

ID:38190449

大小:286.11 KB

页数:5页

时间:2019-05-25

基于码本的说话人自适应方法_第1页
基于码本的说话人自适应方法_第2页
基于码本的说话人自适应方法_第3页
基于码本的说话人自适应方法_第4页
基于码本的说话人自适应方法_第5页
资源描述:

《基于码本的说话人自适应方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第4期电子学报Vol.29No.42001年4月ACTAELECTRONICASINICAApril2001基于码本的说话人自适应方法吕津,赵明生,王作英(清华大学电子工程系,北京100084)摘要:本文提出了一种基于码本的说话人自适应方法.它可以将变换方法和Bayes估计法这两大类说话人自适应方法的优点有机的结合起来,既能实现快速的说话人自适应,还具有良好的一致渐进性.自适应过程可分为两个阶段:在第一阶段,用由大量参考说话人的语音码本构成的线性组合来逼近用户的语音码本.此时只需要很少的自适应训练数据就可以用基于Rosen梯度投影法的优化算法计算出线性组合中

2、各码本的最佳权值.在第二阶段,码本的最佳线性组合被用作用户码本的先验估计值.随着更多自适应训练数据的获得,系统对用户码本进一步进行Bayes估计,从而可以实现累进的自适应.作者将该方法应用于说话人无关的连续汉语语音识别系统.一系列的对比实验表明该自适应方法很有前途.关键词:语音识别;基于码本的说话人自适应方法;Rosen梯度投影法中图分类号:TN912134文献标识码:A文章编号:037222112(2001)0420456205Codebook2BasedSpeakerAdaptationLUJin,ZHAOMing2sheng,WANGZuo2ying(

3、DepartmentofElectronicEngineering,TsinghuaUniversity,Beijing100084,China)Abstract:Inthispaper,anewspeakeradaptationmethod—codebook2basedspeakeradaptation,whichcouldcombinethead2vantagesoftransformmethodwithBayesadaptivelearningmethodappropriately,ispresented.Notonlycanthespeakerada

4、ptationsys2temimproveitsperformanceforsmallamountofadaptationdata,butitcanalsoapproachasymptoticallymatched2conditionperfor2mancewithincreasingnumberofadaptationdata.Theadaptationprocesscanbedividedintotwostages.Inthefirststage,forapproxi2matingtheacousticparametersofatargetspeaker

5、,thelinearcombinationoflotsofreferencespeaker’scodebooksisproposed.Anef2fectivealgorithmbasedonRosengradientprojectionmethodisdevelopedtocounttheweightofeachcodebookinthelinearcombina2tion.Inthesecondstage,thecombinationofcodebooksisusedasthepriorprobability,thenBayesadaptivelearni

6、ngmethodisusedtolearntheexactvalueofthetargetspeaker’scodebookasmoreadaptationdataaregathered.Thusincrementalspeakeradaptationcanbeachieved.Asanillustration,thismethodisappliedtoaspeakerindependentcontinuousspeechrecognitionsystemfortheChineselanguage.Aseriesofcomparativeexperiment

7、swereconductedtoevaluatetheperformanceoftheproposedmethod.Theresultshaveshownitisquitepromising.Keywords:speechrecognition;codebook2basedspeakeradaptation;Rosengradientprojectionmethod1引言换来进行归正.比如最大似然估计线性回归方法(maximum[3][4,5]当前,尽管非特定人连续语音识别系统已经取得了令人likelihoodlinearregress),Digalakis

8、等人提出的受限估计混鼓舞的成绩,但在实际应用时说话人

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。