基于段长分布的HMM语音识别模型.pdf

基于段长分布的HMM语音识别模型.pdf

ID:54018082

大小:269.31 KB

页数:7页

时间:2020-04-28

基于段长分布的HMM语音识别模型.pdf_第1页
基于段长分布的HMM语音识别模型.pdf_第2页
基于段长分布的HMM语音识别模型.pdf_第3页
基于段长分布的HMM语音识别模型.pdf_第4页
基于段长分布的HMM语音识别模型.pdf_第5页
资源描述:

《基于段长分布的HMM语音识别模型.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第1期电子学报Voi.32No.12004年1月ACTAELECTRONICASINICAJan.2004基于段长分布的HMM语音识别模型王作英,肖熙(清华大学电子工程系,北京100084)摘要:本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型,证明了这种模型的状态转移概率表示与状态段长表示的等效性,并在此基础上提出了基于段长分布的HMM模型(DDBHMM).非特定人连续语音实验结果表明,仅仅利用状态段长信息的DDBHMM语音识别模型比经典HMM模型的性能有了

2、明显的提高(误识率降低了17.8%),展示了DDBHMM的良好的性能,为语音信号的时长、语速、时间断续性以及语音特征的相关性等重要特征的描述和利用开辟了空间.关键词:段长;语音识别;DDBHMM中图分类号:TN912.34文献标识码:A文章编号:0372-2112(2004)01-0046-04DurationDistributionBasedHMMSpeechRecognitionModelsWANGZuo-ying,XIAOXi(DeptofElectronicEngineering,TsinghuaUniuersity,Beij

3、ing100084,China)Abstract:InordertoovercomethedefectsofthedurationmodeiingofhomogeneousHMMinspeechrecognition,aDurationDistributionBasedHMM(DDBHMM)isproposedinthispaperbasedonaformaiizeddefinitionofaieft-to-rightinhomogeneousMarkovmodei,whichhasbeendemonstratedthatitcanb

4、eidenticaiiydefinedbyeitherthestatedurationorthestatetransitionproba-biiities.Thespeakerindependentcontinuousspeechrecognitionexperimentshaveshownthat,byoniymodeiingthestatedurationinDDBHMM,asignificantimprovement(17.8%errorratereduction)hasbeenachievedcomparingwiththec

5、iassicaiHMM.TheideaipropertiesofDDBHMMwiiigivepromisetomanyaspectsofspeechmodeiing,suchasthemodeiingofthestateduration,speedvaria-tion,speechdiscontinuityandtheinterframecorreiation.Keywords:duration;speechrecognition;DDBHMM布,Poisson分布和均匀分布等.也可以应用指数簇类中的若干!引言[10]个函数的组合来拟

6、合实际的段长分布.此外,也有学者研在经典的HMM[1]语音识别模型中,为了方便研究,假设究用ESHMM(ExpandedStateHMM)模型[11,12]来增强HMM模模型中的状态转移具有齐次Markov性,并且模型的观测特征型对段长信息的表达能力.是帧间独立的,从而可以使用Baum-Weich算法[2]进行HMM研究表明在VDHMM和CVDHMM模型中,由于a是常ij模型的训练和识别.在这种齐次Markov性假设的前提下,经数,因此不能保证在任意时刻!,Markov链中的概率公式aii典HMM模型状态i的驻留概率a为常数,系统进入

7、状态iNi,i后在该状态连续驻留的时间!(即段长)是服从几何分布(!)+"aij=1总是成立所以这种模型存在明显的理论上j=i+1P(!)=a!i,-i(11-ai,i),!!1(1)缺陷而ESHMM模型是属于齐次的HMM模型,所能描述的许多实验统计都表明,经典HMM模型这种段长的几何段长分布形式有限,当子状态的结构复杂时,不利于构造快速分布形式不能很好地描述语音的段长特征[3~5].为此,Fergu-算法显然比较彻底的解决方案是采用非齐次的HMM模型[13][14]和Vasegh[i15,16]等都分别先后提出在自左son和Levi

8、nson等人对模型进行改进,将状态段长概率直接引本文作者入到HMM模型中,相继提出了VDHMM模型[6]和CVDHMM向右的HMM模型中利用段长驻留概率表示状态的转移概率模型[7].VDHMM和CVDHMM模型的状态驻留

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。