基于hmm算法的语音识别系统设计及其混合编程实现

基于hmm算法的语音识别系统设计及其混合编程实现

ID:33695548

大小:105.04 KB

页数:3页

时间:2019-02-28

基于hmm算法的语音识别系统设计及其混合编程实现_第1页
基于hmm算法的语音识别系统设计及其混合编程实现_第2页
基于hmm算法的语音识别系统设计及其混合编程实现_第3页
资源描述:

《基于hmm算法的语音识别系统设计及其混合编程实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第285卷 第期计 算 机 工 程20025年月Vol.28№5ComputerEngineeringMay2002·人工智能及识别技术·文章编号:1000—3428(2002)050013——902文献标识码:A中图分类号:TP912.32基于HMM算法的语音识别系统设计及其混合编程实现许丽红,余小清,万旺根(上海大学通信与信息工程学院,上海200072)摘要:介绍了连续MK元高斯混合密度的隐马尔可夫语音识别系统,提出了一种基于分段平均法的初始化模型参数方法;将可靠性度量方法结合到Baum-Welch重估算法中去,简化了算法复杂度。系统的实现采用C++与Ma

2、tlab混合编程,提高了整个系统的开发效率。关键词:MFCC;CDHMM;语音识别SpeechRecognitionStudyBasedonMFCCandCDHMMandItsRealizationUsingaMixedProgramMethodXULihong,,YUXiaoqingWANWanggen()SchoolofCommunicationandInformationEngineering,ShanghaiUniversity,Shanghai200072【】AbstractThispaperintroducesthetheoryandimpleme

3、ntationofCDHMMspeechrecognition.ItprovidesanimprovingK-meansinitializationmethodbasedoncharacterofspeechsignal.Thetechniqueofreliabilitymeasureisusedtoresolvetheproblemofparameterscombination,whichcanconsiderablyreducethecalculationburden.Itcanspeedupthewholesystemdevelopmentbyusing

4、amixedprogrammodewithC++andMatlab.【Keywords】MFCC;;CDHMMSpeechrecognition语音识别是指机器通过识别、理解把语音信号转变为相其中,Hm(n)为第m个带通滤波器,Hm为其对应的输出功率应的文本文件或命令的过程,其作为模式识别的两个主要方值,N即一帧语音的采样点个数,本系统采用256点帧采样面是特征提取和模式分类。隐Markov模型(HMM)作为语音序列。信号的一种统计模型,是语音信号时变特征的有效表示法,(3)IFF对输出功率求T,即可得MelCepstrum。Mel倒谱[4]在语音处理各个领域

5、中获得了广泛的应用。HMM模型可分参数也可以通过求输出功率自然对数的余弦变换得到。为离散隐马尔可夫模型(采用离散概率密度函数,简称2CDHMM模型的训练与识别DHMM)(和连续隐马尔可夫模型采用连续概率密度函数,简本系统HMM模型采用有跨越由左向右混合高斯型概率[3]称CDHMM)以及半连续隐马尔可夫模型(SCHMM,集密度模型,如图1所示,这种模型的每个状态不仅向下一DHMM和CDHMM)特点[1,2]。一般来讲,在训练数据足够的个状态转移,还可以向右侧第二位状态转移,即允许隔位跳情况下,CDHMM优于DHMM和SCHMM。本文采用CDHMM转,意味着语音中

6、某些发音单位在实际说话时可能被吸收或设计语音识别系统。删除。这种模型比无跨越由左向右模型描述更详尽,更符合语音发音实际情况,且转移矩阵A仍然比较稀疏,模型重估1语音特征参数的提取计算量小。基于Mel频率倒谱系数的特征参数MFCC是受人的听觉系统研究成果推动而导出的声学特征,在一定程度上模拟了人耳对语音的处理特点,因此表现相对比较稳健。其计算要[3]点是将线性功率谱转换为Mel频率下的功率谱,Mel频率12345与线性频率的转换关系如下:mel=lnæç1+fö÷1000(1)图1HMM有跨越由左向右模型è700øln(1+1000/700)2.1模型参数初始化

7、[4]MFCC参数的计算过程可以概括为下面几个步骤。与DHMM相比较,CDHMM虽然能够比较精确地刻画(1)求预加重信号的离散功率谱特征矢量的空间分布,但由于它所包含的参数数目多,而且首先对采样后的帧序列s(n)作高频预加重处理,即让帧-1序列通过数字滤波器(1-0.95Z),以减少低频干扰分量的影基金项目:国家自然科技基金资助项目()60072031;教育部骨干响然后将预处理后的信号,求FFT并计算其离散功率谱S(n)。教师资助项目(2)mel计算滤波器的的输出功率作者简介:许丽红(1977)~,女,硕士生,研究方向:语音信号处N/2-1(2)理;余小清,副

8、教授;万旺根,教授、博导H=H(n)*

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。