基于hmm算法的语音识别系统设计及其混合编程实现

ID：33695548

大小：105.04 KB

页数：3页

时间：2019-02-28

资源描述：

《基于hmm算法的语音识别系统设计及其混合编程实现》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、第285卷　第期计　算　机　工　程20025年月Vol.28№5ComputerEngineeringMay2002·人工智能及识别技术·文章编号：1000—3428(2002)050013——902文献标识码：A中图分类号：TP912.32基于HMM算法的语音识别系统设计及其混合编程实现许丽红，余小清，万旺根(上海大学通信与信息工程学院，上海200072)摘要：介绍了连续MK元高斯混合密度的隐马尔可夫语音识别系统，提出了一种基于分段平均法的初始化模型参数方法；将可靠性度量方法结合到Baum-Welch重估算法中去，简化了算法复杂度。系统的实现采用C++与Ma

2、tlab混合编程，提高了整个系统的开发效率。关键词：MFCC；CDHMM；语音识别SpeechRecognitionStudyBasedonMFCCandCDHMMandItsRealizationUsingaMixedProgramMethodXULihong，，YUXiaoqingWANWanggen（）SchoolofCommunicationandInformationEngineering,ShanghaiUniversity,Shanghai200072【】AbstractThispaperintroducesthetheoryandimpleme

3、ntationofCDHMMspeechrecognition.ItprovidesanimprovingK-meansinitializationmethodbasedoncharacterofspeechsignal.Thetechniqueofreliabilitymeasureisusedtoresolvetheproblemofparameterscombination,whichcanconsiderablyreducethecalculationburden.Itcanspeedupthewholesystemdevelopmentbyusing

4、amixedprogrammodewithC++andMatlab.【Keywords】MFCC；；CDHMMSpeechrecognition语音识别是指机器通过识别、理解把语音信号转变为相其中，Hm(n)为第m个带通滤波器，Hm为其对应的输出功率应的文本文件或命令的过程，其作为模式识别的两个主要方值，N即一帧语音的采样点个数，本系统采用256点帧采样面是特征提取和模式分类。隐Markov模型(HMM)作为语音序列。信号的一种统计模型，是语音信号时变特征的有效表示法，(3)IFF对输出功率求T，即可得MelCepstrum。Mel倒谱[4]在语音处理各个领域

5、中获得了广泛的应用。HMM模型可分参数也可以通过求输出功率自然对数的余弦变换得到。为离散隐马尔可夫模型(采用离散概率密度函数，简称2CDHMM模型的训练与识别DHMM)(和连续隐马尔可夫模型采用连续概率密度函数，简本系统HMM模型采用有跨越由左向右混合高斯型概率[3]称CDHMM)以及半连续隐马尔可夫模型(SCHMM，集密度模型，如图1所示，这种模型的每个状态不仅向下一DHMM和CDHMM)特点[1，2]。一般来讲，在训练数据足够的个状态转移，还可以向右侧第二位状态转移，即允许隔位跳情况下,CDHMM优于DHMM和SCHMM。本文采用CDHMM转，意味着语音中

6、某些发音单位在实际说话时可能被吸收或设计语音识别系统。删除。这种模型比无跨越由左向右模型描述更详尽，更符合语音发音实际情况，且转移矩阵A仍然比较稀疏，模型重估1语音特征参数的提取计算量小。基于Mel频率倒谱系数的特征参数MFCC是受人的听觉系统研究成果推动而导出的声学特征，在一定程度上模拟了人耳对语音的处理特点，因此表现相对比较稳健。其计算要[3]点是将线性功率谱转换为Mel频率下的功率谱，Mel频率12345与线性频率的转换关系如下：mel=lnæç1+fö÷1000(1)图1HMM有跨越由左向右模型è700øln(1+1000/700)2.1模型参数初始化

7、[4]MFCC参数的计算过程可以概括为下面几个步骤。与DHMM相比较，CDHMM虽然能够比较精确地刻画(1)求预加重信号的离散功率谱特征矢量的空间分布，但由于它所包含的参数数目多，而且首先对采样后的帧序列s(n)作高频预加重处理，即让帧-1序列通过数字滤波器(1-0.95Z)，以减少低频干扰分量的影基金项目：国家自然科技基金资助项目（）60072031；教育部骨干响然后将预处理后的信号,求FFT并计算其离散功率谱S(n)。教师资助项目(2)mel计算滤波器的的输出功率作者简介：许丽红(1977)～，女，硕士生，研究方向：语音信号处N/2-1(2)理；余小清，副

8、教授；万旺根，教授、博导H=H(n)*

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 / 3



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于hmm算法的语音识别系统设计及其混合编程实现

基于hmm算法的语音识别系统设计及其混合编程实现

相关文章

相关标签