资源描述:
《基于htk的语音识别系统设计new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第16卷 第10期计算机技术与发展Vol.16No.102006年10月COMPUTERTECHNOLOGYANDDEVELOPMENTOct.2006基于HTK的语音识别系统设计石现峰,张学智,张 峰(西安工业大学 陕西西安710032)摘 要:HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA排序等领域。文中主要介绍了HTK的基本原理和软件结构,并且针对HTK工具箱进行了二次开发,设计开发了一套完整的语音识别输入系统及其相应的测试平台,并验证了该语音识别系统的识别率,实
2、验表明,该系统取得了较好的语音输入效果。关键词:HTK;语音识别;HMM中图分类号:TP18 文献标识码:A 文章编号:1673-629X(2006)10-0037-02DesignofSpeechRecognitionSystemBasedonHTKSHIXian2feng,ZHANGXue2zhi,ZHANGFeng(Xi’anTechnologicalUniversity,Xi’an710032,China)Abstract:HTKisaClanguage-basedtoolkitdevelope
3、dbyCUEDmeanlyusedforspeechsignalreorganization,speechsynthesis,charac2terreorganization,DNAcompositorandsoon.HTK’sgeneralprinciplesandsoftwarearchitectureisdiscussedinthispaperandasuitofspeechrecognitionsystemisdesignedbasedonHTKusingfurtherdevelopmenttechnology.Ate
4、stplatformisalsodesignedtotestthissystemandgivesthecorrectrate.Experimentalresultsaresatisfied.Keywords:HTK;speechrecognition;HMM0 引 言的。当HMM应用于孤立词语音识别时,它用不同的隐含 语音识别是指机器通过学习实现从语音信号到文字状态转移来描述不同的语音发音。对于连续语音识别系符号的理解过程,是一种十分重要的人机交互方式。信息统,多个孤立词HMM子模型按一定的语言模型组成的复产业的迅速发展促使
5、许多研究机构投入了大量的人力、物合HMM模型序列来刻画连续的语音信号,在序列中的每力和财力来研究语音识别,这一领域的突破也具有重大的个模型直接对应于相关的发音,并且,每一个模型都有进现实意义,让机器能够听懂人类的自然语音可以解决诸如入和退出状态,这两个状态没有对应的观察矢量,只用于智能机器人、语音输入、低码率语音编码等问题,突破信息不同模型的连接。处理的一个瓶颈。在孤立词语音识别中,对于训练数据,需要为每一个HTK(HMMToolsKit)是一个剑桥大学开发的专门发音单元提供边界信息,常使用手工标注的方法实现。这用于建立和处理
6、HMM的实验工具包[1],主要应用于语音种方法对于少量的训练数据还可以,对于大量训练数据是识别领域,也可以应用于语音合成、字符识别和DNA排不可行的,需要的工作量太大,而且手工标注有时并不是序等领域。HTK经过剑桥大学、Entropic公司及Microsoft很准确,这会直接影响系统的识别率。但是,对于大量词公司的不断增强和改进,使其在语音识别领域处于世界领汇、连续语音识别系统来讲,大量的训练数据是必需的,所先水平,另外,HTK还是一套源代码开放的工具箱,其基以,一般情况下,在连续语音识别的模型训练中,发音单元于ANSIC的模
7、块化设计方式可以方便地嵌入到用户系的边界信息是不需要的,只需要包含相应的发音序列的描统中。文中介绍了HTK的原理、特点及使用,并在VC环述文件。在HTK中使用MLF格式的文件来描述发音序境下设计了一套完整的语音识别及测试系统。列。训练方法也必需使用嵌入式训练算法,这种算法把样本中前一个模型的退出状态和后一个模型的进入状态按照某种方式连按起来,这样,每一个训练样本就成为了一1HTK原理个组合的HMM模型,在训练时,同时对样本中所有模型HTK工具箱是使用HMM模型作为语音识别的核心的参数进行调整。收稿日期:2006-03-18HT
8、K的许多功能被编译为一序列的函数库模块,这作者简介:石现峰(1978-),男,河南人,助教,博士研究生,研究方向些模块可以使用相同的接口方式和外界进行交互。HTK为信号与信息处理、嵌入式系统。的主要函数模块的功能如下:用户的输入输出和与操作系·