基于htk的维吾尔语连续数字语音识别new

基于htk的维吾尔语连续数字语音识别new

ID:33923037

大小:228.40 KB

页数:3页

时间:2019-02-28

基于htk的维吾尔语连续数字语音识别new_第1页
基于htk的维吾尔语连续数字语音识别new_第2页
基于htk的维吾尔语连续数字语音识别new_第3页
资源描述:

《基于htk的维吾尔语连续数字语音识别new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、研究与开发基于HTK的维吾尔语连续数字语音识别蔡琴,吾守尔·斯拉木(新疆大学信息与工程学院,新疆830000)摘要:根据HTK工作原理,设计了维吾尔语连续数字识别的训练步骤,进行嵌入式重估训练,建立了基于音素级单位的HMM模型,建立了语言模型,实现了维吾尔语非特定人小词汇量亿以内的数字语音识别。关键词:HTK工具包;HMM;维吾尔语;语言模型0引言加入语音识别系统,现阶段完成的只有基于HTK的维吾尔语非特定人小词汇量孤立词的语音识别。语音识别(SpeechRecognition)指让机器听懂人说的话,即在各种情况下准确地识别出语音的内容,从而2HTK工作原理根据其信息,执行人的各种意图。它

2、是一门涉及面很广的交叉学科,与计算机、通信、语音语言处理、信号处理、神经生理学和人工智能都有密切的关系。1HTK初步了解隐马尔可夫模型工具包HTK(HMMToolsKit)是由剑桥大学工程系开发的用来建立和处理HMM模型的C语言函数库,源代码开放,主要应用于语音识别领域,也应用于语音合成、字符识别和DNA排序等领域。HTK经过剑桥大学、Entropic公司及Microsoft公司的不断增强和改进,在语音识别领域处于世界领先水平,HTK还是一套源代码开放的工具箱,其基于ANSIC的模块化设计方式可以方便地嵌入到用户系图1HTK工具包统中。如图1所示,HTK工具包是由四个主要工具包HTK主要用

3、于设计基于隐马尔可夫模型的语音组成:语音数据准备、HMM训练工具、识别工具、数据识别系统,可以支持连续密度隐马尔可夫模型分析工具。在语音数据准备时,可以先用HTK提供的(CDHMM)及离散密度隐马尔可夫模型(DHMM)。该工语音录音程序HSLab对声音进行录音和手工标注,具包提供了一系列分析语音、训练、测试HMM并进行也可以用Praat、Cooledit等录音程序进语音资料的收识别结果分析的复杂函数,可读性、可扩充性好,且调集。录音时声音不能过大也能过小,声音过大会影响试功能强大,可以大大缩短开发人员的编程时间,提高正常发音情绪,声音过小则有用信息被忽略。为了构系统开发效率。但HTK是基于

4、UNIX环境的开发工现造一组HMMs,需要一系列的语音文件和与其相关的具,在Windows环境下只能以命令行形式运行,所以影代标记文件,可标注为不同级需要的抄本。与其关联的计响了程序的友好性和可移值性。鉴于这个原因,HTK不标记文件也必须转换成和应用需要一致的音素或词算能直接用于开发基于Windows环境的语音识别系统,一级标注的正确格式的文件。对语音文件的标注,即机非特定人的HMM模型是利用非特定人语音库中的大可采用手工标注方式,也可以采用自动标注方式,或是(量数据训练得到的,不需要实时训练,因此本系统中的总自动和手工相结合。在维吾尔语孤立词语音识别中,对第训练部分完全利用HTK编程实现

5、,这样做大大提高了于训练数据,需要为每一个发音单元提供边界信息,常二整个系统的开发效率。用手工标注的方法实现,都标注为词一级的文件格式。五维吾尔语音识别的研究正处于起步阶段,语音识这种方法对于少量的训练数据还可以,但对于大量训七别技术实用化程度越来越高,在手机、PDA等设备中期练数据是不可行的,需要的工作量太大,而且手工标注)!"MODERNCOMPUTER2007.4研究与开发有时并不是很准确,这会直接影响系统的识别率,所以音,24个辅音),而且是为所有词所共享,其缺点是简对于连续数字的维吾尔语的识别,发音单元的边界信单的以音素作为识别单元,每个音素的发音都受其左息是不需要的,只需要包含

6、相应的发音序列的描述文右临近音素的影响,在不同的上下文中发音会发生变件。训续时采用嵌入式的方式。HCopy用于将一个或多化。维吾尔语是语流音变很显著的语种,且维吾尔语个源文件转换成一个需要的输出文件,HList可被用于中的一些附加成分,音素的发音极不充分,由于与上检查语音文件的内容,还可以查看文件的转化结果。下文的连读,使发音产生了较大变化,因此只使用音HLed是一个由脚本驱动的标记编辑器,用于生成系统素作为识别单元,但也不是很好的选择;第二,三音子所需要的录音标记文件,生成文件格式为*.MLF。模型是一种非常强的音子模型,因为它记入了上下文训练工具主要基于Baum-welch重估算法。首

7、先的全部协同发音的影响,其识别率较音子模型高得定了个HMM拓扑原型,使用抄本文件proto,对维吾尔多,但是使用三音子作为识别单元也存在一些问题,孤立词拓扑结构进行设计。HCompV、HInit用于估计例如,对于一个只有小型语音库来说,三音子数量适出一套初始模型参数,使用HRset、HERest用Baum-中,当扩大语音库的规模时,三音子的数量就会急剧welch算法重估参数,对HMM训练,主要利用HTK膨胀。三音子模型在

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。