欢迎来到天天文库
浏览记录
ID:25307399
大小:54.50 KB
页数:6页
时间:2018-11-19
《一种基于遗传算法的语法网络搜索方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、一种基于遗传算法的语法网络搜索方法一种基于遗传算法的语法网络搜索方法1.引言 语音识别技术是让机器通过识别和理解人类的语音信号,进而听懂人类的语言。近年来,由于计算机各项功能的日益强大,云计算技术的全面发展,语音信号处理技术也得到了长足的进步。目前语音识别技术已广泛应用于医疗、教育、安全、电信客服等领域,覆盖人类生活的方方面面。 但在实际应用中仍然会存在较多的问题,比如信道干扰、背景噪音干扰等,这些不确定因素都会对识别率造成很大的影响。另外,在各类嵌入式设备终端上,语音识别系统的运行环境相对比较差,在系统的效率和效果之间要做好平衡。基于以上问题,语音识别系统通常从三方面来评价,分别鲁棒性
2、、识别率以及响应时间,本文重点关注语音识别系统的识别率和响应时间。本文选择基于隐马尔科夫模型(HiddenMarkovModel,HMM)的语音识别技术[1]构建了基线系统。在该系统中,影响语音识别系统识别率和响应时间的模块比较多,但最主要的还是解码模块。该模块通常采用传统的Viterbi解码方法,但是在海量命令词识别时,如车载领域的兴趣点(PositionofInteresting,POI)识别,搜索空间急剧增大,获取最优解的效率大大降低。针对这类复杂的问题,需要把主要精力放在寻求满意解上。 遗传算法(GeicAlgorithm,GA)借鉴了生物学中的染色体和基因的概念,通过模拟自然进化
3、过程,求解满意解较为有效。它对一个参数编码群体进行操作,提供的参数信息量较大,优化效果也相对较好[2-4]。因此,本文将GA算法应用于基线系统的语法网络搜索模块,以此来提升该模块的全局优化搜索能力,进而改善系统的识别效果和响应时间。 2.基线系统的构建?????????????????? 2.1系统结构 如图1所示,系统各部分按照与识别实例关系的不同分为两大类:实例无关事物和实例相关事物。实例无关事物指的是与识别实例无关的永久性资源:包括拼音到HMM索引表、汉字到HMM的索引表和HMM集合。实例相关的事物则指的是与特定识别实例相联系的行为或数据。它又可分为四个字模块:词典集合、搜索本文
4、由.LM各状态的概率。 词典集合模块,负责管理词典。实际系统支持多个词典,形成一个词典可包含多个词典的词典集合。每个词典包含多个词,可以增加、删除词。可以将一个词典生成语法网络,提供给搜索使用。 图1基线系统框架结构 2.2识别流程概述 系统有两种运行状态:脱机识别和联机识别。脱机识别和联机识别的区别在于语音数据的来源不同。脱机识别数据来自文件,而联机是别的数据来自麦克风。这两种状态的运行流程如图2所示。 图2语音识别流程 3.语法网络搜索的遗传操作 在实际的搜索中,我们通常是将HMM根据语法的限制连接成一个语法网络,如图3就是一个简单的孤立词识别系统的语法网络,语法网络可以分
5、为三层,如图4所示。 语法网络搜索过程又称为解码,逻辑上通常将解码分为两层,一层是HMM内部状态在时刻t的最大概率,另一层是以网络节点为单元,它们之间的关系为网络节点在时刻t的概率是本HMM内部各状态在时刻t的最大值。 传统的解码方法是Viterbi解码,但是在一些应用场合,比如车载领域的POI识别,其命令词集合非常大,往往有数十万条。此时,解码的搜索空间将急剧增大,而系统的效率、效果将急剧下降。所以,对这类复杂的问题,需要把主要精力放在寻求满意解上,而GA正是寻求这种满意解的最佳工具之一。 图3孤立词识别系统的网络结构 图4语法网络的三层模型[5] 3.1编码方案 将语法网络的
6、HMM标号i(i,2,,N)作为基因,构造有K个命令词的识别网络,每个命令词内存放一类标号,构成遗传操作的染色体。 3.2创建初始种群 初始种群应具有一定的规模,以保持群体内个体的多样性。由于GA具有很强的鲁棒性,所以如何形成初始种群不影响优化结果,只影响优化时间。可以对一条染色体加以随机扰动产生一定N-1条剩余的染色体。 3.3适应度函数 计算染色体对应的HMM状态的似然度估计值,以此作为适应度评价函数。似然值越大,适应度值也就越大。不过这显得有些简单,后续还可以将似然值进行分段处理,并增加辅助评价函数。 3.4交叉运算 交叉运算是遗传算法中产生新个体的主要操作过程,它以某一概
7、率相互交换某两个个体之间的部分染色体[6]。本文采用单点交叉的方法[7],首先对群体进行随机配对;其次随机设置交叉点位置;最后再相互交换配对染色体之间的部分基因。 3.5突变运算 突变运算是对个体的某一个或某一些基因座上的基因值按某一较小的概率进行改变,它也是产生新个体的一种操作方法[6]。本文采用基本位突变的方法来进行突变运算[8],其具体操作过程是:首先确定出各个个体的基因变异位置,可以随机产生的变异
此文档下载收益归作者所有