基于案例推理的汉语关键词检出方法研究

基于案例推理的汉语关键词检出方法研究

ID:32527287

大小:554.68 KB

页数:56页

时间:2019-02-11

基于案例推理的汉语关键词检出方法研究_第1页
基于案例推理的汉语关键词检出方法研究_第2页
基于案例推理的汉语关键词检出方法研究_第3页
基于案例推理的汉语关键词检出方法研究_第4页
基于案例推理的汉语关键词检出方法研究_第5页
资源描述:

《基于案例推理的汉语关键词检出方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、国内图书分类号:TP391.42学校代码:10213国际图书分类号:681.3密级:公开工学硕士学位论文基于案例推理的汉语关键词检出方法研究硕士研究生:周大力导师:郑铁然(副)教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2013年6月授予学位单位:哈尔滨工业大学IIClassifiedIndex:TP391.42U.D.C.:681.3DissertationfortheMasterDegreeinEngineeringCase-BasedReasoningSolutionForChin

2、eseKeywordDetectionCandidate:ZhouDaliSupervisor:AssociateProf.ZhengTieranAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyDateofDefence:June,2013Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工程硕士学位论文摘要关键词检出(KWS)就是在无

3、限制的语音流中识别检出给定词汇的一种语音识别技术,它是自动语音识别(ASR)技术的一种。相比较于连续语音识别(CSR)技术而言,由于它只关注给定词在语音中是否存在,而不用识别全部语音内容,其实现相对容易。由于连续语音识别技术尚未达到实用水平,关键词检出技术在各类应用中扮演了重要的角色,如对话系统、语音文档检索、语音内容监控等。本文主要针对传统的基于HMM的关键词检出方法的不足,尝试提出一种基于持续学习策略的关键词检出新方法。在基于HMM的关键词检出技术中,声学模型是主要识别依据,而声学模型可以看作是训练语料中所蕴含的关于人类发

4、音的声学知识的精简表达。然而在实际应用中,关键词检出性能普遍受到声学模型与待识语料不匹配问题的严重困扰。这主要是因为训练语料中所包含声学知识并不完备,一旦待识语料中出现了一些未被其涵盖的声学现象,检出性能就会严重下降。考虑到人类的发音及声学表示极易受到各种因素的影响,构建一个具有完备声学知识的训练语料集是不可能的,因而不匹配问题也就无法根本消除。本文的解决方法是,将服务提供商或用户也拉入到为关键词检出系统累积声学知识的任务中来,利用他们提供的识别结果的反馈,不断增加和修正系统已掌握的声学知识,使其不断向完备这个目标逼近。这需要

5、一种具有持续学习能力的关键词检出技术,而传统的基于HMM的方法显然无法满足这一要求。为此,本文提出了一种基于案例推理框架的关键词检出方法。本文首先介绍了目前主流的基于隐马尔科夫(HMM)模型的关键词检出系统的建立方法。并通过实验给出了此基线系统的性能。然后介绍本文提出的基于案例推理(CBR)的关键词检出方法。首先讨论了选择CBR框架的原因。然后详细地描述了该框架中的各部分的具体实现方法:基于声学符号聚类的关键词案例的表示方法;案例库的树形索引方法;基于弹性匹配原则的案例匹配方法;案例库的搜索算法及搜索结果的关键词后验概率估计;

6、反馈的处理方法。在本文的第四章,对此关键词检出方法进行了改进,在声学符号的聚类环节,充分考虑了此声学符号在声学特征空间和语言语义空间的可区分性要求,以及符号集尺寸对关键词案例搜索效率的影响,提出了一种复合的聚类准则,并基于合并式层次聚类算法来聚类声学符号集。文中通过实I哈尔滨工业大学工程硕士学位论文验验证了该关键词检出方法的性能,并证实了该方法具有持续学习能力。关键词:关键词检出;隐马尔科夫模型;案例推理;聚类算法;持续学习II哈尔滨工业大学工程硕士学位论文AbstractKeywordspotting(KWS)detects

7、specificwordinanunconstrainedspeechstream.ItisatechnologyinthefieldofAutomaticSpeechRecognition(ASR).ComparingwithContinueSpeechRecognition(CSR)technology,itiseasiertobeconstructedforbeingunnecessarytorecognizeallcontextsofthespeech.Moreover,duetoCSRtechnology’sinca

8、pabilitytosomeapplication,KWSplaysaveryimportantroleinthem,suchas:dialoguesystem,spokendocumentretrievalandspeechcontextsurveillance.AnewK

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。