欢迎来到天天文库
浏览记录
ID:35066575
大小:2.60 MB
页数:60页
时间:2019-03-17
《基于条件随机场的口语理解研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士研究生学位论文新疆大学论文题目(中文):基于条件随机场的口语理解研究论文题目(英文):SpokenLanguageUnderstandingResearchbasedonConditionalRandomFields研究生姓名:程露红学科、专业:工学、信息与通信工程研究方向:信号与信息处理导师姓名、职称:黄浩副教授论文答辩日期:2016年5月27日学位授予日期:2016年6月日新疆大学硕士研究生学位论文摘要随着互联网技术的飞速发展,用户对人机交互质量和人机对话系统的性能需求随之增加。在人机对话系统中需要利用到口语理解技术,该
2、技术的发展水平对人机对话系统的性能起着至关重要的作用,因而需要寻找到合适的口语理解方式,以便促进人机对话系统的发展。口语理解过程涉及到自动语音识别技术,该技术在神经网络声学模型的发展带动下取得了很大进展。由于系统因素的影响,在自动语音识别时也可能出现一些识别错误问题,这些错误可能会因为不规则口语的存在而更明显。本文主要是对目前的口语理解问题进行了研究,通过对这些问题的分析提出了基于条件随机场模型的稳健性口语理解方法。本文的主要工作及创新点如下:1.语音识别性能的不理想造成的识别错误以及不符合文法的口语输入往往造成口语理解性能下降
3、。针对此问题,本文提出一种改进口语理解稳健性的方法。该方法通过在训练数据集中人工加入错误文本噪声进行语料扩充,送入条件随机场口语理解模型进行训练,用得到的模型对具有噪声的未知数据集进行口语理解。2.针对口语理解语句中词与词向量之间的关系对口语理解的性能所产生的影响,提出了一种基于词嵌入的改进口语理解方法。首先用word2vec对口语理解语句进行词嵌入处理,得到语句中所有词的向量。通过计算词向量之间的相似度,从而得到每个词之间的相似度,再经过聚类,得到一个初始模糊分类。然后将这个初始模糊分类作为一个特征,与其他的特征一起送入条件随
4、机场进行口语理解训练,得到最终的分类结果。最后对所建立的模型在汉语交通查询领域进行实证。实验结果表明,本文建立的这种方法显著优于先前的基于规则的方法,此外相比数据驱动算法而言,可以显著降低开发成本,性能却没有受到影响。关键词:人机对话系统;条件随机场;口语理解;词嵌入I新疆大学硕士研究生学位论文AbstractWiththerapiddevelopmentofInternettechnology,man-machinedialoguesystemresearchhasbecomeoneofthepopularprojects.S
5、pokenlanguageunderstandingisthekeytechnologytorealizetheman-machinedialoguesystem,thustheperformanceofthespokenlanguageunderstandingplaysanimportantroleinthedevelopmentofman-machinedialoguesystem.Therecognitionrateofautomaticspeechrecognitiontechnologyhasobtainedgrea
6、timprovementinrecentyearsledbydepthacousticmodelofneuralnetwork,buttheprocessofautomaticspeechrecognitionisstilllikelytoidentifythemistakes,andthespokenlanguageisalsoofteninconformitytotherulesofgrammar.Thispaperproposedamethodtoimprovetherobustnessofspokenlanguageun
7、derstandingbasedonconditionalrandomfieldmodel.Themainworkandinnovationpointsincluding:1.Theperformanceofnaturallanguageunderstandingisoftendegradedbyundesirabilityspeechrecognitionerrorsandill-formedinputsinspokenlanguage.Anewmethodforrobustspokenlanguageunderstandin
8、gbasedonconditionalrandomfieldsisproposed.Erroneoustextsareartificiallyaddedinthetrainingdatatotrainthemodelparameters.Experimentsa
此文档下载收益归作者所有