领域问答系统中问句相似度计算方法研究

领域问答系统中问句相似度计算方法研究

ID:34963624

大小:1.31 MB

页数:69页

时间:2019-03-15

领域问答系统中问句相似度计算方法研究_第1页
领域问答系统中问句相似度计算方法研究_第2页
领域问答系统中问句相似度计算方法研究_第3页
领域问答系统中问句相似度计算方法研究_第4页
领域问答系统中问句相似度计算方法研究_第5页
资源描述:

《领域问答系统中问句相似度计算方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文(工程硕士)领域问答系统中问句相似度计算方法研究RESEARCHONQUESTIONSIMILARITYCOMPUTATIONINDOMAINQUESTIONANSWERINGSYSTEM刘拼拼哈尔滨工业大学2018年6月国内图书分类号:TP311学校代码:10213国际图书分类号:621.3密级:公开工程硕士学位论文领域问答系统中问句相似度计算方法研究硕士研究生刘拼拼导师:韩琦副教授副导师蒋宏飞工程师申请学位:工程硕士学科:软件工程所在单位:计算机学院答辩日期:2018年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP311U.D.C

2、:621.3DissertationfortheMasterDegreeinEngineeringRESEARCHONQUESTIONSIMILARITYCOMPUTATIONINDOMAINQUESTIONANSWERINGSYSTEMCandidate:liupinpinSupervisor:Prof.HanQiAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:SoftwareEngineeringAffiliation:SchoolofComputerScienceDateofDefence:June,

3、2018Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工程硕士学位论文摘要自然语言处理技术作为人工智能领域一大研究方向,已经得到社会各界的高度重视。随着对自然语言处理技术研究的不断深入,自然语言处理技术的研究方向也逐渐细化,包括信息抽取、问答系统、机器翻译、文本生成和文本挖掘技术、语音识别和生成等。问答系统作为新型的信息检索方式,已经成为逐渐自然语言处理领域的研究重点。问答系统的研究一般分为问句理解、信息检索和答案抽取三个部分,而这三者都离不开句子相似度计算,虽然目前人们已经可以利用自然

4、语言处理技术构建各种各样的问答系统,但是问答系统的使用效果却差强人意,而这些问题归根结底是句子相似度计算效果不理想的问题。因而本文主要利用自然语言处理技术对领域问答系统中问答相似度计算方法进行研究。本文主要的创新性工作如下:首先,针对基于词向量的问句相似度计算方法进行改进。改进包括两点内容,一是词向量优化,二是相似度计算方案的改进。其中词向量优化主要优化两个部分,一是近反义词问题的处理,二是未登录词问题的处理。相似度方案改进主要是基于WMD算法基础上,加入词和字的共现信息,从而提高计算的正确率。其次,提出基于深度学习的问句相似度计算。将深度学习应用到问句相似度计算中,

5、主要利用深度学习分类模型选择候选问句集,然后在通过基于词向量的问句相似度方法进行精确匹配。这部分基于LSTM孪生网络分类模型,提出了两种深度学习分类模型包括提出了LSTM+CNN孪生网络模型和CNN+Attention机制的孪生网络模型来提高文本分类的正确率,实验表明两种分类模型对比原先的模型能够在正确率已经达到94%的情况下提高一个百分点达到95%左右。最后基于所提出的算法,开发了一个相似度测试模块,实现了问句相似度算法的测试功能,运行效果表明了改进算法的有效性。实验表明改进基于词向量的问句相似度计算方法正确率相比为改进前正确率提高了6个百分点。通过深度学习选择候选

6、集之后再经过精确匹配,与原先直接应用基于词向量的问句相似度计算方法相比F1值由原来的0.67变成0.84左右,而精度由原来的0.79变成0.85。关键词:问答系统;相似度计算;未登录词;近反义词;深度学习-I-哈尔滨工业大学工程硕士学位论文AbstractNaturallanguageprocessingtechnologyasaresearchdirectioninthefieldofartificialintelligencehasbeenhighlyvaluedbyallwalksoflife.Withthecontinuousdeepeningofnatura

7、llanguageprocessingtechnologyresearch,theresearchdirectionofnaturallanguageprocessingtechnologyisgraduallyrefined,includinginformationextraction,questionansweringsystem,machinetranslation,textgenerationandtextminingtechnologies,speechrecognitionandgeneration,etc.Theemergenceofa

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。