基于分布式表示的汉语问答系统

基于分布式表示的汉语问答系统

ID:35178716

大小:2.46 MB

页数:63页

时间:2019-03-20

基于分布式表示的汉语问答系统_第1页
基于分布式表示的汉语问答系统_第2页
基于分布式表示的汉语问答系统_第3页
基于分布式表示的汉语问答系统_第4页
基于分布式表示的汉语问答系统_第5页
资源描述:

《基于分布式表示的汉语问答系统》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于分布式表示的汉语问答系统CHINESEQUESTIONANSWERINGSYSTEMBASEDONDISTRIBUTEDREPRESENTATION张瑞鹏哈尔滨工业大学2016年6月国内图书分类号:TP391.2学校代码:10213国际图书分类号:681.37密级:公开工学硕士学位论文基于分布式表示的汉语问答系统硕士研究生:张瑞鹏导师:赵铁军教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.2U.D.C:681.37Dissertatio

2、nfortheMasterDegreeinEngineeringCHINESEQUESTIONANSWERINGSYSTEMBASEDONDISTRIBUTEDREPRESENTATIONCandidate:ZhangRuipengSupervisor:Prof.ZhaoTiejunAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:Ju

3、ne,2016Degree-Conferring-Institution:HarbinInstituteofTechnology摘要摘要问答系统可以视为信息检索问题的一种特殊形式。给定一个文档集合,一个问答系统致力于找到这个使用自然语言形式提出来的问题的答案。问答是一个多学科的课题,它包括了信息技术,人工智能,自然语言处理,知识和数据管理和认知科学。从技术的角度来说,问答系统使用了自然的或者统计的语言处理技术,信息检索技术,知识表达和推理技术作为潜在的构建模块。它包括了文本分类,信息抽取和总结技术。一般上讲,问答系统有三个部分:问题分类,信息抽取,答案抽取,这些成分扮演着

4、不可或缺的角色在问答系统中。问题分类扮演者初级的角色在问答系统中,依据问题中实体的类型来分类问题。信息检索技术通过他们智能的问答系统抽取可应用的答案来获得一种识别的上的成功。最后,提出主题从答案抽取模块中,而这些模块通常需要排序操作,并验证候选答案。本课题的研讨内容有以下几个方面:(1)本文研究了不同粒度语义单位的分布式表达,从词语,短语,句子到段落和篇章。本文介绍了分布式语义表示的概念,比较了不同种类的构造分布式表的方法,并比较了各种方法的优劣。现有的语义分布式表示学习主要侧重于词和短语的表示学习,对于句子和篇章的分布式表示学习方法还处于开始阶段。(2)本文研究基于知识

5、库的问答系统。语义知识库对于构架问答系统来说必不可少,而目前获取语义知识大多数来源于结构化数据,且大部分集中于英语方面,在汉语语义知识如何获取方面还要进一步的探索。由于不同种语言的知识库之间是相互独立的,因此多语言知识库的融合方法也值得探讨。本文构架了本系统所需要的关于地理方面的汉语知识库,由大量从百科中抽取到三元组组成。(3)本文将语义分布式表示加入融合到基于知识库的问答系统中,把问题句子和候选答案同时转化成分布式语义表示的向量,训练时通过梯度下降算法使得问题和正确答案在语义空间上相似度更大。进一步的工作致力于使用结构更复杂,学习能力更强的神经网络来提高系统表现。通过实

6、验表明,使用语义分布式表达结合到基于知识库的问答系统中,将问题和候选答案通过神经网络映射到同一个向量空间,来计算空间上的语义相似度,取得了比较不错的结果。关键字:语义分布式表达;知识库;问答IAbstractAbstractQuestionansweringsystemisakindofspecialtypeandformofinformationretrieval.Givenacollectionofdocuments,aquestionansweringsystemiscommittedtofindtheanswerstoquestionsraisedinnatura

7、llanguage.Q&Aisamulti-disciplinarysubject,itincludesinformationtechnology,artificialintelligence,NaturalLanguageProcessing,knowledgeanddatamanagementandcognitivescience.Fromatechnicalpointofview,thequestionansweringsystemusesnaturalorstatisticallanguageprocessing,in

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。