浅论基于事实性问题中文问答系统的研究与实现

浅论基于事实性问题中文问答系统的研究与实现

ID:34790984

大小:1.09 MB

页数:42页

时间:2019-03-10

浅论基于事实性问题中文问答系统的研究与实现_第1页
浅论基于事实性问题中文问答系统的研究与实现_第2页
浅论基于事实性问题中文问答系统的研究与实现_第3页
浅论基于事实性问题中文问答系统的研究与实现_第4页
浅论基于事实性问题中文问答系统的研究与实现_第5页
资源描述:

《浅论基于事实性问题中文问答系统的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、山西大学硕士学位论文基于事实性问题中文问答系统的研究与实现姓名:陈玉申请学位级别:硕士专业:计算机应用技术指导教师:李国臣20060501摘要随着网络信息的膨胀,网上大量可用信息对于回答用户的各种问题变成了具有吸引力的资源。基于关键字查询的网络搜索引擎,通常会对用户的提问返回成百上千个文档,而用户为了得到与自己需求相关的信息,通常会花费很多精力来进行手工查找。对比传统的依靠输入关键字进行检索的搜索引擎,问答系统允许用户以自然语言方式输入问句进行检索,同时问答系统会对用户的问题给出一个简洁的回答。简言之,目前常见的搜索引擎(如Google)对于用户的

2、问题查询返回的结果比较冗长,相对而言问答系统被认为是比较有潜力的搜索工具。自60年代人工智能的早期发展中,研究者们就对自然语言问答技术产生了研究的兴趣。不过,当时由于自然语言处理的困难度,问答系统的研究一直被局限在特殊领域的专家系统。近几年,随着Web的发展,再加上信息检索技术及自然语言处理技术的提高,这吸引了很多人去开发问答系统,这种系统能够通过检索Web文档库来回答用户以自然语言方式提出的问题。另外这种问答系统可以回答很多领域方面的问题,再加之网络资源的特点,系统资源和网络资源能够保持同步更新。本问答系统是基于网络的,同时本系统主要是针对一些基

3、于事实的问题,如“中华人民共和国是什么时候诞生的?”,又如“太原到北京的距离是多少?”,这些问题可以用简单的事实(例如:日期、位置、人物、组织及尺寸等)来回答。本文主要由五部分构成,这几部分的内容概括如下:第一,问答系统的研究现状;第二,介绍了问答系统的种类及与问答系统相关的研究技术;第三,对本文研究的问答系统作了总体的概括与介绍;第四,这部分是本文的重点部分,这部分包括三个步骤,(1)用户问题处理,该模块主要是将用户所提的问题转化成一组关键词提交给搜索引擎进行处理。(2)信息检索,主要是系统使用现有的搜索引擎来为其服务。(3)答案抽取,答案抽取模

4、块负责从检索到的文档中提取候选答案;第五,实验部分,主要包括问句集,评价标准及实验结果。总之,本文的研究结果不仅有重要的理论意义,对实际应用也有一定的参考价值。关键词:问答系统;信息检索;知识库;答案抽取中国分类号:TPl8WiththeexplosionofinformationonInternet,thevastamountsofinformationavailableontheWbridWideW色bmakesitanattractiveresourcesforansweringavarietyofquestionsthatusersmayh

5、ave.Websearchenginesfrequentlyreturnhundredsofthousandsofdocumentsinresponsetoaquery.Inordertofindinformationneeded,usersoftenengageinthelabor-intensivetaskofmanuallyperusing“potentiallyrelevant”documentsreturnedbykeyword—basedsearchengines.Incontrasttothetraditionalsearchengi

6、nedependingonthekeywordstosearch,aquestionanswering(QA)systemsimplyacceptsuserinformationrequestssentencesinnaturallanguageandrespondswithaconciseanswer.Inaword,mostwebsearchenginesatpresent(e.g.,Google)makeitverytedioustolocaterelevantanswerstoaquestion.QAsystembasedonNLPisre

7、cognizedascapabilitywithgreatpotentialSincetheearlydaysofartificialintelligenceinthe60’S,researchershavebeenfascinatedwithnaturallanguagequestionanswering.However,thedifficultyofnaturallanguageprocessing(NLP)haslimitedthescopeofQAtodomain—specificexpertsystems.Inrecentyears.th

8、ecombinationofwebgrowth,improvementsininformationtechnologyan

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。