欢迎来到天天文库
浏览记录
ID:32350314
大小:2.88 MB
页数:66页
时间:2019-02-03
《基和web开放领域中文问答系统的研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、太原理工大学硕士研究生学位论文基于Web的开放领域中文问答系统研究摘要从20世纪60年代开始研究人工智能起,研究人员便对问答系统产生了浓厚的兴趣。目前,国外已经出现实用化的面向开放领域的英文问答系统。相比之下,对面向开放领域的中文问答系统的研究还很少。为此,本文提出两种基于Web的开放领域中文问答系统的实现方案。并通过实验对方案的可行性进行了验证。’第一种方案:我们预先建立一种基于知网的新的问题分类体系。在问题分析阶段,检索式生成模块会根据用户问题的类型,产生一个可供Google搜索引擎使用的检索式。在信息检索阶段,Googl
2、e搜索引擎根据检索式找到相关文档,并从中随机抽取若干篇文档作为相关文档集。在答案抽取阶段,候选答案选择模块使用知网知识库与命名体识别技术相结合的方法,从相关文档集中抽取出候选答案,然后利用Google搜索引擎的查询统计结果对每个候选答案进行验证。最后,将可信度最大的候选答案作为最佳答案返回给用户。第二种方案:这种方法不需要预先建立问题分类体系。在问题分析阶段,我们首先确定问句的目标词,然后结合汉语框架网络的句子库,通过分析问句中的短语类型和句法功能,确定用户答案的语义类型,并在此基础上构造检索式。在信息检索阶段,Google搜
3、索引擎利用构造好的检索式,找到相关文档,并随机抽取若干篇文档作为相关文档集。在答案抽取阶段,太原理工大学硕士研究生学位论文候选答案选择模块通过分析相关文档集中有关句子的语义,抽取出候选答案,然后利用Google搜索引擎的查询统计结果对每个候选答案进行验证,将可信度最大的候选答案作为最佳答案返回给用户。两种方案最大的区别就是检索式的构造方法不同。本文的创新点在于:提出一种能够在现有技术条件下实现的,基于知网的问题分类体系。关键字:汉语框架网络,知网,开放领域,中文问答系统太原理工大学硕士研究生学位论文RESEARCH0NOPEN
4、—DOMAINCHINESEQUESTIONANSWERINGSYSTEMBASEDONWEBABSTRACTSincethe1950swhenartificialintelligenceinitiallywasresearched,thequestionansweringsystemsdrewmuchattentionoftheresearchers.Atpresent,appliedEnglishopen—domainquestionansweringsystemshaveemerged.Onthecontrary,the
5、researchesonChineseopen-domainquestionansweringsystemsarerelativelylaggard.HenceinthispapertwoschemesofChineseopen-domainquestionansweringsystemsbasedonWebarepresented,andthefeasibilityofthemareverifiedthroughtexperiments.Inthefirstscheme,firstlyanewquestionclassifi
6、cationarchitecturebasedonHowNetisestablished.Inthestageofquestionanalyse,accordingtothetypeofthequestionquery—generationmodulegeneratesonequerywhichcanbeusedbyGoogle.Inthestageofinformationretrieval,GoogleusesthequerytogetthecorrelatiVedocuments.thenextractssomedocu
7、mentsasthecandidatedocuments.Inthestageofanswerextraction,thecandidateanswerschoosingmodulecombinesHowNetandNamedEntityIdentificationtechniquetoextractthecandidateanswersfromthecandidatedocuments.FinallyeverycandidateanswerwillbeverifiedthroughthequeryresultsoftheGo
8、ogleandtheIII太原理工大学硕士研究生学位论文candidateanswerwhichhasthehighestreliabilitywillbethereturnedasthebestanswer.Inthesecondschemewhichdoesn’tneed
此文档下载收益归作者所有