试论internet问答系统的实现与评测

试论internet问答系统的实现与评测

ID:34824863

大小:1.32 MB

页数:51页

时间:2019-03-11

试论internet问答系统的实现与评测_第1页
试论internet问答系统的实现与评测_第2页
试论internet问答系统的实现与评测_第3页
试论internet问答系统的实现与评测_第4页
试论internet问答系统的实现与评测_第5页
资源描述:

《试论internet问答系统的实现与评测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、饭旦大学硕士学位论文Y’70b92Internet问答系统的实现与评测院系:信息科学与工程学院专业:’计算机应用技术姓名:游斓指导教师:黄萱菁副教授指导小组:吴立德教授黄萱菁副教授牛军钰副教授摘要Internet的飞速发展使得每个人都置身于一片信息的海洋。面对排山倒海的文字信息,搜索引擎成为人们检索信息的最主要工具。人们在搜索文档时,总会在心里怀着一些问题,即使是像Google这样优秀的搜索引擎,仍然无法仅通过一两次查询就为人们心中的问题找到答案。而自动问题回答系统的出现解决了人们的这一困扰。FDUQA系统是一个基于Internet的自动问题回答系统。用户只需在它的We

2、b界面上输入问题,系统就会从网上找到该问题的答案和支持答案的文字片断。系统首先对问题进行详尽分析,然后利用Internet作为庞大的语料库搜索答案所在的文档,最后从候选的文档中抽取出确切的答案并评价答案的优劣。本文对FDUQA系统的每个模块都进行了详细的介绍并逐一评测,同时也考察了查询生成策略对Web检索结果的影响,分析了Web检索模块、候选答案抽取模块、答案验证和排序模块的精度损失及其错误原因。另外,最为一个实用的系统,响应速度也被作为一个重要的考察指标。本文在5.3节又提出一个提高系统速度的有效方法,使得FDUQA系统在实际使用中能够获得效率和精度的平衡。关键词:问

3、题回答信息检索自然语言处理中图分类号:TP3AbstractWithquickdevelopmentofInternet。everyoneneedstofacetonsofinformation.Searchenginesbecamethemostimportanttooltoretrieveinformation.Whenpeopleretrieveweb,theyalwayshavesomequestioninthemind.Theyreorganizetheirquestionsintoaseriesofqueriesforsearchengines.Buteve

4、nwithagreatsearchengineasGoogle,peoplecannotfindtheanswerbyonlyoneortworequests.Nowanautomaticquestionansweringsystemcanreallyhelpthem.FDUQAsystemissuchaquestionansweringsystemthatuserscaninputtheirquestiononawebpage,thenthesystemwillfindsomeanswersandthesnippetssupportingthemfmmIntemet.

5、Thebriefprocessisthatsystemwillfirstanalyzethequestion,thenretrievedocumentswhichmaycontainanswersfrOmweb.finallyanswerswilIbeextractedfromdocumentsandwilIbescoredaccordingtotheircorrectness.1nthispaper.wewill

6、ntroducethemodulesinFDUQAonebyeone.Experimentsweredonetoanalyzetheinfiuenceofq

7、uerygenerationonwebretrievalandthelOSSofeachmodule.1naddition.asapracticalsystem,wealsotestitsresponsetime.Insection5.3。animprovedmethodissuggestedtorealizeatradeoffbetweentimeandsystemprecision.Keywords:QuestionAnswering,InformationRetrieval,NaturaLanguageProcessing复旦大学硕士学位论文Interact问答系

8、统的实现与评测第1章引言1.1自动问题回答系统在当今信息爆炸的时代,人们面I临了这样一个问题:如何从堆积如山的电子文档中获取自己感兴趣的部分。一般米说,人们在搜索文档时,总会在心里怀着一些问题,比如某人想知道地球到火星的距离是多少(HowfarisitfromEarthtoMars?),他也许就会去寻找含有“fromEarthtoMars”词组的文档。然而含有这个词组的文档不一定会包含用户想要的答案,用户往往需要在浏览了大量的文档以后才能找到一个正确的答案,这样的搜索工作费时又费力。自动问题回答系统的出现解决了人们的这一困扰。该系统的目的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。