基于信息抽取问答系统的研究与实现

基于信息抽取问答系统的研究与实现

ID:35177317

大小:5.83 MB

页数:59页

时间:2019-03-20

基于信息抽取问答系统的研究与实现_第1页
基于信息抽取问答系统的研究与实现_第2页
基于信息抽取问答系统的研究与实现_第3页
基于信息抽取问答系统的研究与实现_第4页
基于信息抽取问答系统的研究与实现_第5页
资源描述:

《基于信息抽取问答系统的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、心姑。—;。―%:莽^^置 ̄!/N^良哲也若A姜乂争圓#都C誦硕:t研究生学位论文ii寅資基于信息抽取问答系统的研究与实现痛泣葉.’&一讀11^作春于根指导教师:李晓戈教授淵(劑^):计算机应用技术豁3駭论文日期一霉:二〇六年六月:;t一?。一雲..<带等琴藝霉霉讀纖聲燕屬缉磯11664学号303210033单位代码1分类号TP391密级西安邮电大学硕±研究生学位论文題冲、英文)目基于信息抽取问答系统的研究与实现ResearchandIm

2、plementationofQuestionAnswerSstembasedonInformationExtractiony作者姓名于根指导巧师姓名、职务李晓戈教授学科口类工学学科(专业)计算机应用技术提交论文日期二〇—六年六月摘要摘要目前世界正处在一个信息爆炸时代,网络资源W几何形式迅速增长。人们可W通过捜索引擎很容易从互联网上获取信息,但是由于传统的搜索引擎仅关键词组合进一堆网页等缺点行检索巧其返回的结果是,导致传统搜索引擎已经不能够满足人们的信息检索需求。问答系统融合信息检索

3、和自然语言处理等技术的优点,通过W自然语言形式的问句作为输入,采用自然语言处理技术深层次分析用户的检索意图,然后根一据意图从知识库中定位答案,而,最后直接将答案抽取出来不是堆相关的网页。所一W问答系统是种能更好地满足人们信息检索需求的方式。一本文对问答系统的关键技术进行了研究,并且实现了个基于信息抽取技术的问答系统,主要工作如下:一第、信息抽取引擎研究。本文系统抽取引擎分为自然语言处理和信息抽取两部、分,自然语言处理实现分词词性标注、语义分析等,信息抽取实现命名实体识别和实体关系抽取。命名实体和实体关系对本系统的问题

4、分析和答案提取有重要影响,并且信息抽取引擎伴随着问答系统的整个过程。第二、问题分析。本文提出利用关键词抽取、命名实体识别及命名实体间关系识别等信息抽取技术分析问题:,将问题划分为H类实体关系型、实体型和关键词型。对于实体关系型和实体型问句,还可W根据具体的实体关系或实体,将问句进斤更加细致的分类。第H、答案抽取。本文提出了基于层次法的答案提取算法,按照实体关系型今实体型今关键词型层顺序获得短语级和句子级答案集,利用基础特征(相同关键词频度,关键词间距,最长字符串匹配)、命名实体匹配和实体关系匹配恃征进行重排序,获

5、得最佳答案。并且对于实体关系型问题,通过匹配问题和候选答案的实体关系S元姐,直接获得答案。第四、系统实现。设汁并实现了基于信息抽取问答系统。利用Lucene实现建立,adoo平台上索引和査找并且部署在Hp,提高了建立索引和査找的速率。关?词:问答系统;信息抽取;实体关系;命名实体;层次法IABSTRACTABSTRACT*Theworldisinaneraofinformationexplosion也enetworkiesourcesrowingbthe,gyformofgeom

6、etric.PeoplecaneasilyobtaininformationfromtheInternetthrouhthegsearchengine.Howeverowningtotheshortagesoftraditionalsearchengineonlysearchingbykeywords,andtheresultsreturnedwith过bunchofwebpages,sotraditionalsearcheninehasalreadycould

7、notsatisfypeopledemand仿rinformatio打retrieval.gQuestionansweringsystemcombinesinformationretrievalandnaturallanguageprocessingtechnolothrouhtheintheformofnaturallanuaeuestio打sasinutgy,gggqp,u'snaturaanuaerocessntechnooeetoanasssersretrevaingl

8、lggpiglgydplylyiofuiltttrtttentonofuser化ocatethe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。