基于搜索引擎的中文自动问答系统的设计与实现

基于搜索引擎的中文自动问答系统的设计与实现

ID:35181113

大小:2.59 MB

页数:63页

时间:2019-03-21

基于搜索引擎的中文自动问答系统的设计与实现_第1页
基于搜索引擎的中文自动问答系统的设计与实现_第2页
基于搜索引擎的中文自动问答系统的设计与实现_第3页
基于搜索引擎的中文自动问答系统的设计与实现_第4页
基于搜索引擎的中文自动问答系统的设计与实现_第5页
资源描述:

《基于搜索引擎的中文自动问答系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文图书分类号:TP391密级:公开UDC:004学校代码:10005硕士学位论文MASTERALDISSERTATION论文题目:基于搜索引擎的中文自动问答系统的设计与实现论文作者:赵洁学科:计算机科学与技术指导教师:蒋宗礼论文提交日期:2016年6月UDC:004学校代码:10005中文图书分类号:TP391学号:S201307036密级:公开北京工业大学工学硕士学位论文题目:基于搜索引擎的中文自动问答系统的设计与实现英文题目:DESIGNANDIMPLEMENTATIONOFCHINESEAUTOMATICQUESTIONANSWERINGSYSTEMBASEDONSEAR

2、CHENGINE论文作者:赵洁学科专业:计算机科学与技术研究方向:计算机软件与理论申请学位:工学硕士指导教师:蒋宗礼教授所在单位:计算机学院答辩日期:2016年6月授予学位单位:北京工业大学独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:赵洁日期:2016年6月24日关于论文使用授权的说明本人完全了解北京

3、工业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)签名:赵洁日期:2016年6月24日导师签名:蒋宗礼日期:2016年6月24日摘要摘要我们处于一个信息极其丰富的时代,人们对于快速准确地获取信息产生极大的需求。搜索引擎以其使用方便、反应迅捷而备受人们欢迎,成为信息获取的最主要方式。然而搜索引擎以关键词的检索方式很难清晰表达用户的意图,并且以网页集合的方式返回结果仍然需要用户自己手动查找答案。因此自动问答系统应运而生,但是传统的自

4、动问答系统存在信息覆盖不全面、更新不及时的缺陷,并且需要维护一个庞大的知识库。为了发挥两者的优势,本文拟将两者结合起来,设计与实现一个改进的基于搜索引擎的中文自动问答系统。本文的主要工作如下:(1)改进SiteQ算法,提出Topic-SiteQ算法:首尾段落和首尾语句对语义有着较大的贡献,本文将其以恰当权重融入SiteQ算法,提出关联首尾段落和首尾语句的多特征融合段落检索算法Topic-SiteQ:采用多特征融合的算法计算首尾语句的语义相似度,并以一定的权值体现它们对段落相关度的贡献,同时提高首尾段落的评分值,最后根据该评分值进行段落排序并返回候选段落集。(2)改进基于语义依存树

5、的答案抽取算法:基于语义依存树的答案抽取算法主要对语义和语法结构进行考察,考察方式单一不够全面。词频作为重要的语义特征之一,应该在答案抽取算法中体现该特征。本文对基于语义依存树的答案抽取算法进行改进,将关键词出现的频率考虑进去,利用对数线性模型将两者融合在一起,提出改进的基于语义依存树的答案抽取算法。(3)设计并实现了一个改进的基于搜索引擎的中文自动问答系统,并根据改进的两个算法对该系统进行优化。先是详细的分析了系统的需求,然后描述系统的总体结构并给出系统结构图。在详细设计与实现部分,分模块详细论述各个模块的功能、处理流程、实现细节以及使用的核心算法及其改进。(4)为了验证提出的

6、优化方法的有效性,人工构建问题测试集对算法和系统的改进效果进行实验,计算两个算法改进前后以及系统使用改进后的算法的MRR值、查准率、召回率和F1值并进行对比分析。实验结果表明,算法的改进效果良好,使用改进的算法后系统性能有所提高。关键词:问答系统;SiteQ;多特征融合;语义依存树;答案抽取-I-AbstractAbstractHowtoquicklyandaccuratelyobtainthenecessaryinformationfromthemassofinformationhasbecomeanimportantissue.Thesearchengineispopular

7、becauseofitsconvenientandquickresponsecharacteristics,andbecomethemostimportantwayofinformationacquisition.However,itisdifficulttoclearlyexpresstheintentionoftheuserthatsearchenginesretrieveinformationwithkeywords.Ontheotherhand,itstillneedst

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。