欢迎来到天天文库
浏览记录
ID:33505527
大小:8.95 MB
页数:64页
时间:2019-02-26
《基于internet的问答系统答案抽取方法研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据浙江工业大学硕士学位论文基于Internet的问答系统答案抽取方法研究与实现作者姓名:艾云指导教师:王万良浙江工业大学教育科学与技术学院2014年12月万方数据DissertationSubmittedtoZhejiangUniversityofTechnologyfortheDegreeofMasterResearchonAnswerextractionforInternet--basedQuestionAnsweringSystemCandidate:AiYunAdvisor:WangWanliangCollegeofEducationZhejiangUniversi
2、tyofTechnologyDec2014万方数据浙江工业大学学位论文原创性声明本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。作者签名:日期:劢I忤J多月矽日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被
3、查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密口,在年解密后适用本授权书。2、不保密影(请在以上相应方框内打“√”)作者签名:支麦导师签名:[里,,万厶日期:为¨年p月哆日日期:矽≯噼I朔乃日万方数据浙江工业大学硕士学位论文基于Internet的问答系统答案抽取方法研究与实现摘要随着Internet的快速发展,互联网上的知识资源也在不断的膨胀。然而,网页如此繁杂以至于人们无法快速获取自己想要的信息。搜索引擎的出现,虽然在很大程度上缓解了这个问题,但是效果却不能令
4、人满意。人们对于快速获取信息的强烈需求,使得越来越多的人投入到自动问答系统的研究中。自动问答系统企图不借助任何人力,利用自然语言理解、信息检索、信息抽取等技术,以自动化的方式回答用户的问题。考虑到当今问答系统在网络上的新发展,同时也考虑到构建一个开放领域问答系统的复杂性与系统性,本文将主要研究网页信息抽取、中文问句相似度等。本文试图通过这些方面的研究,为受限领域问答系统做支持,从而实现从网络抽取答案的目标。本研究基于通常的网页抽取方法基础上,提出了一种基于“DOM模板与页面特征信息综合抽取”的方法,具体是从百度知道等网站抽取出用户提问的候选问题及其对应答案集,这相当于将FAQ库从
5、本地扩展到了Intemet,增加了知识的广度与范围,使受限领域问答系统不再局限于特定领域知识的问答。然后,利用中文问句相似度计算等思想找到最相似的问句对应的答案返回给用户,从而实现受限领域的自动回答。本文从基于Internet的问答系统研究的相关背景入手,首先阐述了研究的基础平台,接着详细的分析了网页信息抽取与中文文件相似度的计算,最后重点的对答案抽取系统做了相关实现。关键词:问答系统,网页信息抽取,答案抽取,中文问旬相似度万方数据浙江工业大学硕士学位论文RESEARCHoNANSWEREXTRACTIoNFORINTERNET-BASEDQUESTIoNANSWERINGSYS
6、TEMABSTRACTWiththerapiddevelopmentofIntemet,Intemetknowledgeresourcesisalsoinconstantexpansion.However,webpageSOcomplicatedthatpeopleareunabletoquicklygettheinformationtheywant.Theemergenceofsearchengines,althoughtosomeextentalleviatedtheproblem,buttheeffectisnotjustasonewishes.Thestrongdeman
7、dforrapidaccesstoinformation,moreandmorepeopleintotheresearchofautomaticquestionansweringsystem.Automaticquestionansweringsystemattemptstousewithouttheaidofanyhuman,naturallanguageunderstanding,informationretrieval,informationextractiontechno
此文档下载收益归作者所有