基于百科的中文知识搜索系统的设计与实现

基于百科的中文知识搜索系统的设计与实现

ID:21893049

大小:2.76 MB

页数:164页

时间:2018-10-25

基于百科的中文知识搜索系统的设计与实现_第1页
基于百科的中文知识搜索系统的设计与实现_第2页
基于百科的中文知识搜索系统的设计与实现_第3页
基于百科的中文知识搜索系统的设计与实现_第4页
基于百科的中文知识搜索系统的设计与实现_第5页
资源描述:

《基于百科的中文知识搜索系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于百科的中文知识搜索系统的设计与实现DESIGNINGANDBUILDINGACHINESEKNOWLEDGESEARCHSYSTEMBASEDONENCYCLOPEDICKNOWLEDGE姚静哈尔滨工业大学2011年6月国内图书分类号:TP391.3学校代码:10213 国际图书分类号:681.37密级:公开工程硕士学位论文基于百科的中文知识搜索系统的设计与实现硕士研究生:姚静导师:刘秉权副教授申请学位级别:工程硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2011年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.3School

2、code:10213 U.D.C:681.37SecretLevel:openDissertationfortheMasterDegreeinEngineeringDESIGNINGANDBUILDINGACHINESEKNOWLEDGESEARCHSYSTEMBASEDONENCYCLOPEDICKNOWLEDGECandidate:YaoJingSupervisor:AssociateProf.LiuBingquanAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyAffil

3、iation:SchoolofComputerScienceandTechnologyDateofDefence:June,2011Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工程硕士学位论文摘要随着互联网的发展,使用搜索引擎进行信息查找已经成为人们日常生活的一部分。人们只需要输入查询关键词,搜索引擎就可以将互联网上最匹配的网页链接返回给用户。但是搜索引擎并不能直接返回答案,用户还需要从返回的链接中寻找所需要的信息。早在人工智能技术刚开始的时候,人们就开始思考如何让计算机用自然语言来回答人的问题,这种技术被称

4、为自动问答系统。由于当初的技术和资源受限,相关研究一直限制在特殊领域。随着Web2.0技术的发展,越来越多的人向互联网上分享信息,其中最具代表性的就是Wikipedia这类在线百科全书。现在Wikipedia上已经聚集了海量的知识数据,这些数据的出现为实现更加智能的通用领域自动问答系统提供了可能。本文将在此方面进行尝试,设计并实现一个基于百科的通用的知识搜索系统,用户可以使用自然语言问答的方式进行查询,系统直接返回百科网站上具有的答案。主要研究内容包括以下几个方面:第一、设计了三层体系结构的知识搜索系统方案,使用本体库作为百科网站和知识搜索中间层。一个更加智能的知识搜索系统需要一个便于机器理

5、解的知识表现形式,本文研究了如何使用了本体库这种知识表现方法作为知识搜索系统的数据存储方式。第二、设计了基于多个百科网站的本体库构建方法。基于单个百科网站的本体库构建已经出现了一些优秀的成果和基本的构建方法,但基于多个百科网站构建本体库却少有人问津。本文首先对若干个百科网站分别构建本体库,然后将这些本体库合并为一个。第三、对基于本体库的知识搜索方法进行了研究,并提出一种基于本体对象的多层倒排索引的知识检索方法。多层倒排索引充分考虑了本体库知识表示的层次性,按照本体库中知识的类别将将整个索引分成两层,通过这种层次关系,使检索过程更加直接。第四、设计并实现了完整的知识搜索系统。整个系统分成百科网

6、站收集子系统、本体库构建子系统、索引子系统、检索子系统以及用户接口子系统。关键词:知识搜索;Wikipedia;本体库;倒排索引-I-哈尔滨工业大学工程硕士学位论文AbstractWiththedevelopmentoftheInternet,findinginformationthrowsearchengineshasbecomesapartofpeople’severydaylife.Theusersonlyneedtoenteraquerykeyword,andthensearchenginesreturnthebestmatchedpagelinksfromtheWeb.Butsea

7、rchenginescannotreturnthedirectanswers.Usersneedtofilterthelinkstofindtheneededinformation.Asearlyasthebeginningofartificialintelligencetechnology,peoplestartthinkingabouthowtomakecomputerdirectlyanswerpeop

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。