分布式信息检索系统的优化设计和实现

分布式信息检索系统的优化设计和实现

ID:35047151

大小:6.25 MB

页数:77页

时间:2019-03-17

分布式信息检索系统的优化设计和实现_第1页
分布式信息检索系统的优化设计和实现_第2页
分布式信息检索系统的优化设计和实现_第3页
分布式信息检索系统的优化设计和实现_第4页
分布式信息检索系统的优化设计和实现_第5页
资源描述:

《分布式信息检索系统的优化设计和实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Sou化ChinaUniversityofTechnology工程硕±学位论女分布式信息检索系统的仇化设计和实现作者姓名洪瑞埼工程领域计算机技术校内指导教师董守斌教授校外指导教师邹杜高级工程师所在学院计算机科学与工程论文提交日期2016年3月—jTheOptimizedDesignandImplementationofDistributedInformationRetrievalSystemADissertationSubmittedfort

2、heDegreeofMasterCandidate:HongRuiqiSupervisor:Prof.DongShoubinS.E.ZouDuSouthChinaUniversityofTechnologyGuangzhou,China分类号:TP39学校代号:10561学201321的0763华南理工大学硕±学位论文分布式信息检索系统的优化设计和实现作者姓名:洪瑞巧申请学位级别:工程硕±工程巧巧名称:计算机技术校巧指导巧师姓名、职称:董守巧巧授校外指导教师姓名、职称:邹杜巧级

3、工程师论文形式:□产品研发□工程设计用研兜□工程/项目管理□调研报告研兄方向:计算机应用技术论文提交曰期:年多月日论文答辩曰期主月曰f:年学位授予单位:华南理工大学学位授予日期:年月曰答辩委员会成员:主席:韩国强委员:李拴清巧灿张化咸高昭昇—I?臣fejeWJia—1-f华蘭理工大学学位论文原创性声明,、本人郑巧芦明:所星交的论义是本人巧帅的化yI独治:化行研贫£所。除了义中惦别加W标化引"j的内巧外,木论文小包會fr取得的研殆

4、成驳;何其他个人或集体已经发衣或撰巧的成采化扯。对木义的硏究做山總化如献的个人和樂体,巧己巧文中W明确方式标明。木人宛个热m巧木卢明的化佈巧果由本人承巧。作者签名>2 ̄.U;口期:年i乃学位论文版权使用授权书本学位论文作薪完全了解学校巧义保脚、使川巧化论文的规巧,叩:研巧生在校攻读学位期间论文:!.权:化的知识产权中位M华桐巧:1火巧。巧校扣保存并向国家有关部口或机构这交论文的巧印件巧化子版,化巧巧位论文被査阅(除在保密期内的保帘论文外):学校WLU公化学位论义的全部或

5、部分內容,可允许采用影巧、缩印或巧它茲制乎?段做佑、汇编学位论文。---致本人电子文巧的内容和纸质论文的内容相。本学□位论文属于:保不密,在年解密后适用本按权书。9保密,同愈在校园网上发布,供校冉师生和与学校巧巧巧协议的单位浏览;同意将本人学位论文提交中間学术期刊(化盘版)电子杂志社全文出版和编入CNKI《中闽知识资源总库》,化揣学位论义的金部或部分巧容。*""(请在上相应方框内巧V)作者签名::^兵^^赛長哀日期:;^/^.^^指导教师签名:日期吨.摘要传

6、统搜索引擎采用集中式的信息爬取和索引方式,对网络上深层内容、动态内容和私有内容的处理具有一定局限性。分布式信息检索则能够更好的适应对各种异构资源的检索。它可以对多种来源的信息进行有效的整合和处理,提供更为多样化的检索服务。其检索流程可分为资源描述、资源选择、查询分发和结果融合四个阶段。其中查询分发阶段会伴随着大量的网络通信,使用一般的IO模型和通信方式会造成较大的开销,因此需要进行特殊的设计。此外,检索系统还需要具备良好的可扩展性,以便处理异构的资源和多样化的查询需求。服务注册、服务管理、服务发现和服务监控等

7、基础设施对于分布式系统的稳定运行也起着关键的作用。本文的工作重点即是设计和实现一个高效、稳定、可扩展的分布式信息检索系统。主要包括以下几个部分:(1)分布式信息检索系统的整体架构设计,根据分布式信息检索的特点,划分系统的功能模块,分析和选择系统所使用的IO模型和通信方式。(2)设计和实现系统的服务注册、服务管理、服务发现和服务监控等基础组件,保证系统各节点服务间的访问和通信能够稳定、可靠的进行。(3)在系统的核心检索模块中,定义资源选择、查询分发和结果融合的接口,并实现相应的算法。设计和实现插件机制,以支持对

8、核心检索模块算法和功能的灵活扩展。实现资源选择和查询分发的缓存功能,以提升系统的吞吐量,减少查询的响应时间,节约带宽。(4)建立中央抽样库,保存各个资源库的抽样文档,以支持资源选择过程。实现查询抽样工具,基于资源库的检索接口,对资源库进行查询抽样,并将结果导入中央抽样库中。(5)对系统的功能和性能进行测试,比较和分析系统在不同查询参数、资源库响应时间、资源库数量以及不同并发数下的性能变化情况。关键词

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。