主题搜索引擎数据存储与更新的研究与实现

主题搜索引擎数据存储与更新的研究与实现

ID:32970135

大小:1.48 MB

页数:59页

时间:2019-02-18

主题搜索引擎数据存储与更新的研究与实现_第1页
主题搜索引擎数据存储与更新的研究与实现_第2页
主题搜索引擎数据存储与更新的研究与实现_第3页
主题搜索引擎数据存储与更新的研究与实现_第4页
主题搜索引擎数据存储与更新的研究与实现_第5页
资源描述:

《主题搜索引擎数据存储与更新的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、东北大学硕士学位论文主题搜索引擎数据存储与更新的研究与实现姓名:赵海波申请学位级别:硕士专业:计算机应用技术指导教师:刘辉林20070101东北大学硕士学位论文摘要主题搜索引擎数据存储与更新的研究与实现摘要搜索引擎是人们获取海量网络信息的首要工具,是网络研究和应用的关键内容。目前随着Interact信息的爆炸增长以及信息多元化的发展,主题搜索引擎正成为研究热点与发展趋势。本文就中文Web主题信息获取与检索技术进行了一些探讨,深入研究了主题搜索引擎中数据存储与更新技术。本文首先介绍了搜索引擎尤其是主题搜索所涉及到的相关技术、相

2、关理论和假设,及其的研究现状和发展前景。并论述其中数据存储与更新技术的基本理论。在此基础上本文对原型系统中的三种数据类型:URL数据,页面数据和索引数据的存储方式及其数据结构分别进行了设计,重点研究了相对比较复杂的索引数据的文件结构.其次,本文对本原型系统所用的数据更新技术进行了探讨,并提出一种新的主题搜索中的网页更新算法.在对以上两项技术进行研究的基础上,本文简要介绍了一种比较理想的农业主题搜索引擎的系统架构,并重点论述其中数据存储的实现方式及更新算法的实验结果。本原型系统主要面向农业方面,保证了对农业信息的全面收录和及时

3、更新,避免了大量的搜索噪音,提高了检索效率。本文最后总结了所做的研究工作及原型系统的开发经验,并指出了下一步工作的研究方向.关键词:主题搜索引擎:数据更新;数据存储;更新监控.11-东北大学硕士学位论文TheResearchandImplementationofDataStoreandfreshnessinfocusedSearchEngineAbstractSearchenginesarethemostimportantinfo加越joaquerytoolsfromtheWorldWideWebandthekeytothe

4、Intcmctresearchandutilization.FollowingtheWWWinformatinn'sblastedandmultivariantgrowingup,FocusedSearchEnginesarebecomingresearchingfocus.ThisdissertationfocusesonthetopicspecificChinesewebinformationaccessinganditsscreeningtechnology,deeplystudiesthetechnologyofda

5、mStorageandfreshnessinfocusedsearchengine.ThispaperfirstlyintroducestherdativcTechnology,theory,assuming,historyandpresentconditionofsearchengine,espec枷yfocusedsearchengine,anddiscussesthebasictheoryofdataStorageandfreshness.ThispaperdisignstheStorageanddatastructu

6、reofURLdata,pagcdataandindexdata,focusontherelativelycomplexfilestructureoftheindexdata.Secondly,thispaperputforwardan唧incrementalupdatingalgorithm,basedontheresearchondataUpdatingTechnologyofChinesefocusedsearchengineofa卯culturesystem.Onthebasisoftheabovetwotechni

7、ques,thispaperintroducesanidealfi-ameworkforthefocusedsearchengineofagriculturesystem,andfocusesOnthetestresultsofdatastorageandupdate姆fitlun.ThisprototypeSystemisthespecificAgriculturewebinformationsystem,ithashigheraccuracyratethangeneralsearchengines,andquicklyo

8、ffercompleteAgricultureinformation.Atlast,muchexpfricuccofthePrototypeSystemdevelopinganddevelopingWassummed叩andthesystemforegroundWasindicated.K

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。