全文搜索引擎的设计与实现_毕业论文.doc

全文搜索引擎的设计与实现_毕业论文.doc

ID:13026517

大小:1.85 MB

页数:68页

时间:2018-07-20

全文搜索引擎的设计与实现_毕业论文.doc_第1页
全文搜索引擎的设计与实现_毕业论文.doc_第2页
全文搜索引擎的设计与实现_毕业论文.doc_第3页
全文搜索引擎的设计与实现_毕业论文.doc_第4页
全文搜索引擎的设计与实现_毕业论文.doc_第5页
资源描述:

《全文搜索引擎的设计与实现_毕业论文.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、江汉大学本科毕业论文(设计)作者声明本人郑重声明:所呈交的学位论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。本人完全了解有关保障、使用学位论文的规定,同意学校保留并向有关学位论文管理机构送交论文的复印件和电子版。同意省级优秀学位论文评选机构将本学位论文通过影印、缩印、扫描等方式进行保存、摘编或汇编;同意本论文被编入有关数据库进行检索和查阅。本学位论文内容不涉及国家机密。论文题目:全文搜索引擎的设计与实

2、现作者单位:江汉大学数学与计算机科学学院作者签名:XXX2013年5月20日62江汉大学本科毕业论文(设计)学士学位论文论文题目全文搜索引擎的设计与实现(英文)Full-textsearchenginedesignandImplementation学院数学与计算机科学学院专业计算机科学与技术班级B09082021姓名XXX学号200708202137指导老师YYY2013年5月20日62江汉大学本科毕业论文(设计)摘要目前定制和维护搜索引擎的需求越来越大,对于处理庞大的网络数据,如何有效的去存储它

3、并访问到我们需要的信息,变得尤为重要。Web搜索引擎能有很好的帮助我们解决这一问题。本文阐述了一个全文搜索引擎的原理及其设计和实现过程。该系统采用B/S模式的JavaWeb平台架构实现,采用Nutch相关框架,包括Nutch,Solr,Hadoop,以及Nutch的基础框架Lucene对全网信息的采集和检索。文中阐述了Nutch相关框架的背景,基础原理和应用。Nutch相关框架的出现,使得在java平台上构建个性化搜索引擎成为一件简单又可靠的事情。Nutch致力于让每个人能很容易,同时花费很少就可

4、以配置世界一流的Web搜索引擎。目前国内有很多大公司,比如百度、雅虎,都在使用Nutch相关框架。由于Nutch是开源的,阅读其源代码,可以让我们对搜索引擎实现有更加深刻的感受,并且能够更加深度的定制需要的搜索引擎实现细节。本文首先介绍了课题研究背景,然后对系统涉及到的理论知识,框架的相关理论做了详细说明,最后按照软件工程的开发方法逐步实现系统功能。关键词Nutch、Solr、Hadoop、Lucene、搜索引擎62江汉大学本科毕业论文(设计)AbstractCurrently,therequir

5、ementofcustomizingandthesearchenginemaintenanceislargerandlarger.Fordealingwithsuchenormousnetworkdata,especially,howtostoreitandaccessournecessaryinformationhasbecomesosignificant.However,websearchenginecanhelpustosolvethisproblemwell.This acticle de

6、scribes the principle of full-text search engine,and the process for its design and implementation. This system adopts Java Web platform with B/S model, and also the relative frame of Nutch, including Nutch,Solr,Hadoop, and collection and inspection f

7、or wholenetwork information based on Lucene--the foundation of Nutch. All in all, this text mainly elaborates the backgroud of relative frame, basical principle, and application for Nutch.The appearance of Nutch related framework, makes that building 

8、an personalized search engine based on Java platform to be an simple and reliable way. Nutch is committed to make everyone configure a word-class web search engine easily and low-costly.At present, there are many big companies at home, like ba

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。