参考基于lucene本地搜索程序概要设计

参考基于lucene本地搜索程序概要设计

ID:19895724

大小:398.00 KB

页数:46页

时间:2018-10-07

参考基于lucene本地搜索程序概要设计_第1页
参考基于lucene本地搜索程序概要设计_第2页
参考基于lucene本地搜索程序概要设计_第3页
参考基于lucene本地搜索程序概要设计_第4页
参考基于lucene本地搜索程序概要设计_第5页
资源描述:

《参考基于lucene本地搜索程序概要设计》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于lucene本地搜索程序概要设计指导老师:组名:所属院系:专业:班级:完成日期:摘要随着因特网的迅猛发展,搜索引擎提供导航服务己经成为互联网上非常重要的网络服务。利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现了索引器、检索器、中文分析器等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给户所需要的信息。关键词:搜索引擎;网络爬虫;Lucene;HeritrixABSTRACTWiththerapiddev

2、elopmentoftheInternet,thesearchengineprovidesnavigationserviceshavebecomeveryimportantnetworkserviceontheInternet.UsingLuceneopensourcefulltextsearchtechnologyframeworktobuildfull-textretrievalsystem,designedforindexers,Retrievers,ChineseAnalyzermodu

3、le,completedanapplicationbasedontheLucenesearchengine,improvedfull-textsearchbasedonLucenesystembettersupportfortheChineseandbeamoreaccurateinformationprovidedtouserneedskeywords:searchengine;webcrawler;Lucene;Heritrix目录摘要2ABSTRACT2前景4产品介绍5第1章设计概述6第2

4、章开发与运行环境72.1开发环境的配置72.2运行环境的配置72.3需求概述8第三章总体设计93.1软件描述93.2处理流程93.2.1文档搜索处理流程93.2.2多媒体及图像搜索处理流程103.3功能结构设计103.3.1搜索文件格式筛选功能结构103.3.2搜索范围功能结构103.4接口设计103.4.1本地方法113.4.2报告编程错误123.4.3异常处理123.5数据结构设计123.5.1逻辑结构设计123.6关键技术133.6.1搜索143.6.2索引143.6.3多级缓存14第四章

5、界面设计及响应时间154.1界面设计154.2系统响应16第五章出错处理设计175.1出错输出信息175.2出错处理对策17第六章安全保密设计186.1设计原则186.2安全保密方案设计的总体框架196.3安全保密方案设计步骤196.4初级阶段的安全控制计划206.5开发阶段的安全控制设计21第七章维护设计22致谢23参考文献2446前景随着信息技术不断发展、互联网信息不断丰富,搜索引擎的发展速度也越来越快,目前仅Google收录的网页就超过80亿。伴随着搜索引擎的飞速发展,相应的瓶颈问题也开始

6、出现:索引数据库越来越大,需要的维护成本越来越高;索引数据源单一,通常只限于文本内容;索引缺乏通用性和灵活性等等。而Lucene具有开放性和易扩展性,对于解决搜索引擎目前的问题有很好的应用价值。本文通过研究设计并开发实现一个小型简单的基于Lucene的本地搜索引擎,来研究Lucene在搜索引擎领域的应用前景。主要工作包括:(1)分析了本地搜索引擎的组成结构和工作原理,在此基础上进行了基于Lucene的本地搜索引擎的整体结构设计,并将系统分为网页搜集子系统、索引检索子系统、查询结果排序子系统等三个

7、模块。(2)针对各个模块的功能进行了设计开发,设计了相关信息的存储机制,并根据搜索引擎的工作原理实现了各模块之间的交互。(3)深入分析并实现了多线程搜集、运用Lucene实现索引和检索、搜索结果的页面优先度计算等等基于Lucene的本地搜索引擎的关键技术。产品介绍1)lucene的索引建立机制不同,在数据库维护的复杂度和性能方面传统本地搜索引擎有很大优势。2)于Lucene并不是一个完整的搜索引擎,而只是提供索引和搜索功能,可以很方便的嵌入到各种应用中实现对应用的索引/搜索功能,这种特点为制定更

8、加灵活的搜索、结果排序策略提供了可能,从而为用户提供更加符合其需求的灵活多变的搜索引擎。463)Lucene是一个开源项目,其排序算法更加透明,搜索结果势必更加客观公正。本文根据以上Lucene的特点来设计开发一个基于Lucene的小型的搜索引擎,研究Lucene在互联网搜索领域的应用前景。第1章设计概述(1)本地文献信息检索是获取知识的捷径。掌握文献信息检索方法与技能,可以帮助人们快、准、全地获取所需知识,最大限度地节省查找时间,使文献信息得以充分的利用。(2)本地文献信息检索是科学研究的向导

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。