基于Lucene的大文档集合索引机制 ——文档索引的分析、设计和实现-任务书

基于Lucene的大文档集合索引机制 ——文档索引的分析、设计和实现-任务书

ID:30005538

大小:41.50 KB

页数:4页

时间:2018-12-25

基于Lucene的大文档集合索引机制 ——文档索引的分析、设计和实现-任务书_第1页
基于Lucene的大文档集合索引机制 ——文档索引的分析、设计和实现-任务书_第2页
基于Lucene的大文档集合索引机制 ——文档索引的分析、设计和实现-任务书_第3页
基于Lucene的大文档集合索引机制 ——文档索引的分析、设计和实现-任务书_第4页
资源描述:

《基于Lucene的大文档集合索引机制 ——文档索引的分析、设计和实现-任务书》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、毕业论文任务书题目:基于Lucene的大文档集合索引机制——文档索引的分析、设计和实现目标要求:索引器的工作就是为Spider抓取的网页建立全文检索索引,因此索引器是整个搜索引擎系统至关重要的一个环节。全文检索索引的目的在于为每个切出来的词建索引,查询时就只需要遍历索引,而不需要遍历正文,从而极大地提高检索效率。本文将在对搜索引擎基本概念,搜索引擎发展历程剖析的基础上,对搜索引擎中的索引模块的索引组织方法,索引模块的基本原理进行探究,进而通过对Lucene源码关键部分的剖析,理解Lucene的系统组织结构、索引

2、数据库的文件结构,从而利用LuceneAPI函数,实现索引器的批量索引与增量索引以及索引的删除,实现了搜索引擎的索引部分的功能,最后利用luke软件对索引器生成的索引进行检验和测试,完成搜索引擎构建中索引部分的编程要求。支持条件:1、硬件支持:PC微机一台,MobileIntel(R)4-MCPU2.2GHz,512MB内存2、软件支持开发工具:Eclipse3.3.1.1开发平台:WindowsXP,Java,jdk1.5.0开发插件:lucene测试工具:Luke指导教师(签名)职称学生(签名)分阶段进度安

3、排阶段起讫时间计划完成内容12008年2月18日-3月31日阅读文献资料,理解任务,完成开题报告22008年4月1日-4月15日资料收集、完成系统整体设计32008年4月16日-5月5日代码编写,实现主要功能42008年5月6日-5月15日对系统功能进行测试52008年5月16日-6月2日论文撰写、论文答辩注:一般可分为资料文献搜索、拟定方案(提纲)、试验或初稿、定稿等阶段教师分阶段指导记录第一阶段:指导完成论文题目的选定,并提供给相应的课题材料用于参考与分析,并明确参考文献的查找范围。第二阶段:讲解这次项目的

4、要求和目的,指导提出总体解决方案;指导完成开题报告。第三阶段:对代码编写进行指导,对期间遇到的问题,提供咨询和帮助。明确划分该同学的模块和同一小组的其他同学模块。第四阶段:指导该同学对整个程序进行分析和测试,该程序达到了预期的目标,保证了准确性。第五阶段:指导该同学进行论文的修改,定稿。论文评语拟评成绩校外指导教师(签名)职称校内指导教师(签名)职称2008年月日论文评阅评阅成绩评阅教师(签名)职称2008年月日答辩记录演示成绩答辩成绩答辩小组组长(签名)职务(称)2008年月日总评成绩学院负责人(签盖)200

5、8年月日

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。