欢迎来到天天文库
浏览记录
ID:33983236
大小:748.50 KB
页数:36页
时间:2019-03-03
《课程设计(论文)-基于lucene的站内搜索引擎的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、软件分院2009级5班课程设计课程名称:基于Lucene的站内搜索引擎的设计与实现姓名:学号:分院:软件分院2011年10月3项目评分标准评分等级得分平时成绩(20%)态度端正,设计认真,能积极思考,学习纪录好优秀态度较好,较认真,能积极思考学习纪录较好良好态度一般,学习纪录尚可中等态度较差,不够认真,不善于思考纪录较差及格态度差,不认真,纪录差不及格程序设计成绩(40%)程序代码规范,完成所有功能,代码质量高优秀程序代码较规范,完成主要功能,代码质量一般。良好程序代码基本规范,完成部分功能,代码质量较差及格程
2、序代码不规范,完成功能少,代码质量差不及格设计报告成绩(40%)撰写规范,设计思路清晰,知识运用熟练,设计详尽细致,按要求完成设计优秀撰写较规范,设计思路基本清晰,知识运用较熟练,能按要求完成设计良好撰写基本规范,设计思路基本清晰,知识运用尚可,能按要求完成设计中等撰写不规范,设计思路不太清晰,设计不详尽,基本完成设计及格撰写不规范,思路不清晰,知识运用不熟练。没有按要求完成设计不及格总评成绩指导老师:3摘要在互联网蓬勃发展的今天,互联网上的信息更是浩如烟海。人们在享受互联网带来的便利的同时,却面临着一个如何在
3、如此海量的内容中准确、快捷地找到自己所需要的信息的问题,由此互联网搜索引擎应运而生。关键词:搜索引擎;中文分词;索引3TheConstructionofSearchEngineBasedonLuceneandHeritrixAbstractThecontentsontheWebareincreasingexponentiallyastherapiddevelopmentoftheInternet.Aproblemhowtoobtaintheusefulinformationfromvastcontentsqui
4、cklyandaccuratelyisfacinguswhilepeopleareenjoyingtheconvenienceoftheInternet.ThesolverofthisproblemisWebSearchEngine.KeyWords:SearchEngine;ChineseWordSegmentation;Index2目录摘要IAbstractII1绪论11.1项目背景11.2国内外发展现状12系统的开发平台及相关技术32.1系统开发平台32.2系统开发技术32.2.1Lucene技术简介42
5、.2.2Ajax技术简介43系统分析与设计63.1系统需求分析63.1.1系统架构分析63.1.2系统用例模型63.1.3系统领域模型103.2系统概要设计113.3系统详细设计123.3.1索引建立子系统133.3.2用户接口子系统174系统的实现184.1系统包框架的构建184.1.1索引建立子系统184.1.2用户接口子系统194.2系统主要功能实现194.2.1索引建立子系统194.2.2用户接口子系统224.3功能模块代码的实现.....................................
6、..........................................................234.3.1索引的实现..................................................................................................234.3.2搜索的实现..............................................................................
7、.......................254.3.3排序的实现.....................................................................................................254.3.4翻页的实现..................................................................................................272结论28参考文献2
8、9致谢3021绪论1.1项目背景1994年左右,万维网(worldwideweb)出现了。它的开放性和其上信息广泛的可访问性极大的激励了人们创作的积极性。在短短的十几年间,人类至少在万维网上发布了40亿条的网页,并且现在每天都有数以万计的数量增长。由于网络上的资源与生俱来的数字化、网络化,这些特性成为了网络信息的双刃剑:一方面便于我们搜集整理,另一方面也会使我们感到太多蜂拥而至,无所适
此文档下载收益归作者所有