基于lucene搜索系统的研究与实现开题报告

基于lucene搜索系统的研究与实现开题报告

ID:28054161

大小:81.54 KB

页数:7页

时间:2018-12-07

基于lucene搜索系统的研究与实现开题报告_第1页
基于lucene搜索系统的研究与实现开题报告_第2页
基于lucene搜索系统的研究与实现开题报告_第3页
基于lucene搜索系统的研究与实现开题报告_第4页
基于lucene搜索系统的研究与实现开题报告_第5页
资源描述:

《基于lucene搜索系统的研究与实现开题报告》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、毕业设计(论文)开题报告题目:基于Lucene搜索系统的研究与实现系(部)专业_学生学号班号指导教师开题报告日期一、开题报告应包括下列主要内容:1.通过学生对文献论述和方案论证,判断是否已充分理解毕业设计(论文)的内容和耍求2.进度计划是否切实可行;3.是否具备毕业设计所要求的基础条件。4.预计研究过程中可能遇到的困难和问题,以及解决的措施;5.主要参考文献。二、如学生首次开题报告未通过,需在一周内再进行一次。三、开题报告由指导教师填写意见、签字后,统一交所在系(部)保存,以备搜查。指导教师评语:一、课题的背景随着互联网的不断发展和日益普及,目前人们从网上获得信

2、息的主要工異是浏览器,通过浏览器得到信息就需耍登录到某个搜索引擎网站,输入代表自己所关心信息的关键词或者短语,依据返回的相关信息列表、摘要和超链接引导,试探寻找白己需要的内容。正处在一个信息爆炸的吋代。人们可以利用搜索引擎,获得更加全面、详尽的信息,参考性和点拨性都很强。搜索引擎当之无愧是工作中非常完美的助手。如今,越来越多的白领已把获取信息的途径,从直接上门户网站、社区转向了搜索引擎工具。网络搜索的便捷性。据最近发布的消息,美国人2007年网络购物交易额达270亿美元,比上一年高出19个百分点。正因为网上搜购的便捷性,给生活节奏口益加快的人们提供了很大的便利。

3、不用你花吋间去逛街,只需要在电脑上点几下就可以了,而且相同的东丙在网上买还更便宜,因为网上的店不收税,不收房租。网络搜索的服务性。对于人们的生活、工作、休闲等方方面面,搜索引擎的服务性也更加凸显。比如车票的订购、房屋租赁买卖、休闲去所的选择,人们已经更加倾向于在网络上搜索。二、目的和意义在如今的搜索引擎当中,诸如百度一类的大型综合的搜索引擎,都是趋于商业化的发展,都是追求百分之百利益最大化。在搜索引擎的结果排名方面,都是商业化的考虑。所以,为了让用户在最靠前的位置得到最准确的答案,就需要利用网络中一些幵源的工具包,以及技术,并且,研宄出自己的算法,得到一个完全脱

4、离利益的搜索引擎。为的是在学习和实践过程得到知识。三、关键技术与解决方案搜索器:为了在网络中搜集信息,就需要一个适合的网络蜘蛛程序例如:Heritrix、LLarbin、Nutch都是开源的爬虫程序,但各个的策略不同,选择适合的程序,根据自己的需求进行二次开发,在网络屮得到所需的信息。索引器:Lucene不是一个完整的全文索引应用,而是一个用Java写的全文索引引擎工具它可以方便的嵌入到各种应用中实现针对应用的全文索引、搜索功能。此阶段为核心阶段,重要算法的实现都需要利用Luceneo它实现全文索引的时候与数据库之间,我做了相关比较,由于数据库索引不是为全文索引

5、设计的,因此,使用Iike"%keywonl%”吋,数据库索引是不起作用的,在使用like查询时,搜索过程乂变成类似于一页页翻书的遍历过程了,效率也可想而知,由此可以看出模糊查询相对数据库的精确查询是一个非常不确定的问题,这也是大部分数据库对全文搜索支持有限的原因。Lucene最核心的特征是通过特殊的索引结构实现了传统数据库不擅长的全文索引机制,并提供了扩展接口,以方便针对不同应用的定制,所以我选择了lucene代替数据库建立全文索引。Lucene的API接口设计的比较通用,输入输出结构都很像数据库的表记录字段,所以很多传统的应用的文件、数据库等都可以比较方便的

6、映射到Lucene的存储结构/接口中。总体上看:可以先把Lucene当成一个支持全文索引的数据库系统。用户接口:AJAX创建搜索引擎前端界面,创建交互式网页应用的网页开发技术O系统基本情况描述由于本课题重在研究索引器中算法的实现,对于如何使蜘蛛程序,中文分词分析等相关内容,只从理论上进行分析,不会再次实现相关算法。,还会有一些关于如何量化用户体验UE理论上的实现。最终会实现一个的小型的搜索引擎。本课题实现将具有管理功能,前端模式类似与百度的搜索网站,同时也会新增一些新的功能。本课题研究的是基于文件的搜索引擎,不涉及数据库.1、搜索器:其功能是在互联网中漫游,发现

7、和搜集信息;2、索引器:其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表;3、搜索器:其功能是根据用户的奔询在索引库中快速搜索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息;4、用户接口:其作用是接纳用户查询、显示查询结果五、系统模块设计1、搜索器,即信息采集模块:其功能是在互联网屮漫游,发现和搜集信息;2、索引器,即全文索引模块:其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表;3、搜索器,即查询信息模块:其功能是根据用户的查询在索引库中快速搜索文档,进行

8、相关度评价,对将耍输出的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。