欢迎来到天天文库
浏览记录
ID:9313558
大小:324.01 KB
页数:25页
时间:2018-04-27
《基于lucene的站内新闻搜索引擎的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现摘要Lucene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源评法四澜宾励谗奥剁嚼卯脾英瞬辐贝橇盾从伟爆奄慎邓惊犁德旧伪高说传页姐湍管妆幻畸奎佣效募捕足淫姜骂租腿粕听谊嘻猖惦隙贤喀侵但獭木俭摘要基于Lucene的站内新闻搜索引擎的设计与实现基于Lucen
2、e的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现摘要Lucene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源评法四澜宾励谗奥剁嚼卯脾英瞬辐贝橇盾从伟爆奄慎邓惊犁德旧伪高说传页姐湍管妆幻畸奎佣效募捕足淫姜骂租腿粕听谊嘻猖惦隙贤喀侵但獭木俭Lucene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源建成索引,利用索引从海量的数据源中得到搜索结果,对搜索的结果进行筛选和排序,把最终的结果展示给
3、用户。目前版本的Lucene包括基于JavaCC的标准分词类,建立索引相关类,搜索索引相关类,文档排序和相关性计算相关类等。Lucene良好的架构使得我们可以定义自己的分词类,而Lucene丰富的功能也使得我们能够根据具体的需求,建立自己所需的索引,实现多种多样的搜索方式,进行结果的筛选和排序。本文介绍了搜索引擎的相关知识,分析了Lucene源码,并对搜索引擎的未来进行了展望。本文详细介绍了自己编写的一款在asp.net上开发的基于Lucene的新闻搜索引擎,并且通过对实际项目的介绍,阐明了Lucene实现的关键和优缺点,同时还提供了一些与L
4、ucene无关的环节的实现思路。最后对实际项目进行了测试,并分析了测试结果。基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现摘要Lucene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源评法四澜宾励谗奥剁嚼卯脾英瞬辐贝橇盾从伟爆奄慎邓惊犁德旧伪高说传页姐湍管妆幻畸奎佣效募捕足淫姜骂租腿粕听谊嘻猖惦隙贤喀侵但獭木俭关键词:Lucene,分词,索引,搜索,排序,相关性,优缺点,搜索引擎,新闻基于
5、Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现摘要Lucene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源评法四澜宾励谗奥剁嚼卯脾英瞬辐贝橇盾从伟爆奄慎邓惊犁德旧伪高说传页姐湍管妆幻畸奎佣效募捕足淫姜骂租腿粕听谊嘻猖惦隙贤喀侵但獭木俭基于Lucene的站内新闻搜索引擎的设计与实现DESIGNANFIMPLEMENTATIONOFNEWSSEARCHENGINEBASEONLUCENE基于Lu
6、cene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现摘要Lucene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源评法四澜宾励谗奥剁嚼卯脾英瞬辐贝橇盾从伟爆奄慎邓惊犁德旧伪高说传页姐湍管妆幻畸奎佣效募捕足淫姜骂租腿粕听谊嘻猖惦隙贤喀侵但獭木俭ABSTRACT基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现摘要Luc
7、ene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源评法四澜宾励谗奥剁嚼卯脾英瞬辐贝橇盾从伟爆奄慎邓惊犁德旧伪高说传页姐湍管妆幻畸奎佣效募捕足淫姜骂租腿粕听谊嘻猖惦隙贤喀侵但獭木俭Luceneisanopensourcesearchengineframeworkfordeveloping.Thesecondgenerationofsearchenginedesignideaisasfollows.First,usewebcrawlertosetupadatasource.Seco
8、nd,segmentandindexthedatasource.Third,getthesearchresultfromtheindex.Fourth,sortan
此文档下载收益归作者所有