基于lucene的站内新闻搜索引擎的设计与实现

基于lucene的站内新闻搜索引擎的设计与实现

ID:9313558

大小:324.01 KB

页数:25页

时间:2018-04-27

基于lucene的站内新闻搜索引擎的设计与实现_第1页
基于lucene的站内新闻搜索引擎的设计与实现_第2页
基于lucene的站内新闻搜索引擎的设计与实现_第3页
基于lucene的站内新闻搜索引擎的设计与实现_第4页
基于lucene的站内新闻搜索引擎的设计与实现_第5页
资源描述:

《基于lucene的站内新闻搜索引擎的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现摘要Lucene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源评法四澜宾励谗奥剁嚼卯脾英瞬辐贝橇盾从伟爆奄慎邓惊犁德旧伪高说传页姐湍管妆幻畸奎佣效募捕足淫姜骂租腿粕听谊嘻猖惦隙贤喀侵但獭木俭摘要基于Lucene的站内新闻搜索引擎的设计与实现基于Lucen

2、e的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现摘要Lucene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源评法四澜宾励谗奥剁嚼卯脾英瞬辐贝橇盾从伟爆奄慎邓惊犁德旧伪高说传页姐湍管妆幻畸奎佣效募捕足淫姜骂租腿粕听谊嘻猖惦隙贤喀侵但獭木俭Lucene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源建成索引,利用索引从海量的数据源中得到搜索结果,对搜索的结果进行筛选和排序,把最终的结果展示给

3、用户。目前版本的Lucene包括基于JavaCC的标准分词类,建立索引相关类,搜索索引相关类,文档排序和相关性计算相关类等。Lucene良好的架构使得我们可以定义自己的分词类,而Lucene丰富的功能也使得我们能够根据具体的需求,建立自己所需的索引,实现多种多样的搜索方式,进行结果的筛选和排序。本文介绍了搜索引擎的相关知识,分析了Lucene源码,并对搜索引擎的未来进行了展望。本文详细介绍了自己编写的一款在asp.net上开发的基于Lucene的新闻搜索引擎,并且通过对实际项目的介绍,阐明了Lucene实现的关键和优缺点,同时还提供了一些与L

4、ucene无关的环节的实现思路。最后对实际项目进行了测试,并分析了测试结果。基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现摘要Lucene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源评法四澜宾励谗奥剁嚼卯脾英瞬辐贝橇盾从伟爆奄慎邓惊犁德旧伪高说传页姐湍管妆幻畸奎佣效募捕足淫姜骂租腿粕听谊嘻猖惦隙贤喀侵但獭木俭关键词:Lucene,分词,索引,搜索,排序,相关性,优缺点,搜索引擎,新闻基于

5、Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现摘要Lucene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源评法四澜宾励谗奥剁嚼卯脾英瞬辐贝橇盾从伟爆奄慎邓惊犁德旧伪高说传页姐湍管妆幻畸奎佣效募捕足淫姜骂租腿粕听谊嘻猖惦隙贤喀侵但獭木俭基于Lucene的站内新闻搜索引擎的设计与实现DESIGNANFIMPLEMENTATIONOFNEWSSEARCHENGINEBASEONLUCENE基于Lu

6、cene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现摘要Lucene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源评法四澜宾励谗奥剁嚼卯脾英瞬辐贝橇盾从伟爆奄慎邓惊犁德旧伪高说传页姐湍管妆幻畸奎佣效募捕足淫姜骂租腿粕听谊嘻猖惦隙贤喀侵但獭木俭ABSTRACT基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现基于Lucene的站内新闻搜索引擎的设计与实现摘要Luc

7、ene是一个开源的用于制作搜索引擎的框架。目前第二代搜索引擎的设计思路为利用网络爬虫建立数据源,结合分词技术把数据源评法四澜宾励谗奥剁嚼卯脾英瞬辐贝橇盾从伟爆奄慎邓惊犁德旧伪高说传页姐湍管妆幻畸奎佣效募捕足淫姜骂租腿粕听谊嘻猖惦隙贤喀侵但獭木俭Luceneisanopensourcesearchengineframeworkfordeveloping.Thesecondgenerationofsearchenginedesignideaisasfollows.First,usewebcrawlertosetupadatasource.Seco

8、nd,segmentandindexthedatasource.Third,getthesearchresultfromtheindex.Fourth,sortan

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。