基于lucene的搜索引擎设计与实现

基于lucene的搜索引擎设计与实现

ID:33750458

大小:212.52 KB

页数:4页

时间:2019-02-28

基于lucene的搜索引擎设计与实现_第1页
基于lucene的搜索引擎设计与实现_第2页
基于lucene的搜索引擎设计与实现_第3页
基于lucene的搜索引擎设计与实现_第4页
资源描述:

《基于lucene的搜索引擎设计与实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第14卷第10期微机发展Vol.14No.102004年10月MicrocomputerDevelopmentOct.2004基于Lucene的搜索引擎设计与实现高琰,谷士文,谭立球,费耀平(中南大学信息科学与工程学院,湖南长沙410075)摘要:当今搜索引擎已经成为人们在网上搜索信息的重要工具。通用的搜索引擎虽然功能强大,但对具有很多子网站的企业门户网站进行搜索时响应速度慢,索引范围不全。Lucene是一个强大的全文索引引擎工具包,应用它可以快速地开发一个搜索引擎。文中描述了利用基于Java的

2、全文检索工具包Lucene开发定制的中文搜索引擎方法,并且将该定制的搜索引擎与Google的站内搜索进行试验比较,发现在对具有很多子网站的企业门户网站进行搜索时有优于Google的性能。关键词:Web;搜索引擎;Lucene中图分类号:TP391.3文献标识码:A文章编号:1005-3751(2004)10-0027-04DesignandImplementationofSearchEngineBasedonLuceneGAOYan,GUShi2wen,TANLi2qiu,FEIYao2ping

3、(InformationScienceandEngineeringCollegeofCentralSouthUniversity,Changsha410075,China)Abstract:SearchengineisanimportanttoolforpeopletosearchonInternet.Althoughthegeneralsearchengineshavestrongfunctions,theycan’tsatisfiedthisneedofsearchinginaportals

4、itewithmanysub-sites.ThisarticledescribeshowtodevelopasearchengineforourneedquicklybasedonLucenewhichisapowerfull-textretrievaltools.AndcomparedwithGooglebyexperiment,thecustom-builtsearchenginebasedonLucenehasbetterperformanceinsearchingininformatio

5、nportalhavingmanysites.Keywords:Web;searchengine;Lucene[1]0前言接口等四个部分组成。在过去几年里,Internet的资源迅速增长,使Web发a.搜索器的功能是在互联网中漫游,发现和搜集信展成为包含多种信息资源、站点遍布全球的海量信息服务息。它常常是一个计算机程序,日夜不停地运行。它要尽网络。同时,也有越来越多的机构、团体和个人在Internet可能多、尽可能快地搜集各种类型的新信息,同时因为互用搜索引擎查询信息。作为一个门户网站来说,提供

6、给用联网上的信息更新很快,所以还要定期更新已经搜集过的户搜索服务,是吸引用户访问网站的重要手段。目前许多旧信息,以避免死连接和无效连接。网站建立搜索引擎服务通常通过调用诸如Google或百度b.索引器的功能是理解搜索器所搜索的信息,从中抽的搜索服务,来实现对本站点的搜索。但是对于一个有很取出索引项,用于表示文档以及生成文档库的索引表。多子网站的企业门户网站来说,通用搜索引擎存在着很多c.检索器的功能是根据用户的查询在索引库中快速缺陷,满足不了这种搜索服务要求,如:尽管Google等搜检出文档,进

7、行文档与查询的相关度评价,对将要输出的索引擎提供对指定站点内的查询,但是不能同时对多个站结果进行排序,并实现某种用户相关性反馈机制。点同时查询;通用搜索引擎不能及时更新索引,会导致搜d.用户接口的作用是输入用户查询、显示查询结果、索结果不全和出现“坏链接”;调用通用搜索引擎的响应速提供用户相关性反馈机制。主要的目的是方便用户使用度慢。因此研究一个由企业自主定制的搜索引擎,具有重搜索引擎,高效率、多方式地从搜索引擎中得到有效、及时要的意义。文中采用Lucene的开发工具包,实现了一个的信息。全文搜

8、索引擎。2Lucene简介1搜索引擎的结构描述[2,3]Lucene不是一个完整的全文索引应用,而是一个通常,一个搜索引擎由搜索器、索引器、检索器和用户用Java写的全文索引引擎工具包,它提供了多个API函收稿日期:2004-02-19数与灵活的数据存储结构(可以定制),可以方便地嵌入到作者简介:高琰(1973—),女,江苏宜兴人,博士研究生,研究方向各种应用中实现针对应用的全文索引/检索功能。它是为信息检索。APACHE基金会jakarta的一个子项目。·28·微机发展第14卷2.1Lucen

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。