欢迎来到天天文库
浏览记录
ID:5365175
大小:334.48 KB
页数:4页
时间:2017-12-08
《基于lucene.net的分布式全文检索系统》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第26卷第9期计算机应用与软件Vo1.26No.92009年9月ComputerApplicationsandSoftwareSep.2009基于Lucene.Net的分布式全文检索系统谭文堂贺明科李阜(国防科学技术大学信息系统与管理学院湖南长沙410073)摘要随着互联网的发展,现代信息量急剧增加,人们对于信息的检索要求越来越高,一个好的检索系统必须具有较快的检索速度和较高的查准率。针对海量文本数据提出一种基于Lucene.Net全文检索引擎构建的分布式全文检索系统,使用.NETRemoting实现分布式的全文索引与全文检索,具有较好的扩展性和很快的索引与检索速度
2、,并成功地将该技术应用于军队某部信息管理系统,取得了很好的效果。关键词Lucene.Net.NETRemoting分布式全文检索全文索}DISTIUBUTEDFULL-TEXTSEARCHSYSTEMBASEDoNLUCENE.NETTanWentangHeMingkeLiFu(SchoolofInformation跏ternsandManagement,NationalUniversityofDmeTechnology,changsha41O073,Hunan,China)AbstractAlongwiththedevelopmentofInternet,theq
3、uantityofmodeminformationincreaserapidly,therequirementofinformationsearchingfrompeoplebecomesmoreandmoreexigent,anexcellentsearchingsystemmustsearchquicklyandaccurately.Thispaperproposesadistributedfull—textsearchsystembasedonLucene.Netfull—textsearchengineformassivetextdata.Wechoose.
4、NetRemotingframeworktoimplementdistributedfull—textindexandsearch,thissystemhasexcellentexpansibilityandhighspeedinindexingandsearching.Our印-proachisvalidatedintheinformationmanagementsystematamilitarydept.KeywordsLucene.Net.NETRemotingDistributedFull—textsearchFull—textindex二次开发,目的是能够
5、在.Net环境下应用Lucene的强大的全文0引言索引和检索功能。它提供了简单的函数接口,可以方便地嵌入到各种应用中实现全文索引与检索功能。随着现代社会信息量的急剧增长,各种以Internet为载体的1-1Lucene.Net的组成电子信息愈来愈多,如何有效、快速、准确地在海量信息中查找图1为Lucene.Net组成结构图。所需要的信息,已经成为人们的重要需求。全文检索是一种非常有效的信息检索技术,它使人们可以在各种文本中搜索包含指定关键字的文本。全文检索极大地提高了从海量数据中检索或查找特定信息的速度和效率。全文检索经历了单机、C/S结构到B/S结构的发展历程。随
6、着Interact的飞速发展,基于B/S结构的全文检索技术正得到日益广泛的应用。相对C/S结构来说,B/S具有瘦客户机、易于升级与管理、具有较高的鲁棒性能等特点,但是很难实现复杂的业务和满足文本处理、分析等需求。本文基于Lucene.NET和.NETRemoting研究并实现了一种面向海量文本数据的分布式全文检索系统,把Lueene.NET的索引和检索功能封装为.NETRemoting对象,使用.NETRe—moting对分布的远程对象进行集成,实现分布式的全文索引与图1Lucene.Net组成结构图检索。实验说明本系统实现了海量文本的快速索引和检索,适Lucene
7、.Net.Index模块主要实现索引文件的读写接口,合于门户网站及部门问等的海量文本资源的检索。通过扩展,通过该模块可以实现索引文件的创建和添加、删除以及读写等。系统可以适应C/S和B/S这两种应用需求。Lucene.Net.Search模块主要提供了检索接口。通过该模块可以输入检索条件,得到查询结果集,与lmcene.Net.QueryParserLucene.Net全文检索引擎收稿日期:2008—05—10。谭文堂,硕士生,主研领域:信息资源管Lucene.Net是基于Apache基金会jakarta的项目Lueene的理,分布式系统。第9期谭文堂等:基于L
此文档下载收益归作者所有