资源描述:
《基于Lucene索引的数据库全文检索》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第52卷第5期吉林大学学报(理学版)Vol.52No.52014年9月JournalofJilinUniversity(ScienceEdition)Sep2014doi:10.13413/j.cnki.jdxblxb.2014.05.25基于Lucene索引的数据库全文检索岳绍敏,李万龙,王璐,光顺利(长春工业大学计算机科学与工程学院,长春130012)摘要:针对传统数据库检索中检索速度较慢、检索结果不完整、检索结果排列无序等问题,基于全文检索工具Lucene索引的结构,设计一种基于Lucene的数据库索引结构,并提出记录倒排索引链表的概念,使网站不用再按照传统顺序查找方式进行检
2、索,而是以索引库中的关键词进行检索,提高了检索效率.实验结果表明,基于Lucene的数据库全文检索具有查全率高、检索结果排列有序等优点.关键词:倒排索引;Lucene索引;全文检索;索引结构中图分类号:TP39文献标志码:A文章编号:1671-5489(2014)05-0995-06DatabaseFul-lTextRetrievalBasedonLuceneIndexYUEShaomin,LIWanlong,WANGLu,GUANGShunli(CollegeofComputerScienceandEngineering,ChangchunUniversityofTechnolo
3、gy,Changchun130012,China)Abstract:Thetraditionaldatabaseretrievalhasalotofproblems,suchastheslowerretrievalspeed,theincompleteresults,anddisorderlyretrievalresultsandsoon.ThispaperdesignsadatabaseindexstructurebasedontheLuceneindexstructure,thefulltextretrievaltoolandputsforwardtheconceptofrec
4、ordinvertedindexlist.SoWebsitecanberetrievedbythekeywordsintheindexlibrary,notfollowingthetraditionalsequentialsearchway,whichgreatlyimprovestheretrievalefficiency.Atthesametime,experimentalresultsshowthatthedatabaseful-ltextretrievalbased-Lucenehastheadvantagesofhighrecallandtheorderlyretriev
5、alresults.Keywords:invertedindex;Luceneindex;ful-ltextretrieval;indexstructure随着信息化水平的不断提高及Internet的迅速发展,需要存储的数据越来越多,各大网站的信息[1]量不断增长,如具有海量数据的电子商务类网站.目前针对网站的传统数据库检索技术遇到了诸多[2]问题,如检索效率较低、响应时间过长、检索结果与用户的查询意图符合度低、检索结果的信息不完整、检索结果不能按照用户的查询意图进行排序和无法提高用户搜索体验等.信息检索指在信息集合中进行查询,找出符合用户需求的信息.在信息检索技术中,全文检索具[
6、3]有通用性,且最具实用性.全文检索将用户的查询请求与文本中的每个词进行比较,与数据库检索[4]的字段匹配相比,全文搜索引擎的优点是查询全面而充分,可以给用户最全面、最广泛的搜索结果;且全文检索是将用户输入的关键词与索引库内相关信息的索引词进行匹配,与数据库检索的顺序搜索相比,提高了检索效率.收稿日期:2013-12-09.作者简介:岳绍敏(1988—),男,汉族,硕士研究生,从事搜索引擎和智能系统的研究,E-mail:shaomin_yue@163.com.通信作者:李万龙(1963—),男,汉族,博士,教授,从事软件工程与智能系统的研究,E-mail:lwl@mail.ccut
7、.edu.cn.基金项目:吉林省自然科学基金(批准号:20130101060JC)和吉林省教育厅“十二五”科学技术研究项目(批准号:2014132;2014125).996吉林大学学报(理学版)第52卷本文借鉴全文搜索工具Lucene的索引结构,设计一种针对数据库信息的倒排索引结构,构建了基于Lucene的数据库全文检索系统(databaseful-ltextretrievalsystembased-Lucene,DFRS).实验结果表明,DFRS系统显著提高了数据库