资源描述:
《基于Lucene的全文检索系统的研究与实现---毕业论文.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、本科毕业论文基于Lucene的全文检索系统的研究与实现ResearchandImplementationofaChineseSearchEngineBasedonLucene姓名:学号:学 院:软件学院系:软件工程专业:软件工程年级:校内指导教师: 年月摘要随着电子化信息系统与网络通讯技术的蓬勃发展,人们进入了一个信息爆炸的时代。人们在享受获取信息的便捷的同时,也面临着一个如何在海量的数据库信息中准确、快捷地找到有用的信息的问题,因此如何在海量信息中去其糟粕,取其精华,成为了当下的研究热点。面对存储庞大数
2、据量的数据库,管理起来存在诸多的问题,主要体现在索引建立复杂、搜索速度慢,对于特别目标数据搜索的SQL语句复杂。针对这类问题,本文通过对搜索引擎的原理、组成、数据结构和工作流程等方面深入研究的基础上,运用Lucene索引技术来完善以上问题。Lucene采用倒排序法建立索引,并能记录索引与数据之间的映射关系,根据索引命中率高低来实现搜索结果排序。全文先详细介绍了构建基于Lucene的全文检索系统所需的主要技术支持,包括Lucene框架、IK中文分词器、JDBC、SSH架构、JSP,并通过对这些技术的使用,实现
3、一个简单的数据库搜索系统雏形,通过实例验证了基于Lucene的全文检索系统实现的可行性。该系统界面友好、搜索效率高、命中率好,采用面向对象的编程思想使系统具有很好的延伸性和扩展性。具有一定的实用价值和运用前景。关键词:Lucene;数据库;索引;全文检索;VAbstractWiththeelectronicinformationsystemanddevelopmentofnetworkcommunicationtechnologyflourishing,peopleenteredtheeraofaninfo
4、rmationexplosion.Peopleenjoytheconvenienceofaccesstoinformationwhilealsofacingaproblemthatishowtoaccuratelyandquicklyfindtheusefulinformationfromthemassivedatabase,sohowinthemassinformationtoitsdregs,itsessence,becometheimmediatehotspot.Whenmanagingthehuge
5、amountofdatastoredinthedatabase,therearemanyproblems,mainlyreflectedinthecomplexindex-foundingandslowsearch,thetargetdatafortheparticularsearchcomplexSQLstatements.Forsuchproblems,thisarticle,basedonin-depthresearchofsearchengineprinciple,components,datast
6、ructuresandworkflow,useLuceneindexingtechnologytoperfecttheaboveproblems.Luceneindexwithinvertedorderingmethod,andcanrecordthemappingrelationshipsbetweenindexanddata,andarrangesearchresultsbytheindexhitratio.Thisarticleintroducesthekeytechnicalsupportrequi
7、redofbuildingthefulltextretrialsystembasedonLuceneindetail,includingtheLuceneframework,IKAnalyzer,JDBC,SSHframework,JSP,andthroughtheuseofthesetechnologiestoachieveasimpledatabasesearchsystemprototype,thisexampleverifiesthefeasibility,whichistoimplementaLu
8、cenefull-textretrievalsystem.Thesystemisuser-friendly,searchefficiency,hitrateisgood,object-orientedprogrammingideassothatthesystemhasgoodextensibilityandscalability.Ithascertainpracticalvalueandapplicationof