基于lucene的domino数据库全文检索模块的设计与实现

基于lucene的domino数据库全文检索模块的设计与实现

ID:33763047

大小:1.12 MB

页数:89页

时间:2019-02-28

基于lucene的domino数据库全文检索模块的设计与实现_第1页
基于lucene的domino数据库全文检索模块的设计与实现_第2页
基于lucene的domino数据库全文检索模块的设计与实现_第3页
基于lucene的domino数据库全文检索模块的设计与实现_第4页
基于lucene的domino数据库全文检索模块的设计与实现_第5页
资源描述:

《基于lucene的domino数据库全文检索模块的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文(工程硕士)基于LUCENE的DOMINO数据库全文检索模块的设计与实现THEDESIGNANDIMPLEMENTATIONOFLUCENE-BASEDFULLTEXTRETRIEVALMODULEOFDOMINODATABASE刘伟杰2012年10月国内图书分类号:TP311学校代码:10213国际图书分类号:621.3密级:公开工程硕士学位论文基于LUCENE的DOMINO数据库全文检索模块的设计与实现硕士研究生:刘伟杰导师:赵铁军教授副导师:王秀凯工程师申请学位:工程硕士学科:软件工程所在单位:软件学院答辩日期:2012年10月授予学位单位:哈尔滨工业大学Cl

2、assifiedIndex:TP311U.D.C.:621.3DissertationfortheMaster’sDegreeinEngineeringTHEDESIGNANDIMPLEMENTATIONOFLUCENE-BASEDFULLTEXTRETRIEVALMODULEOFDOMINODATABASECandidate:LiuWeijieSupervisor:Prof.ZhaoTiejunAssociateSupervisor:EngineerWangXiukaiAcademicDegreeAppliedfor:MasterofEngineeringSpeciality

3、:SoftwareEngineeringAffiliation:SchoolofSoftwareDateofDefence:June,2012Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工程硕士学位论文摘要随着企业信息化技术的不断发展,各种企业级的业务被整合到统一的集成化办公自动化平台上,这使得同一平台下的业务信息种类和信息量急剧地增加,使得用户在大量的存储数据中寻找有价值信息成为了一个棘手的问题。所以,如何简单、快速、准确地在大量数据中获取到对用户有意义的信息已经成为办公自动化平台开发中不得不

4、面对的问题。而全文检索技术是一种非常符合上述需求的检索方法。为此,全文检索技术在办公自动化平台中的应用逐渐成为了开发人员关注的热点之一。本文主要阐述了如何基于全文检索技术实现办公自动化平台中的搜索功能。本文以Lucene全文检索库为基础,为目前应用比较广泛的办公自动化群件LotusNotes/Domino设计并实现了一个全文检索功能模块。在以往基于Lucene全文检索库开发的应用中,其对中文检索的支持问题一直是不可避免的障碍,本文中基于字符串匹配的技术设计并实现了一个Lucene可用的高效的中文自动分词模块,从而有效地解决了这个问题。另外为了方便快捷地读取待检索的数据,本文中还

5、设计并实现了一个Java端的Domino数据库持久层,使得开发人员和用户可以在Java环境下远程访问Domino数据库,并能够以面向对象的方法来操作Domino数据库中的数据,从而避免了之前访问Domino数据库必须使用Lotus客户端的限制。本文首先对该全文检索模块的需求进行了详细的分析,并介绍了与项目有关的国内外发展状况和相关开发技术。之后对该模块的总体设计,详细设计进行了详细的阐述并给出了相关的核心代码片段,最后对实现的模块进行了测试和性能分析。关键词:Domino数据库;全文检索;中文分词-I-哈尔滨工业大学工程硕士学位论文AbstractAlongwiththedev

6、elopmentofEnterpriseinformationtechnology,avarietyofenterprise-classbusinesswasintegratedintoaunifiedplatformofintegratedofficeautomation.Thismakesthetypeandquantityofbusinessinformationwhichinthesameplatformincreaseddramatically,andmakeUserstofindvaluableinformationinalargenumberofstoreddat

7、abecameathornyissue.Consequently,inthedevelopmentofofficeautomationplatform,howsimply,rapidly,accurategetmeaningfulinformationfrommassdatahasbecometoairremissibleproblem.Thefull-textretrievaltechnologyisasuitablemethodfortheaboverequirements.Theref

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。