基于lucenenet的全文检索研究与应用

基于lucenenet的全文检索研究与应用

ID:18931600

大小:313.40 KB

页数:3页

时间:2018-09-27

基于lucenenet的全文检索研究与应用_第1页
基于lucenenet的全文检索研究与应用_第2页
基于lucenenet的全文检索研究与应用_第3页
资源描述:

《基于lucenenet的全文检索研究与应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、-LW326基于Lucene.Net的全文检索研究与应用(ASP.NET毕业设计)[摘要]:·信息技能的飞速发展和互联网的遍及,使得电子文档、各种信息数据库等数字资源疾速增长,越来越呈现出海量的特色。怎么从海量的信息中疾速、精确地查找用户感兴趣的信息,已成为当时信息范畴研讨的一个热门。全文检索技能可以高效地完成对海量数据的疾速查询,它经过索引程序对原始文本中的每个词进行扫描、树立索引并指明其在文本中呈现的方位和次数,用户在检索数据时,检索程序对索引文件进行查找并把查询成果反馈给用户,这样就大大提高了检索的速度和功率。跟着

2、信息体系运用的不断深化,其存储和办理的数据也越来越多,传统的根据数据库字段的查询方法已不能满意需要,用户迫切需要经过全文检索方法来方便地检索信息体系中的事务信息,因而怎么将全文检索技能与信息体系相联系已成为信息体系开发中面对的一个重要问题。Lucene.Net是一个高性能的开源全文检索东西库,具有十分显着的面向对象的特色,供给了简略且功用强大的接口,开发人员可以方便地把它集成到运用程序中去来结构个人的全文检索体系。本文对Lucene.Net进行了深化的研讨,然后联系两个信息办理体系中全文检索功用的需要,描绘和开发了相应的

3、全文检索体系。论文首要作业包含以下三点:一、在深化分析Lucene.Net作业原理的基础上对其功用进行了扩大,对分词器的中文分词功用进行改善,优化了索引树立功率和检索成果排序;二、当时信息体系数据的安全性越来越受用户的注重,重要的数据需要加密保管在数据库中,可是传统的全文检索体系不能完成对加密数据的全文检索。对准当时解决方案的缺乏,本文根据Lucene.Net在数据拜访层之上构建了全文检索引擎,在数据加密入库的一起对其树立索引文件,并完成加密数据和索引文件的相关,在确保数据安全的基础上高效地完成了全文检索功用,满意了用户

4、的需要;三、在信息体系的实践运用中,各个部门服务器上的数据存在两种存储形式:根据文件体系的存储和根据数据库办理体系的存储,而且各数据源有着高度的自治性,所以在全文检索体系的描绘时还要运用一种一致的形式来对多个数据源进行查询。本文根据Lucene.Net和SOA架构描绘和完成了分布式的全文检索体系,为各个不一样的数据源树立一致格局的索引文件,然后运用户可以有效地对多个部分数据源所同享的信息进行查询。体系也完成了对用户大局数据查询恳求的分发,对各个部分数据源中的数据进行全文检索,并把查询成果汇总后的成果集回来给用户,满意了信

5、息体系全文检索运用中新的实践需要。 [关键字]:·全文检索Lucene.Net安全信息分布式[目录]·摘要10—12ABSTRACT12—141、绪论14—201.1研究背景和意义14—151.1.1课题研究背景14—151.1.2研究意义151.2研究现状及发展趋势15—181.2.1全文检索研究现状15—171.2.2全文检索发展趋势17—181.3论文的研究内容及组织结构18—201.3.1论文的研究内容18—191.3.2论文的组织结构19—202、全文检索理论与相关技术20—302.1全文检索基本原理20—22

6、2.1.1索引202.1.2检索20—212.1.3全文检索框架21—222.2全文检索相关理论22—262.2.1正排索引22—232.2.2倒排索引23—242.2.3性能指标24—262.3中文分词技术26—292.3.1基于字符串匹配的分词方法26—272.3.2基于统计的分词方法272.3.3基于理解的分词方法27—282.3.4三种分词方法的比较28—292.3.5中文分词中的难题292.4本章小结29—303、基于Lucene.Net的全文检索关键技术研究30—453.1开源全文检索工具包Lucene.Ne

7、t30—363.1.1Lucene.Net架构30—313.1.2功能模块分析31—343.1.3索引文件分析34—353.1.4数据流分析35—363.2Lucene.Net优化与改进36—443.2.1中文分词器DBRGAnalyzer36—413.2.2索引优化41—433.2.3检索结果排序改进43—443.3本章小结44—454、安全信息全文检索引擎的设计与实现45—594.1应用背景454.2引擎框架设计45—474.3引擎实现47—564.3.1文档解析47—494.3.2索引49—534.3.3数据加密5

8、3—544.3.4检索54—554.3.5权限过滤55—564.4应用实例56—584.4.1系统功能概述56—574.4.2系统功能实现57—584.5本章小结58—595、基于SOA的分布式全文检索59—695.1应用需求分析59—605.2基于SOA架构的分布式全文检索系统设计60—635.2.1系统框架61—

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。