基于solr的海量数据并行索引及搜索缓存研究

ID：35058687

大小：5.92 MB

页数：62页

时间：2019-03-17

资源描述：

《基于solr的海量数据并行索引及搜索缓存研究》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、巧一？ｒ．＞分类号密级ＵＤＣ编号．颖ｉ学位论文基子Ｓｏｌｒ的緣量教ｉｓ拜巧杀引义披条缓存研義学位申请人姓名；裕化泽申请学位学生类别：全巧網硕壬申请学位学科专业：计鼻机软件与理冷指导教师姓名：王抹平到教援硕去学位论文ｆＭＡＳＴＥＲＳＴＨＫＳＩＳｊ硕±学位论文基于Ｓｏｌｒ的海量数据并行索引及搜索缓存研究论文作者：巧江泽指測巧：王林平副搬学科专业：计巧凡软件与理论研究方向：移动Ｗｅｂ应用华中师范大学计觀学院２０１

2、６年５月硕去学位拖文’ＨＥ？ＭＡＳＴ械《ＴＳＩＳＲｅｓｅａｒｃｈｏｎＰａｒａｌｌｅｌＩｎｄｅｘｉｎｇａｎｄＣａｃｈｅｏｆＳｅａｒｃｈｉｎｗｉｔｈＭａｓｓｉｖｅｇＤａｔａｂａｓｅｄｏｎＳｏｌｒＡＴｈｅｓｉｓＳｕｂｍｉｔｅｄｉｎＰａｒｔｉａｌＦｕｌｆｉｌｌｍｅｎｔｏｆｔｈｅＲｅｑｕｉｒｅｍｅｎｔＦｏｒ化ｅＭ．ＳＤｅｇｒｅｅｉｎＣｏｍｐｕｔｅｒＳｏｆｔｗａｒｅａｎｄＴｈｅｏｒｙＢｙＭｅｉＪｉａｎｇｚｅＰｏｓｔｇｒａｄｕａｔｅＰｒ

3、ｏｇｒａｍＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒＣｅｎｔｒａｌＣｈｉｎａＮｏｒｍａｌＵｎｉｖｅｒｓｉｔｙＳｕｅｒｖｉｓｏｒ：ＷａｎＬｉｎｉｎｐｇｐｇ八＾ｎ＾ＡｃａｄｅｍｉｃＴｉｔｌｅ：ＡｓｓｏｃｉａｔｅＰｒｏｆｅｓｓｏｒＳｉｎａｔｕｒｅ＾／ｇｙＡｒｏｖｅｄｐｐＭａ．２０１６ｙ硕去学位论文ＴＥＲ’ＳＴＳ：ＭＡＳＨＥＷ＊华中师沧大学学佐＾＾丈為准１性若巧和使用狡权化明廣准１牲京巧，本人郑重声明：所呈交的学位论文，是本人在导师指导下独立进行研究工作

4、所取得的硏究成果。除文中己经标明引用的内容外，本论文不包含任何其他个人或集体己经发表或撰写过的研究成果。对本文的研巧做出贡献的个人和集体，均已在文中Ｗ明确方式标明。本声明的法律结果由本人承担。／／作者签名：＾化日期：以年文月３／日学侄冷文狀权使用换权书本学位论文作者完全了解学輔关保留、使用学位论文的规定，即：学腕权保留并向国家有关部口或机构送交论文的复印件和电子版，允许论文被查阅和借阅。本人授权华中师范大学可从格本学位论文的全部或部分内容编入有库进行检索，可Ｗ采用影印、缩印或扫描等复制手段

5、保存和汇编本学位论文。同意华中师范大学可Ｗ用不同方式在不同媒体上发表、传播学位论文的全部或部分内容。来扛作者签名：如叫导师签名：方碑又／日期：ｉ：年ｊ月日日期：《年ｉ月ｉ；本＂＂人已经认真阅读ＣＡＬＩＳ高校学位论文全文数据库发布章程，同意将本人＂＂＂＂的学位论文提交ＣＡＬＩＳ髙校学位论文全文数据库中全文发布，并可按章程一年中的规定享受相关权益。同意论义播々后滞后＝□半巧：□＝□二年发布。作者签名：撕ｉ导师签名：节妹爭日期：ｗ／年女月Ｖ日日期：）＜？＜年＾：月日硕去学位论文

6、’ＭＡＳＴＥＲＳＴＨＥＳＩＳ巧要随着互联网信息技术的快速发展，企业信息化程度不断提高，各个行业内的数据信息急剧増长，而且信息的存在形式也越来越多样。这也使得如何使用户能够快速、精确的从企业的海量数据中找出所需要的关键信息变得越来越重要，而解决这一个问题的关键就是搜索引擎技术。随着开源企业级搜索应用服务器Ｓｏｌｒ的出现，越来越多的企业开始构建Ｗ此为基础的海量数据搜索服务系统。传统的捜索方式是使用文本数据库，虽然文本数据库和捜索引擎的技术基础都是全文检索技术，但是文本数据库在处理海量数据方面

7、的能力无法跟搜索引擎相媳美。搜索引擎采用服务器集群和分布式计算的策略，能够处理较大的数据量。在海量数据的背景下，如何更好地利用开源Ｓｏｌｒ捜索引擎服务器搭建起快速高效一的捜索引擎也成为重要的研究课题之。本文针对这种需求，在基于Ｓｏｌｒ捜索引擎服务器的基础上，进行海量数据捜索服务的研巧。本文首先分析搜索引擎服务器集群的运行特点，运用随机过程中的排队模型对集群系统的可用性进行分析。接着在可用性的基础上深入研究搜索引擎的索引构建和捜索索引两个关键过程。索引构建的过程是将文本转化为能够被搜索引擎捜

8、索的索引文件。本文在分析的基础上提出并行索引的方式，将文档构建索引过程中的部分串行操作并行化，并通过性能负载均衡的策略提高各节点，应对海量数据构建索引的场景的资源利用率，加速索引的构建。对于搜索的ｌ。，ｒ的捜索过程模型将频繁捜索的热过程本文首先分析Ｓｏ，提出分级缓存模型点数据放置在缓存中，，并对缓存数

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 62



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于solr的海量数据并行索引及搜索缓存研究

基于solr的海量数据并行索引及搜索缓存研究

相关文章

相关标签