基于nosql的分布式存储系统相关算法改进与性能优化

基于nosql的分布式存储系统相关算法改进与性能优化

ID:35057975

大小:5.43 MB

页数:65页

时间:2019-03-17

基于nosql的分布式存储系统相关算法改进与性能优化_第1页
基于nosql的分布式存储系统相关算法改进与性能优化_第2页
基于nosql的分布式存储系统相关算法改进与性能优化_第3页
基于nosql的分布式存储系统相关算法改进与性能优化_第4页
基于nosql的分布式存储系统相关算法改进与性能优化_第5页
资源描述:

《基于nosql的分布式存储系统相关算法改进与性能优化》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、02700学校代码:1分类号:TP393学号:13221041上单啼絶乂多硕dt学位论文基于NoSQL的分布式存储系统相关算法改进与性能优化学院;信烏与机由工稻学協专业;计篡机软件与强论硏究方向:数据挖掘硏究生姓名:'2^—指导教师:協海化副教擾r完成日期:2016年3月论文独创性声明本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文中除了特别加标注和致谢的地方外,不包含其他人或机构己经发表或撰写过的研巧成果。其他同志对本研究的启发和所做的贡献均己在论文中做了明确的声明并表巧了谢意。作者签备

2、日期心W度少拜)中论文使用授权声明本人完全了解上海师范大学有关保留、使用学位论文的规定:学校有权,即保留送交论文的复印件,化许论文被查阅和偉阅;学校可W公布论文的全部或靖分内容,可采用影印、缩印或其它手段保存论文。保密的论文在解密后遵守此规定。作者签名导师签名;細日期:肺d;茄/巧甲上海师范大学硕士学位论文摘要摘要随着网络存储系统的快速发展,基于分布式存储的应用正经历着前所未有的高速发展,需要存储大量数据的网站、云服务等得以普及。然而这些数据目前集中部署在单节点存储设备上,随着数据规模的扩大,单台主机的资源并不能容纳大规模的数据。由于后续扩容成本昂贵,因此迫切需

3、要引入分布式存储系统来解决大数据的存放和访问问题。同时随着电子商务的发展以及Web2.0技术在网络应用的广泛应用,传统的关系型数据库不能满足对当今数据的存储要求。NoSQL数据库是对关系型数据库的补充,通过简单数据模型、元数据以及应用数据分离和弱一致性等技术,实现对大数据的有效管理。基于以上,本文主要研究基于NoSQL的分布式存储中的数据分布、数据压缩和及存储格式问题,在分析总结国内外相关研究的基础上,提出了基于Redis改进的一致性哈希算法和基于Hive的性能优化研究,并以Redis在排行榜问题中的应用为背景,对Redis进行了有效的性能分析与评测。主要的研究工作如下:(1)基于Redis

4、改进的一致性哈希算法,为了解决分布式存储系统中的数据均衡问题,提高算法在应用实践时的可靠性、可用性等特性。通过对Redis存储节点进行逻辑划分成一个组,组内采用主从模式可以提高分布式存储的一致性和可靠性,并分析了同一个组内不同读写策略的数据一致性。当组内主节点宕机时,利用从节点的备份数据以及主从切换可以及时对外提供集群服务。通过实验证明,该算法能有效地降低读写操作平均响应时间和提高系统吞吐量,使分布式存储系统负载更为均衡。(2)基于Hive的性能优化研究,为了解决分布式存储系统中文件系统的数据压缩和存储格式问题,通过对MapReduce作业调度和Hive性能调优两个方面对Hive的性能进行优

5、化研究。对于MapReduce主要从编程模型切入,分析其执行过程,并从map端、reduce端进行参数调优。接着从Hive框架角度入手,分别从分区表和外部表以及常用数据文件的压缩、行式存储与列式存储等方面进行深入研究。实验结果表明,snappy压缩、orcfile/parquet存储格式可以对于列式查询场景提高查询效率。关键词:NoSQL,分布式存储系统,一致性哈希,数据压缩,存储格式IAbstractShanghaiNormalUniversityMasterofScienceAbstractWiththerapiddevelopmentofthenetworkstoragesystem,

6、basedontheapplicationofdistributedstorageisexperiencinganunprecedentedrapiddevelopment,theneedtostorealargenumberofdatasites,cloudservices,etc..However,thesedataarecurrentlydeployedinasinglenodestoragedevices,withtheexpansionofthescaleofdata,asinglehostofresourcesandcannotaccommodatelarge-scaledata

7、.Asthesubsequentexpansionofthecostisexpensive,itisurgentneedtointroduceadistributedstoragesystemtosolvetheproblemoflargedatastorageandaccess.Atthesametime,withthedevelopmentofelectroniccommerceandthewideapp

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。