基于存储驱动的hadoop节能调度策略研究

基于存储驱动的hadoop节能调度策略研究

ID:35180764

大小:3.97 MB

页数:75页

时间:2019-03-21

基于存储驱动的hadoop节能调度策略研究_第1页
基于存储驱动的hadoop节能调度策略研究_第2页
基于存储驱动的hadoop节能调度策略研究_第3页
基于存储驱动的hadoop节能调度策略研究_第4页
基于存储驱动的hadoop节能调度策略研究_第5页
资源描述:

《基于存储驱动的hadoop节能调度策略研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于存储驱动的Hadoop节能调度策略研究RESEARCHOFTHEENERGY-EFFICIENTSCHEDULERFORHADOOPBASEDONSTORAGEDRIVEN王来哈尔滨工业大学2016年6月国内图书分类号:TP393学校代码:10213国际图书分类号:004.9密级:公开工学硕士学位论文基于存储驱动的Hadoop节能调度策略研究硕士研究生:王来导师:翟健宏副教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学C

2、lassifiedIndex:TP393U.D.C:004.9DissertationfortheMasterDegreeinEngineeringRESEARCHOFTHEENERGY-EFFICIENTSCHEDULERFORHADOOPBASEDONSTORAGEDRIVENCandidate:WangLaiSupervisor:AssociateProf.ZhaiJianhongAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerS

3、cienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2016Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要二十一世纪是信息的时代,信息传输伴随着数据量的增加,人们逐渐发现隐含在这些海量数据下的价值,于是用于分析处理海量数据的平台应运而生,Hadoop便是这其中最经典的海量数据处理框架。Hadoo

4、p需要构建一个庞大的数据节点集群,通过HDFS,Yarn,MapReduce等组件实现海量数据的高效并行计算。然而近年来二氧化碳等温室气体的排放量逐年增加,导致了全球温室效应日益严重,与此同时大规模数据中心需要庞大的服务器集群作为支撑,以及大规模的制冷设备会消耗大量的能量以及企业成本开销,使得数据中心的节能减排问题越来越受到重视,基于这些原因使得Hadoop节能研究变得十分必要。本文通过对Hadoop自带的随机选择存储策略和磁盘轮询存储策略两种副本存储策略深入剖析,找出两种策略在能耗控制方面的缺陷,同时结合数据本

5、地化的Hadoop任务调度原则,本文提出一种策略,即通过数据本地化原则将任务的调度问题转化为数据块副本的调度问题,创新的设计出一种基于存储驱动的Hadoop节能调度策略,同时构建出两层副本存储策略来控制集群负载均衡以及能量消耗,作为本文设计的节能调度策略的核心。本文设计的节能策略可以实现Hadoop集群任务的运行时间和总体能耗两个维度上的节能。该策略核心是两层副本存储策略。其中第一层副本存储策略根据数据节点磁盘的剩余容量,读写操作引用数实现两层算法,通过实现负载均衡提高集群整体性能,从而减少任务的运行时间。第二层

6、副本存储策略主要考虑任务本身的种类特征以及任务所在数据节点的实时状态,通过对任务特征任务与数据节点的实时状态进行匹配,使任务被分配到能耗最少的数据节点上执行,从而达到减少集群能耗的目的。最后本文通过XenServer平台搭建了具有32个数据节点的Hadoop集群环境,首先通过两组实验得出了本文设计的能量度量模型理论推导公式的近似参数,接下来将本文设计的节能调度策略与Hadoop自带的随机选择和磁盘轮询存储策略相对比,用三组对比实验证明了本文设计的节能调度策略在控制数据节点磁盘负载均衡方面具有较好地调节能力,可以相

7、对减少Hadoop-I-哈尔滨工业大学工学硕士学位论文集群任务的总体运行时间,并且可以有效降低Hadoop集群的能量消耗。关键词:绿色计算;大数据分析;Hadoop;HDFS;存储策略-II-哈尔滨工业大学工学硕士学位论文AbstractThe21stcenturyistheageofinformation,alongwithinformationtransmissiontherewillbehugeamountofdataincreasing.Peoplegraduallyfoundthevaluehidden

8、behindthesemassivedata.Somanyframeworkusingformassivedataanalysinghavebeendeveloped,Hadoopisthisoneofthemostclassicmassivemassdataprocessingframework.Hadoopneedtobuildplentyofdatanodesint

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。