hadoop平台的推测式任务调度策略研究

hadoop平台的推测式任务调度策略研究

ID:35105002

大小:7.78 MB

页数:73页

时间:2019-03-18

hadoop平台的推测式任务调度策略研究_第1页
hadoop平台的推测式任务调度策略研究_第2页
hadoop平台的推测式任务调度策略研究_第3页
hadoop平台的推测式任务调度策略研究_第4页
hadoop平台的推测式任务调度策略研究_第5页
资源描述:

《hadoop平台的推测式任务调度策略研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校编号10394困书分类号学号20131032密级@巧么巧於大争?全日制专业学位研究生硕±学位论文Hadoop平台的推测式任务调度策略研究-ResearchonSpeculativeTaskScheduleStrate化rHadooPlatformgyp梅忠心?^會妒方爲"学科专业:计黨机应用巧乂瓜.、研究方向:数据挖巧指导教师:肖如良教授申请学位级别:工挙硕±论文提交日期:2016年6月5曰^论文评阅人:

2、节论文答辩日期:2016年6月2日\答辩委员会主獻陈新教授''学位授予单位:福津师范大挙、日期C学位授予:20化年月日省/20化年6月-:乂:-/V—中文摘耍中文摘要,推测式任务调度作为作业调度的补充会为慢任务执行备份,从而缩短作业完成时间。Hadoop原始推测调度算法假设集群同构,在异构环境的适用性较差。最长レ剩余时间算法在异构环境下对任务进度的计算ッ及慢任务的判定不精确,并且在选择备份任务执行节点时对慢节点判定也不够准确且未考虑实时负载,这些不足

3、之处严重影响应用程序的服务质量,是基于Hadoop的乂数掘分析处理的挑战性问题。针对W上问题,本文提出了改进的推测式任务调度算法。该算法首先利用历史的及最近的任务各阶段进度比信息改进了任务的进度计算方式,然后在此基础上利用进度增长率来分别判定map与reduce慢任务,最后通过节点执行任务的速度W及实时负载,对备份任务执行节点进行筛选。所提出的推测调度算法综合了异构环境、推测策略、任务差异性及节点实时负载,缩短了作业平均完成时间,提高了Hadoop集群性能。H在所搭建的集群上,对所提山的

4、改进算法与adoop自带的W及最氏剩余执行时间推测调度算法进行了实验,并从测试作业的完成时间进行了分析对比,实验结果验证了算法的高效性。该项工作有助于当前Hadoop作业调度面临问题的研究和改进。关键词:Hadoop;作业调度;异构环境;推测调度;实时负载IAbstractAbstractAsasulementofobschedulinseculativel;askschedulinwou]dexecuteappjg,pgbackuforslowtaskin

5、ordertoshortenihecomleliontimeofob.Thehadoooriinalppjpgspeculativeschedulealgorithmassumes化eclusterhomogeneousthatilperformancesbadinheterogeneousenvironment.Thecompilationof化skprogressandthejudgmentofslowtaskofLongestT

6、imeToEndalgorithmarenotpreciseinh別erogeneous'menilenvironment*theudgt曰fslownodeisa3soinaccurateandrealtmeoadhasntbeenjconsideredwhbackki.Thililechoosingtheuptasexecutngnodeeseshortaeshasserousgyinfluencedtheservicequality

7、ofapplications,theyarethechallengesofbigdataprocessingbasedonhadoo.pAimingtosolvetheseproblems,l;hea^icleproposedanimprovedspeculative化skhedu.sclealorithmheihmuhiig.TalgortsesstorcalandrecentprogresspropcMtionofeachstaeo

8、ftasktoimrovethewathattaskroressbecalculatedandthenudesthegpypg,jgslowmaandreducel:asksearatelthrouhtheroressincreaserateonthebasisofitppy

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。