hadloop模型研究及其作业调度算法的改进

hadloop模型研究及其作业调度算法的改进

ID:34649768

大小:15.47 MB

页数:60页

时间:2019-03-08

hadloop模型研究及其作业调度算法的改进_第1页
hadloop模型研究及其作业调度算法的改进_第2页
hadloop模型研究及其作业调度算法的改进_第3页
hadloop模型研究及其作业调度算法的改进_第4页
hadloop模型研究及其作业调度算法的改进_第5页
资源描述:

《hadloop模型研究及其作业调度算法的改进》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、首都经济贸易大学硕士学位论文THESISOFDOCTOR(MASTER)DEGREE论文题目:Hadoop模型研究及其作业调度算法的改进院系:专.业:学号:作者:指导教师:完成日期:信息学院产业经济学22010070381赵建红赵丹亚教授2013年3月独创性声明~~//!/////绰////I////////哆///////I////№//I////////////I//本人郑重声明:今所呈交的<

2、人已经发表或撰写的内容及科研成果,也不包含为获得首都经济贸易大学或其它教育机构的学位或证书所使用过的材料。作者签名:莲&聋纽关于论文使用授权的说明本人完全了解首都经济贸易大学有关保留、使用学位论文的有关规定,即:学校有权保留送交论文的复印件,允许论文被查阅、借阅或网络索引:学校可以公布论文的全部或部分内容,可以采取影印、缩印或其它复制手段保存论文。(保密的论文在解密后应遵守此规定)雄ElM:.年一月一首都经济贸易大学硕士学位论文Hadoop模型研究及其作业调度算法的改进摘要近几年来,随着现代社会的信息量增长速度极快,个人数据和工业数据量越来越大,未来的信息发

3、展方向必将以数据为中心。预计到2020年,每年生产的数字信息将会有超过蜩的内容驻留在云平台中或借助云平台处理。而云计算技术在工业界和学术界共同推动下取得了巨大的发展,大量的云计算系统投入使用。其中,很大一部分的云计算系统采用Hadoop平台来开发数据处理程序。Hadoop平台是一个在集群上运行大型数据的处理应用程序的开放式源代码框架,其最大的优点就是实现了并行化对应用开发者的透明处理,应用开发者可以像开发普通程序一样来开发云计算的应用系统,而并行化的具体实现则由Hadoop底层自动完成,使得开发者只需专注于业务数据的处理开发。Hadoop发展至今,在实际应用

4、中已经趋于成熟,但是在一些地方还有改进的必要和需求。Hadoop的作业调度技术作为其平台的核心技术之一,其主要是针对作业执行的顺序按照调度算法分配计算资源,而使用的调度算法决定了Hadoop平台的系统资源的利用情况和整体性能。但是目前这一技术尚处于未完全成熟阶段,现有的作业调度算法均存在着一些缺点或限制,因此,通过对现有作业调度算法的研究,改进其不足之处,对提高Hadoop平台的整体性能和系统资源的利用率具有重要的意义。本文主要研究工作和贡献如下:通过广泛的资料查阅和学习,对Hadoop平台的产生背景和核心架构模型进行了比较深入的学习研究,并重点对核心架构中

5、影响Hadoop整个集群的关键调度算法进行了深入学习,在学习并掌握Hadoop现有三种调度算法FIFO算法、公平调度算法和计算能力调度算法的基础上,针对三种算法的不足,提出了基于Logistic的回归作业调度算法,对算法的思路,要解决的问题进行了介绍,并在实现该算法的基础上对该调度算法进行实验验证,实验结果比较成功的达到了我们预期的目标,在一定程度上为Hadoop调度算法提供了更多的一种选择,并克服了己有三种算法中固有的缺点不足之处。关键词:Hadoop,作业调度,Logistic回归首都经济贸易大学硕士学位论文Hadoop模型研究及其作业调度算法的改进AB

6、STRACTInrecentyears,withthefastgrowthrateofmodemsocietyandtheamountofinformation,theamountofpersonaldataandindustrialdataisgrowingmoreandmore,thefurtureoftheinformationdevelopmentmustfocusonthedata.In2020,morethan1/3ofannualproductionofdigitalinformationwillresideiIlthecloudplatfor

7、morbenifitfromthecloudplatformwhenit'sdealedwith.Cloudcomputingtechnologywilldevelopgreatlyundertheimpetusoftheindustryandacademia,aI孤genumberofcloudcomputingsystemwillbeputintouse..Amongthem,alargepartofthecloudcomputingsystemsUseHadoopplatformtodevelopdataprocessingprocedures.The

8、HadoopplatformopenSouseffa

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。