基于hadoop的云计算模型研究与应用

基于hadoop的云计算模型研究与应用

ID:32972352

大小:1.02 MB

页数:85页

时间:2019-02-18

基于hadoop的云计算模型研究与应用_第1页
基于hadoop的云计算模型研究与应用_第2页
基于hadoop的云计算模型研究与应用_第3页
基于hadoop的云计算模型研究与应用_第4页
基于hadoop的云计算模型研究与应用_第5页
资源描述:

《基于hadoop的云计算模型研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于Hadoop的云计算模型研究与应用重庆大学硕士学位论文学生姓名:曹风兵指导教师:吴开贵副教授专业:计算机系统结构学科门类:工学重庆大学计算机学院二O一一年四月TheResearchandApplicationofCloudComputingModelBasedonHadoopAThesisSubmittedtoChongqingUniversityinPartialFulfillmentoftheRequirementfortheDegreeofMasterofEngineeringByCaoF

2、engbingFengbingCaoSupervisedbyAssociateProf.WuKaiguiSpecialty:ComputerSystemArchitectureCollegeofComputerScienceofChongqingUniversity,Chongqing,ChinaApril2011中文摘要摘要随着社会进步和互联网技术发展,网络数据量飞速增长且规模日渐庞大,不管是企业还是个人都面临如何对这些海量数据进行有效存储和分析的难题。面对正在增长的海量数据,传统数据处理方法存在

3、数据存储成本过高、海量数据管理较困难、可靠性较低、效率低下、并行处理程序编写困难等诸多缺点。人们需要一种新的技术思想来解决这些问题。云计算的思想就很自然地被提出来。云计算通过整合互联网络中的闲散资源,对外提供强大的存储和计算能力,以及一些其它解决方案。Hadoop是一个开源分布式数据处理框架,被用于高效地处理海量数据。由于Hadoop具有可伸缩性、高可靠性、低成本性和高效性等优点,已成为一种流行的云计算开发平台。但是Hadoop也存在一定的缺陷,例如,在Hadoop集群中只要一个名字节点来管理整个文

4、件系统的元数据和执行重要的文件系统操作。这会限制集群的可扩展性、可用性;另外,在传统Hadoop中,计算和存储是紧耦合的,这也会对集群的性能造成限制。本文的研究课题是基于Hadoop的云计算模型研究与应用,主要目标是:分析传统Hadoop框架的性能瓶颈,设计一种新的Hadoop框架;在改进传统Hadoop框架的基础上,设计基于改进后的Hadoop的云计算模型,实现相应云计算平台,重点解决海量数据存储和分析的难题。论文的主要工作和成果如下:①介绍云计算的基础理论,包括云计算的概念、特点、关键技术和典型

5、的平台应用。②阐述Hadoop的基础架构,包括分布式文件系统(HDFS)、并行编程模型MapReduce的原理和实现机制、Hadoop框架优化措施等。详细分析了HDFS的数据管理机制、性能保障措施、以及文件的读取和写入过程。③分析Hadoop的性能瓶颈,设计了一个新型的Hadoop架构,解决了传统Hadoop架构中的单名字节点的瓶颈问题,以及计算与存储紧耦合问题,通过理论分析和实验对比,论证了新框架的高效性。新框架具有高可用性和良好的可扩展能力。④完成了基于改进的Hadoop的云计算模型设计,结合W

6、EB技术实现了云模型中功能模块的开发。本文云计算模型具有高效性、高可靠性、低成本和易于使用等优点。此系统模型可应用于企业数据存储和计算、科学研究等领域,为海量数据存储和计算提供了高可靠性、低成本的解决方案,为云计算技术的发展和Hadoop应用提供了一I重庆大学硕士学位论文种新的思路。关键词:云计算,海量数据,Hadoop,MapReduceII英文摘要ABSTRACTWiththedevelopmentofInternettechnologyandsociety,theamountandscales

7、ofnetworkdataarerapidlygrowing.Nomatterwhoenterprisesorindividualsfacetheproblem,thatis,howtostoreandanalyzethesemassivedata.Withthegrowingamountofdata,thetraditionalmethodsforprocessingmassivedatahavemanyshortcomings,suchas,highercostofdatastorage,mor

8、edifficultdatamanagement,lessreliable,lowerefficiency,moredifficultparallelprogramming,andsoon.Anoveltechnologyisneededtosolvetheseproblems,sothecloudcomputinghasbeenbroughtnaturally.Cloudcomputingintegratesthefreeresource,providesstron

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。