云计算平台比较

云计算平台比较

ID:44874204

大小:797.97 KB

页数:21页

时间:2019-11-01

云计算平台比较_第1页
云计算平台比较_第2页
云计算平台比较_第3页
云计算平台比较_第4页
云计算平台比较_第5页
资源描述:

《云计算平台比较》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、云计算平台研究三种平台子项目对照表子项目HadoopOpenStackAmazon网络管理Nova-network数据管理HBaseNova-databaseSimpleDB计算Map/ReduceNova-computeEC2存储HDFSObject-storeS3消息管理QueueSQ3镜像管理GlanceAMI同步管理ZookeeperNtp监控管理Chukwa1.Hadoop平台研究1.1Hadoop架构在Google发表MapReduce后,2004年开源社群用Java搭建出一套Hadoop框架,

2、用于实现MapReduce算法,能够把应用程序分割成许多很小的工作单元,每个单元可以在任何集群节点上执行或重复执行。此外,Hadoop还提供一个分布式文件系统GFS(Googlefilesystem),是一个可扩展、结构化、具备日志的分布式文件系统,支持大型、分布式大数据量的读写操作,其容错性较强。而分布式数据库(BigTable)是一个有序、稀疏、多维度的映射表,有良好的伸缩性和高可用性,用来将数据存储或部署到各个计算节点上。Hadoop框架具有高容错性及对数据读写的高吞吐率,能自动处理失败节点,如图3-

3、5所示为GoogleHadoop架构。在架构中MapReduceAPI提供Map和Reduce处理、GFS分布式文件系统和BigTable分布式数据库提供数据存取。基于Hadoop可以非常轻松和方便完成处理海量数据的分布式并行程序,并运行于大规模集群上。图3-3 Google Hadoop架构Hadoop有许多元素构成。最底部是HadoopDistributedFileSystem(HDFS),它存储Hadoop集群中所有存储节点上的文件。HDFS的上一层是MapReduce引擎,该引擎由JobTracke

4、r和TaskTracker组成。HDFS和MapReduce的关系如图3-4所示:图3-4HDFS和MapReduce的关系图MapReduce是依赖于HDFS实现的。通常MapReduce会将被计算的数据分为很多小块,HDFS会将每个块复制若干份以确保系统的可靠性,同时它按照一定的规则将数据块放置在集群中的不同机器上,以便MapReduce在数据宿主机器上进行最便捷的计算。1.2Hadoop分布式文件系统对客户机而言,HDFS(HadoopDistributedFileSystem)就像一个透明的传统分级

5、文件系统,可以创建、删除、移动或重命名文件等等传统意义上的文件系统操作。HDFS的基本体系结构如图3-5所示:图3-5HDFS的基本体系结构图如图3-5存储在HDFS中的文件被分成块,并被复制到多个节点中(DataNode)。这与传统的RAID架构大不相同。块的大小(默认为64MB)和作为冗余(Replication)的块数量在创建文件时由用户定制。NameNode作为中心控制节点对所有文件操作进行控制。NameNode运行在一个单独的节点上,其负责管理文件系统名称空间和控制用户的访问。NameNode并不

6、处理系统运行中实际的数据流,而只处理表示DataNode数据块的元数据。当任务节点需要处理某个数据块时,则先访问NameNode获得该数据块的存储位置后,就可以到存储该数据块的DataNode对该数据块进行读取,修改,删除等操作,并将这些操作信息返回NameNode,更新该数据块的信息。在HDFS中,默认设置一个SecondaryNameNode作为NameNode的备份节点,系统运行将HDFS的存储元数据备份到SecondaryNameNode。当NameNode出现异常和错误的时候,启动Secondar

7、yNameNode成为新的NameNode。Hadoop集群包含一个中心控制节点NameNode,以及大量负责存储数据的工作节点DataNode。DataNode响应来自用户系统的读写请求,还响应创建、删除和复制来自NameNode的块命令。NameNode中维护着每个DataNode的在线状态,而DataNode向NameNode发生定期心跳消息(Heartbeat)维护自己在NameNode中的在线。而心跳消息中还包含一个块报告,NameNode可以根据这个报告验证块映射和其他文件系统元数据。如果Nam

8、eNode没有收到DataNode发送的心跳消息,NameNode将采取修复措施,重新复制在该节点上丢失的块。1.3基于Hadoop的MapReduce实现Hadoop的MapReduce框架是基于GoogleMapReduce程序设计框架的原理实现的。Hadoop的MapReduce框架的基本体系结构如图3-6Error!Referencesourcenotfound.所示,Hadoop的MapReduce框架

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。