高可用性的hdfs—— - 清华大学出版社

高可用性的hdfs—— - 清华大学出版社

ID:34386193

大小:313.00 KB

页数:27页

时间:2019-03-05

高可用性的hdfs—— - 清华大学出版社_第1页
高可用性的hdfs—— - 清华大学出版社_第2页
高可用性的hdfs—— - 清华大学出版社_第3页
高可用性的hdfs—— - 清华大学出版社_第4页
高可用性的hdfs—— - 清华大学出版社_第5页
资源描述:

《高可用性的hdfs—— - 清华大学出版社》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、高可用性的HDFS——Hadoop分布式文件系统深度实践前言Hadoop是目前主流的开源云计算系统,它实现了一个高可扩展的分布式文件系统——HDFS(HadoopDistributedFileSystem),HDFS作为Hadoop底层基础设施,为云计算提供高可靠、高性能的存储服务。HDFS在很大程度上借鉴了GoogleGFS文件系统的设计思想,具有高度容错、支持大数据集等诸多特性。这些特性曾让我们欢欣鼓舞,一度以为HDFS是一个可以解决数据密集型应用的海量数据存储难题的完美方案。随着研究的深入,我们在

2、不断叹服HDFS设计构思巧妙的同时,也深深地认识到仅有以上的特性还不足以构建一个实用的分布式文件系统,还需要一些其他特性进行支撑,高可用性则是其中最为关键的一点。高可用性是指系统正常服务时间所占的百分比,它是衡量系统对外正常服务能力的重要指标。对于HDFS来说,每一份数据可以有多个副本,因此文件数据的可靠性可以由副本来解决。然而,对于元数据管理来说,只有一个节点NameNode,它的好坏直接决定了HDFS能否正常服务,因此NameNode的高可用性决定了整个HDFS系统的高可用性。不同应用对HDFS高可

3、用性有不同要求,目前Hadoop自身包括其他一些开源组织提供了一些相应的高可用性机制以满足不同的需要,如BackupNode方案以及AvatarNode方案等。根据我们的实践经验,在使用以上方案解决实际问题时,需要具备以下几点基础:l首先是对NameNode元数据机制有较深的理解和把握;l其次要对各种解决方案的运行机制及使用方法有个全面掌握;l再次就是要有较强的实践操作经验。然而,就现实情况而言,要在以上任何一点取得一点进展都需要付出相当大的努力,回顾我们的团队在接触HDFS的高可用性之初,由于资料和经

4、验的匮乏,11高可用性的HDFS——Hadoop分布式文件系统深度实践每掌握一个知识点,都需经历资料查找、邮件列表搜索、邮件请教、代码查看、实验验证等多个环节,其间的付出可想而知,正是基于这点,我们也深切地感觉有必要将我们前期的经验和心得与大家分享,姑且也算做是我们团队对于开源软件事业的一点小小的回馈吧。本书内容本书一共8章,分为4个部分。其中第1部分为第1章,主要介绍当前HDFS主流的HA方案以及相关概念,使读者能够有一个宏观上的认识,同时通过方案的比较,遴选出3种具有代表性的HA方案。第2部分为第2

5、章,围绕HDFSHA的重点关注对象元数据,对内存元数据结构、磁盘元数据文件、文件系统格式化场景以及元数据在HA中的应用场景进行了深入剖析。第3部一共5章(3、4、5、6、7),主要介绍3种经典的HA解决方案:Hadoop元数据备份方案、BackupNode方案以及AvatarNode方案,从代码入手,分别从运行机制、使用方法等方面进行说明,每种方案都有详细的使用说明并配以视频,便于读者掌握。第4部分为第8章,介绍目前最新HA解决方案CloudreaHANameNode。适合读者如果您是一位Hadoop集

6、群管理维护人员,请阅读本书,它将向您展示当前主流的HDFSHA解决方案,通过文字说明和视频展示这些方案的实现机制和操作细节,使您能够在最短的时间内消化和吸收这些技术,您可以根据自己的需要选择和部署实施最合适的HA方案。如果您是一位Hadoop应用开发者,请阅读本书,您将会在此找到如何结合HDFS的HA,编写出更为健壮的应用程序。11高可用性的HDFS——Hadoop分布式文件系统深度实践如果您是一位分布式文件系统研发人员,请阅读本书,它将向您深入剖析HDFS这一最有影响力的开源云计算分布式存储系统的各种

7、HA方案及其实现机制。如果您是一位云计算技术的爱好者,请阅读本书,本书会从零开始,一步一步地带您掌握云计算相关技术,并加深概念的理解,为您日后深入接触云计算技术打下基础。本书由文艾和王磊共同编著而成。文艾负责总体设计、内容把握以及写作组织,独立完成第1、2、3、8章,并与王磊共同完成第4、5、6、7以及实验的视频设计和制作。感谢中国电子学会云计算专家委员会专家刘鹏教授的大力支持;感谢我的家人,你们是我奋斗前进的最大动力;最后,希望大家从书中找到需要的东西。时间紧,任务急,错误在所难免,敬请各位批评指正。

8、请发送邮件到hdfsha@126.com。11高可用性的HDFS——Hadoop分布式文件系统深度实践11第1章HDFSHA及解决方案第1章HDFSHA及解决方案HDFS[[1]http://hadoop.apache.org/hdfs/](HadoopDistributedFileSystem)即Hadoop分布式文件系统,它为Hadoop这个分布式计算框架提供高性能、高可靠、高可扩展的存储服务。11第1章HDFSHA及解决方案1.1HD

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。