HDFS架构与基本存储单元.docx

HDFS架构与基本存储单元.docx

ID:50811660

大小:20.44 KB

页数:1页

时间:2020-03-14

HDFS架构与基本存储单元.docx_第1页
资源描述:

《HDFS架构与基本存储单元.docx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、HDFS架构与基本存储单元对于HDFS架构来说,一个HDFS基本集群包括两大部分,即NameNode与DataNode节点,其作用是将管理与工作进行分离。通常来说,一个集群中会有一个NameNode与若干个DataNode。NameNode是一个集群的主服务器,主要是用于对HDFS中所有的文件及内容数据进行维护,并不断读取记录集群中DataNode主机情况与工作状态,并通过读取与写入镜像日志文件的方式进行存储。而DataNode是在HDFS集群中担任任务具体执行,是整个集群的工作节点,文件被分成若干个相同大小的数据块,分别存储在若干个DataNode上,DataN

2、ode定时定期向集群内NameNode发送自己的运行状态与存储内容,并根据NameNode发送的指令进行工作。小提示:NameNode和DataNode可以工作在一台机器上,但是此种工作方式极大的限制了HDFS性能。NameNode负责接受客户端发送过来的信息,然后将文件存储信息位置发送给提交请求的客户端,由客户端直接与DataNode进行联系,进行部分文件的运算与操作。对于文件存储来说,HDFS使用Block(分块)来对文件的存储进行操作。对于传统磁盘存储来说,磁盘都有默认的存储单元,通常使用的是数据定义中的最小存储单元。Block是HDFS的基本存储单元,默认

3、大小是64M,这个大小远远大于一般系统文件的默认存储大小。这样做的一个最大好处减少文件寻址时间。除此之外,采用Block对文件进行存储,大大提高了文件的灾难生存与恢复能力,HDFS还对已经存储的Block进行多副本备份,将每个Block至少复制到3个相互独立的硬件上。这样做的好处就是确保在发生硬件故障的时候,能够迅速的从其他硬件中读取相应的文件数据。而具体复制到多少个独立硬件上也是可以设置的。好程序员大数据开发采用“T”字形的思维,以大数据的深度为主,以机器学习、云计算等作为宽度,终极目标是将你培养成一名“复合型”研发人才,让你自己在掌握相关大数据技术的同时,也能

4、够赢得一份高薪职位!

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。