Hadoop添加节点的方法

Hadoop添加节点的方法

ID:37920976

大小:57.50 KB

页数:8页

时间:2019-06-02

Hadoop添加节点的方法_第1页
Hadoop添加节点的方法_第2页
Hadoop添加节点的方法_第3页
Hadoop添加节点的方法_第4页
Hadoop添加节点的方法_第5页
资源描述:

《Hadoop添加节点的方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Hadoop添加节点的方法自己实际添加节点过程:1.先在slave上配置好环境,包括ssh,jdk,相关config,lib,bin等的拷贝;2.将新的datanode的host加到集群namenode及其他datanode中去;3.将新的datanode的ip加到master的conf/slaves中;4.重启cluster,在cluster中看到新的datanode节点;5.运行bin/start-balancer.sh,这个会很耗时间备注:1.如果不balance,那么cluster会把新的数据都存放在新的node上,这样会降低mr的工作效率;2.也可调用bin/start-bal

2、ancer.sh命令执行,也可加参数-threshold5  threshold是平衡阈值,默认是10%,值越低各节点越平衡,但消耗时间也更长。3.balancer也可以在有mrjob的cluster上运行,默认dfs.balance.bandwidthPerSec很低,为1M/s。在没有mrjob时,可以提高该设置加快负载均衡时间。其他备注:1.必须确保slave的firewall已关闭;2.确保新的slave的ip已经添加到master及其他slaves的/etc/hosts中,反之也要将master及其他slave的ip添加到新的slave的/etc/hosts中mapper及re

3、ducer个数url地址:http://wiki.apache.org/hadoop/HowManyMapsAndReducesHowManyMapsAndReducesPartitioningyourjobintomapsandreducesPickingtheappropriatesizeforthetasksforyourjobcanradicallychangetheperformanceofHadoop.Increasingthenumberoftasksincreasestheframeworkoverhead,butincreasesloadbalancingandlowe

4、rsthecostoffailures.Atoneextremeisthe1map/1reducecasewherenothingisdistributed.Theotherextremeistohave1,000,000maps/1,000,000reduceswheretheframeworkrunsoutofresourcesfortheoverhead.NumberofMapsThenumberofmapsisusuallydrivenbythenumberofDFSblocksintheinputfiles.Althoughthatcausespeopletoadjustthe

5、irDFSblocksizetoadjustthenumberofmaps.Therightlevelofparallelismformapsseemstobearound10-100maps/node,althoughwehavetakenitupto300orsoforverycpu-lightmaptasks.Tasksetuptakesawhile,soitisbestifthemapstakeatleastaminutetoexecute.Actuallycontrollingthenumberofmapsissubtle.Themapred.map.tasksparamete

6、risjustahinttotheInputFormatforthenumberofmaps.ThedefaultInputFormatbehavioristosplitthetotalnumberofbytesintotherightnumberoffragments.However,inthedefaultcasetheDFSblocksizeoftheinputfilesistreatedasanupperboundforinputsplits.Alowerboundonthesplitsizecanbesetviamapred.min.split.size.Thus,ifyoue

7、xpect10TBofinputdataandhave128MBDFSblocks,you'llendupwith82kmaps,unlessyourmapred.map.tasksisevenlarger.Ultimatelythe[WWW]InputFormatdeterminesthenumberofmaps.ThenumberofmaptaskscanalsobeincreasedmanuallyusingtheJobCon

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。