配置分布式Hadoop环境

ID：38376614

大小：1.42 MB

页数：6页

时间：2019-06-11

资源描述：

《配置分布式Hadoop环境》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、配置分布式Hadoop环境　　上一课讲了如何在一台机器上建立Hadoop环境，我们只配置了一个NHNameNode,这个NameNode里面包含了我们所有Hadoop的东西，包括NameNode,SecondaryNameNode,JobTracker,TaskTracker，这一课讲解如何把上述配置放到不同机器上，从而构建一个分布式的hadoop配置。　　1.hadoop分布式安装概览　　a)2-10个nodes:NameNode,JobTracker,SecondaryNameNode都可以放在一台机器上，所有的DataNode和TaskTracker放在其

2、他机器上　　b)10-40个nodes:可以把SecondaryNameNode分开来　　c)100+nodes:所有的Node和Trackers都分开放，并且添加rackawareness支持，同时需要各类优化设置。　　　　本课的流程：　　配置好ssh到所有的机器上，使其可以免输入密码连接(如同上一课所述)　　配置好masters和slaves　　配置好所有的*-site文件　　学习使用命令来启动，控制和关闭Hadoop(常用脚本说明如下图)。　　　　2.配置Hadoop到2-10个节点上　　这个图很帅，我们在HNClient机器上来控制所有的Hadoop机器

3、，每个机器给一个窗口(下图已经通过ssh链接到每台机器了，链接方式见上一课)。　　第一步：取消所有机器上面的ssh密码访问　　ssh-copy-id-i$HOME/.ssh/id-rsa.pubnuggetuser@HNData1　　把这个文件拷贝到所有的HNData和SecondaryNameNode上面。这样就可以无密码登陆了。　　　　第二步：配置Master和Slaves　　所有的配置文件都在/usr/local/hadoop/conf文件夹下面　　配置好masters来指向SecondaryNameNode，然后配置slaves文件指向所有的HNData

4、Node　　Master文件默认的是localhost　　用任何编辑器打开masters文件，删除localhost,输入HN2ndName(就是你SecondaryNameNode的名称)　　同样，编辑slaves文件，把所有的HNDataNode名称输入　　　　第三步：配置所有的DataNode，让它们指向NameNode，所有的TaskTracker指向JobTracker　　通过core-site.xml配置前者，通过mapred-site.xml配置后者　　在HNDataNode配置core-site.xml如下(因为我们是直接把上次的机器配置拷贝进来

5、的，所以可以发现这个文件已经配置过了，如下：)　　　　配置mapred-site.xml如下：　　　　上面的配置应该已经是这样了，不过最好还是检查好每一个DataNode中的配置是不是这样　　第四步：重新格式化NameNode　　hadoopnamenode-format　　第五步：配置完成了，可以试着看看能否启动　　start-dfs.sh这个命令启动所有的NameNodes和DataNodes，可以使用jps命令来查看是否成功启动了。　　　　start-mapred.sh这个命令启动所有的JobTrackers和TaskTrackers，同样使用jps来检测

6、是否启动了，如果没有成功，可以去看看logs文件　　3.启动和关闭Hadoop各部分的命令　　如果要删除一个node，可以建立一个excludes文件，在里面输入你不想要的node名称，比如HNData3.　　然后配置HNNameNode中core-site.xml如下(在最后添加一个property)　　　　同样可以建立一个includes文件来指定包含哪些节点　　配置完成后，启用配置：　　hadoopdfsadmin-refreshNodes　　我们可以在hnname:50070上面看到被排除的Node　　　　运行rebalancer命令　　start-ba

7、lancer.sh　　关闭JobTracker，TaskTracker：　　stop-mapred.sh　　关闭NameNode,DataNodes:　　stop-dfs.sh　　　　如果要同时启动HNNameNode,DataNode,JobTracker,TaskTracker,则直接输入：　　start-all.sh

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 6



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

配置分布式Hadoop环境

配置分布式Hadoop环境

相关文章

相关标签