Hadoop介绍与部署

Hadoop介绍与部署

ID:41294737

大小:23.82 KB

页数:7页

时间:2019-08-21

Hadoop介绍与部署_第1页
Hadoop介绍与部署_第2页
Hadoop介绍与部署_第3页
Hadoop介绍与部署_第4页
Hadoop介绍与部署_第5页
资源描述:

《Hadoop介绍与部署》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Hadoop介绍与部署1、Hadoop介绍12、部署步骤21、Hadoop介绍分布式计算最重要的一个设计点:MovingComputationisCheaperthanMovingData。就是在分布式处理中,移动数据的代价总是高于转移计算的代价。简单来说就是分而治之的工作,需要将数据也分而存储,本地任务处理本地数据然后归总,这样才会保证分布式计算的高效性。Hadoop是Apache开源组织的一个分布式计算开源框架。分布式计算中具体的计算任务交由哪一台机器执行,执行后由谁来汇总,这都由分布式框架的Master来抉择,而使用者只需简单地将待分析内容提供给分布式计算系统作为输入,就可以得到分

2、布式计算后的结果。Hadoop框架中最核心的设计就是:MapReduce和HDFS,一句话解释MapReduce就是“任务的分解与结果的汇总”;HDFS是Hadoop分布式文件系统(HadoopDistributedFileSystem)的缩写,为分布式计算存储提供了底层支持。MapReduce从它名字上来看就大致可以看出个缘由,两个动词Map和Reduce,“Map(展开)”就是将一个任务分解成为多个任务,“Reduce”就是将分解后多任务处理的结果汇总起来,得出最后的分析结果。在程序设计中,一项工作往往可以被拆分成为多个任务,任务之间的关系可以分为两种:一种是不相关的任务,可以并行执

3、行;另一种是任务之间有相互的依赖,先后顺序不能够颠倒,这类任务是无法并行处理的。任务分解处理以后,那就需要将处理以后的结果再汇总起来,这就是Reduce要做的工作。1、部署步骤1.在所有的机器上都建立相同的目录,也可以就建立相同的用户,以该用户的home路径来做hadoop的安装路径。例如我在所有的机器上都建立了/home/wenchu。2.下载Hadoop,先解压到Master上。这里我是下载的0.17.1的版本。此时Hadoop的安装路径就是/home/wenchu/hadoop-0.17.1。3.解压后进入conf目录,主要需要修改以下文件:hadoop-env.sh,hadoop

4、-site.xml、masters、slaves。Hadoop的基础配置文件是hadoop-default.xml,看Hadoop的代码可以知道,默认建立一个Job的时候会建立Job的Config,Config首先读入hadoop-default.xml的配置,然后再读入hadoop-site.xml的配置(这个文件初始的时候配置为空),hadoop-site.xml中主要配置你需要覆盖的hadoop-default.xml的系统级配置,以及你需要在你的MapReduce过程中使用的自定义配置(具体的一些使用例如final等参考文档)。以下是一个简单的hadoop-site.xml的配置

5、:fs.default.name//你的namenode的配置,机器名加端口hdfs://10.2.224.46:54310/mapred.job.tracker/

6、/你的JobTracker的配置,机器名加端口hdfs://10.2.224.46:54311/dfs.replication//数据需要备份的数量,默认是三1hadoop.tmp.dir//Hadoop的默认临时路径,这个最好配置,如果在新增节点或者其他情况下莫名其妙的DataNode启动不了,就删除此文件中的tmp目录即可。不过如果删除了NameNode机器的此目录,那么就需要重新执行Nam

7、eNode格式化的命令。/home/wenchu/hadoop/tmp/mapred.child.java.opts//java虚拟机的一些参数可参照配置-Xmx512mdfs.block.size//block的大小,单位字节,后面会提到

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。