Hadoop平台配置总结

Hadoop平台配置总结 - 郑文亮 - 博客园 http://www.cnblogs.com/zhwl/p/3672916.html

hadoop的配置，个人感觉是非常容易出问题。一个原因是要配置的地方多，还有个原因就是集群配置要在几台机器上都配置正确，才能保证配置好hadoop，跑起任务。

经过昨晚加今天上午的折腾，总算成功配好了集群模式，其中苦不堪言啊，中间好几次都想要放弃。这里总结了一下配置的几个要点，分享给大家，以使大家少走冤枉路。

1.基本配置

安装JDK1.6（这是必须的吧，无须解释）

下载Hadoop包

下载后放在用户主目录下解压

配置JAVA_HOME路径

conf/hadoop-env.sh

将

The java implementation to use. Required.

export JAVA_HOME=/usr/lib/j2sdk1.5-sun

改为

The java implementation to use. Required.

export JAVA_HOME=/usr/lib/jvm/java-6-openjdk

（这里的java具体目录可能会有所不同）

保存并关闭

输入以下命令：

$ bin/hadoop

如果能看到hadoop的程序调用的使用说明，此时说明你已经成功配置好了这部分。（单机模式）

2.集群模式配置

配置好了单机模式后，即可配置集群模式。集群模式的结构是一台master机器+若干台slave机器。

（1）编辑/etc/hosts文件（master,slave都要）：

假设master机器：

IP：192.168.0.1 机器名：master

假设slaves机器：

IP：192.168.0.2 机器名：slave1

IP：192.168.0.3 机器名：slave2

IP：192.168.0.4 机器名：slave3

IP：192.168.0.5 机器名：slave4

加入如下项：

/etc/hosts

192.168.0.1 master
192.168.0.2 slave1

192.168.0.3 slave2

192.168.0.4 slave3

192.168.0.5 slave4

注意：这里的”master“和”slave1“等等均指你的机器名，如在终端中有ubuntu@DY1-U09:~/hadoop$，则DY1-U09为机器名。

（2）在hadoop目录下新建几个文件夹（master,slave都要）：

$ mkdir tmp

$ mkdir hdfs

$ mkdir hdfs/name

$ mkdir hdfs/data

（3）在conf目录中，编辑以下文件（目录path/to/your/hadoop为你自己的相应hadoop目录）（master,slave都要）：

conf/core-site.xml:

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://（你的master机器名）:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/path/to/your/hadoop/tmp</value>
</property>

</configuration>

conf/hdfs-site.xml:

<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>/path/to/your/hadoop/hdfs/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/path/to/your/hadoop/hdfs/data</value>
</property>
</configuration>

conf/mapred-site.xml:

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>（你的master机器名）:9001</value>
</property>
</configuration>

（4）SSH Access（仅对master）

master必须能以passless ssh访问slaves

ubuntu@master:~$ ssh-copy-id -i $HOME/.ssh/id_rsa.pub ubuntu@slave1

ubuntu@master:~$ ssh-copy-id -i $HOME/.ssh/id_rsa.pub ubuntu@slave2

ubuntu@master:~$ ssh-copy-id -i $HOME/.ssh/id_rsa.pub ubuntu@slave3

ubuntu@master:~$ ssh-copy-id -i $HOME/.ssh/id_rsa.pub ubuntu@slave4

执行以上的命令都需要输入对方的密码

完成后，可以在master上分别运行：ssh slave1/slave2/slave3/slave4

看是否不需要输入密码，如果不需要则设置正确。

（5）配置conf/masters,conf/slaves（仅对master）

更新conf/masters文件如下：

master

更新conf/slaves文件如下：

slave1

slave2

slave3

slave4

（6）开启集群：

在master上运行：$ bin/start-all.sh

可以在master和slave上运行jps命令,查看开启的daemons：

此时，master机器上应当有namenode，jobtracker，secondarynamenode，

而slave机器上有datanode，tasktracker

开启后要等一段时间使服务完全启动，否则命令将没有响应。具体什么时候完全启动可以查看

http://localhost:50030/ – web UI for MapReduce job tracker(s)
http://localhost:50060/ – web UI for task tracker(s)
http://localhost:50070/ – web UI for HDFS name node(s)
以上的几个网址可以让你获取Hadoop的运行状况信息。当网页可以载入的时候即可。

（7）测试一下：

首先需要Format namenode

(格式化之前最好在所有机器上清空hdfs/data,hdfs/name，以免造成冲突）

在master上运行: $ bin/hadoop namenode -format

在master机器上运行WordCount：

首先在dfs中创建input目录

$ bin/hadoop dfs -mkdir input

将conf中的文件拷贝到dfs中的input：

$ bin/hadoop dfs -copyFromLocal conf/* input

运行WordCount

$ bin/hadoop jar hadoop-0.20.2-examples.jar wordcount input output

显示输出结果文件：

$ bin/hadoop dfs -cat output/*

3.配置过程问题归纳：

（1）dfs可以ls，mkdir，但是copyFromLocal出错，提示could only be replicated to 0 nodes, instead of 1：

这个问题非常容易遇到，而且原因可能也不相同，若出现此问题，请尝试以下步骤：

使用jps检查master和slave上是否符合：master机器上应当有namenode，jobtracker，secondarynamenode，而slave机器上有datanode，tasktracker。

若不符合请仔细检查master和slave上的/etc/hosts文件、conf/core-site.xml、conf/mapred-site.xml、conf/hdfs-site.xml。

检查master和slave上的/etc/hosts文件，如果其中有127.0.0.1与你的相应机器名对应的项，请将其删掉，务必保证此文件中对应于你的机器名的ip地址为你在局域网中的ip。

运行stop-all.sh关闭进程；

Format namenode(格式化之前最好在所有机器上清空hdfs/data,hdfs/name，以免造成冲突）——在master上运行: $ bin/hadoop namenode -format

运行start-all.sh开启服务；

待服务完全开启后测试。

（2）提示处于safemode，报错。

运行命令bin/hadoop dfsadmin -safemode leave后重试。

（3）其他问题：

配置过程出错的大部分问题都出在hdfs不能正常使用，具体表现是http://localhost:50070查看namenode显示

Configured Capacity : 0 KB
DFS Used : 0 KB
Non DFS Used : 0 KB
DFS Remaining : 0 KB
DFS Used% : 100 %
DFS Remaining% : 0 %
Live Nodes : 0
Dead Nodes : 0

若出现此问题，请仔细检查master和slave上的/etc/hosts文件，以及三个xml配置文件保证没有地方写错，所有机器上都有在hadoop目录执行

$ mkdir tmp

$ mkdir hdfs

$ mkdir hdfs/name

$ mkdir hdfs/data

最后，请大家勇于坚持——”我不会永远失败，正如我不会永远成功“。GoodLuck！

最后编辑于：2017.12.08 15:32:35

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 196,200评论 5赞 462
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 82,526评论 2赞 373
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 143,321评论 0赞 325
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 52,601评论 1赞 267
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 61,446评论 5赞 358
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 46,345评论 1赞 273
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 36,753评论 3赞 387
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 35,405评论 0赞 255
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 39,712评论 1赞 294
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 34,743评论 2赞 314
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 36,529评论 1赞 326
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 32,369评论 3赞 315
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 37,770评论 3赞 300
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,026评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 30,301评论 1赞 251
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 41,732评论 2赞 342
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 40,927评论 2赞 336

Hadoop平台配置总结

The java implementation to use. Required.

export JAVA_HOME=/usr/lib/j2sdk1.5-sun

The java implementation to use. Required.

/etc/hosts

推荐阅读更多精彩内容