Hadoop搭建

配置ssh免密登陆

前提:master和slave节点配置相同。

本环境中已默认安装了SSH服务,所以我们只需要对其进行配置即可。

1、生成密钥命令:

ssh-keygen -P ""

image

在/root/.ssh目录下可以看到有authorized_keys、id_rsa、id_rsa.pub三个文件

cd /root/.ssh

ls

image

2、将master的公钥id_rsa.pub复制到master、slave1、slave2的authorized_keys里面,这样就可以让master免密钥登录到master、slave1、slave2。

首先对master自身做免密,如下

ssh-copy-id root@images.handge.cn

image
image

测试ssh连接到master

ssh master

image

测试完毕,退出连接使用exit命令。

image

使用同样的方法让master节点能够免密登录到slave1、和slave2。

ssh-copy-id root@192.168.1.3

ssh-copy-id root@192.168.1.4

安装hadoop

1、切换到hadoop压缩包所在位置,解压文件

cd /opt

tar -zxvf /opt/hadoop-2.7.3.tar.gz -C /opt

image

2、配置环境变量

编辑/etc/profile文件,在PATH参数后面追加hadoop路径

vim /etc/profile

编辑如下:

<pre class="md-fences md-end-block" lang="" contenteditable="false" cid="n92" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: Consolas, "Liberation Mono", Courier, monospace; font-size: 0.9em; white-space: pre; display: block; break-inside: avoid; text-align: left; background-image: ; background-position: var(--code-block-bg-color); background-size: ; background-repeat: var(--code-block-bg-color); background-attachment: ; background-origin: ; background-clip: ; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(221, 221, 221); border-radius: 3px; padding: 8px 1em 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

export JAVA_HOME=/opt/jdk1.8.0_111

export PATH=PATH:/opt/hadoop-2.7.3/bin:/opt/hadoop-2.7.3/sbin

export CLASSPATH=.:JAVA_HOME/lib/tools.jar

</pre>

image

使配置文件生效

source /etc/profile

![image](http://upload-images.jianshu.io/upload_images/3517338-099caa0f07e165d9.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1

3、配置分布式环境

集群/分布式模式需要修改

/opt/hadoop-2.7.3/etc/hadoop中的七个配置文件,slaves、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml、hadoop-env.sh、yarn-env.sh,其中文件

mapred-site.xml (需要先重命名,默认文件名为 mapred-site.xml.template)

切换到/opt/hadoop-2.7.3/etc/hadoop目录下

cd /opt/hadoop-2.7.3/etc/hadoop

ls

image

重命名mapred-site.xml.template为mapred-site.xml

mv mapred-site.xml.template mapred-site.xml

image

ls

image

3.1、文件 slaves,将作为 DataNode 的主机名写入该文件,每行一个,默认为

localhost,分布式配置可以保留 localhost,也可以删掉,让 Master 节点仅作为

NameNode 使用。 这里让 master 节点仅作为 NameNode 使用,因此将文件中原来的

localhost 删除,添加两行内容:Slave1和Slave2。

编辑slaves文件

vim slaves

编辑如下:

<pre class="md-fences md-end-block" lang="" contenteditable="false" cid="n136" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: Consolas, "Liberation Mono", Courier, monospace; font-size: 0.9em; white-space: pre; display: block; break-inside: avoid; text-align: left; background-image: ; background-position: var(--code-block-bg-color); background-size: ; background-repeat: var(--code-block-bg-color); background-attachment: ; background-origin: ; background-clip: ; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(221, 221, 221); border-radius: 3px; padding: 8px 1em 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

slave1

slave2

</pre>

image

3.2、编辑文件 core-site.xml,改为下面的配置

vim core-site.xml

配置文件编辑如下:

<pre class="md-fences md-end-block" lang="" contenteditable="false" cid="n144" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: Consolas, "Liberation Mono", Courier, monospace; font-size: 0.9em; white-space: pre; display: block; break-inside: avoid; text-align: left; background-image: ; background-position: var(--code-block-bg-color); background-size: ; background-repeat: var(--code-block-bg-color); background-attachment: ; background-origin: ; background-clip: ; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(221, 221, 221); border-radius: 3px; padding: 8px 1em 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://master:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/opt/tmp</value>

</property>

</configuration>

</pre>

image

3.3、编辑文件 hdfs-site.xml,其中dfs.replication 一般设为 3吧 ,但我们有两个

Slave 节点,所以 dfs.replication 的值还是设为 2。

vim hdfs-site.xml

配置文件编辑如下

<pre class="md-fences md-end-block" lang="" contenteditable="false" cid="n155" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: Consolas, "Liberation Mono", Courier, monospace; font-size: 0.9em; white-space: pre; display: block; break-inside: avoid; text-align: left; background-image: ; background-position: var(--code-block-bg-color); background-size: ; background-repeat: var(--code-block-bg-color); background-attachment: ; background-origin: ; background-clip: ; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(221, 221, 221); border-radius: 3px; padding: 8px 1em 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

<configuration>

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>master:9001</value>

</property>

<property>

<name>dfs.replication</name>

<value>2</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>/opt/dfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>/opt/dfs/data</value>

</property>

</configuration>

</pre>

image

3.4、编辑文件 yarn-site.xml

vim yarn-site.xml

<pre class="md-fences md-end-block" lang="" contenteditable="false" cid="n162" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: Consolas, "Liberation Mono", Courier, monospace; font-size: 0.9em; white-space: pre; display: block; break-inside: avoid; text-align: left; background-image: ; background-position: var(--code-block-bg-color); background-size: ; background-repeat: var(--code-block-bg-color); background-attachment: ; background-origin: ; background-clip: ; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(221, 221, 221); border-radius: 3px; padding: 8px 1em 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

<configuration>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<property>

<name>yarn.resourcemanager.hostname</name>

<value>master</value>

</property>

</configuration>

</pre>

image

3.5、编辑文件 mapred-site.xml

vim mapred-site.xml

<pre class="md-fences md-end-block" lang="" contenteditable="false" cid="n169" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: Consolas, "Liberation Mono", Courier, monospace; font-size: 0.9em; white-space: pre; display: block; break-inside: avoid; text-align: left; background-image: ; background-position: var(--code-block-bg-color); background-size: ; background-repeat: var(--code-block-bg-color); background-attachment: ; background-origin: ; background-clip: ; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(221, 221, 221); border-radius: 3px; padding: 8px 1em 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

<configuration>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

<final>true</final>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>master:10020</value>

</property>

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>master:19888</value>

</property>

</configuration>

</pre>

image

3.6、修改hadoop-env.sh文件下面java的路径

vim hadoop-env.sh

配置文件编辑如下:

export JAVA_HOME=/opt/jdk1.8.0_111

image

3.7、修改yarn-env.sh文件,修改JAVA_HOME值

vim yarn-env.sh

配置文件编辑如下:

export JAVA_HOME=/opt/jdk1.8.0_111

image

前提:安装hadoop时,master和slave节点配置文件完全相同,这里介绍了master的安装及配置。Slave可以通过手动配置,配置时请参考master,也可通过scp命令将master配置文件拷贝到slave的相同目录下,如:

scp -r /opt/hadoop-2.7.3 root@slave1:/opt

scp -r /opt/hadoop-2.7.3 root@slave2:/opt

将master节点的配置文件拷贝到slave节点,其中 scp -r 表示拷贝目录。

启动hadoop

前提:启动hadoop时,在master节点上面启动。

1、第一次启动需要在master的hadooop安装目录(/opt/hadoop-2.7.3)下执行format。

cd /opt/hadoop-2.7.3

./bin/hdfs namenode -format

image

2、启动hadoop命令,在master的hadooop安装目录的sbin(/opt/hadoop-2.7.3/sbin)下执行。

cd /opt/hadoop-2.7.3/sbin/

ls

image

2.1、启动命令

start-all.sh

image

jps查看集群进程

在hadoop集群开启的状态下,执行jps命令查看集群相关进程是否已完全启动。

  • master节点:

  • 启动验证,master节点上应该有4个进程,分别是Jps、NameNode、SecondaryNameNode、ResourceManager,则表示master节点上面启动hadoop成功。

jps

image
  • Slave1节点:

  • 启动验证,slave1节点上应该有3个进程,分别是Jps、DataNode、NodeManager。

jps

image
  • Slave2节点:

  • 启动验证,slave1节点上应该有3个进程,分别是Jps、DataNode、NodeManager。

jps

image

浏览器访问hadoop

1、打开desktop节点

,登录之后(密码为123456),在浏览器上面输入

http://images.handge.cn:50070

,可以查看hadoop集群的概况。注:这里的images.handge.cn是主节点的IP,50070是NameNode默认的端口号。

image

2、打开desktop节点

,登录之后在浏览器上面输入

http://images.handge.cn:8088

,查看hadoop集群中节点的情况。注:这里的images.handge.cn是主节点的IP,8088是默认的ResourceManager的端口号。

image

3、在hadoop集群的概况页面中,点击上方菜单栏里面的Datanodes,可以查看Datanode的详细信息。

image

eclipse配置

说明:Eclipse的配置需要在Desktop节点上,登录默认的密码是123456。

  • 安装插件

  • eclipse想要运行在hadoop集群上,需要安装hadoop-eclipse-plugin插件。首先需要将/opt目录下的hadoop-eclipse-plugin-2.6.0.jar包复制到eclipse的目录的plugins下面。

    1、登录之后,在左边菜单栏点击终端图标,如下:

    image

    1.1、在终端切换到root

    su

    image

    1.2、将/opt目录下的hadoop-eclipse-plugin-2.6.0.jar包复制到eclipse的目录的plugins下。

    scp /opt/hadoop-eclipse-plugin-2.6.0.jar /opt/eclipse/plugins

    image
  • 环境配置

1、启动eclipse,切换到eclipse所在的目录下,这里的目录为(/opt/eclipse)

cd /opt/eclipse

ls

image

1.2、启动eclipse

./eclipse

image

2、点击上方菜单栏里面的“window->Preferences”, 点击Preferences。

2.1、在搜索框中输入hadoop,选择“Hadoop Map/Reduce”。

2.2、点击“浏览”添加hadoop的安装目录(这里的安装目录为:/opt/hadoop-2.7.3)。

image
image

2.3、点击“Apply”应用。 2.4、点击“OK”。

image

3、在界面左边的“Project Explorer”显示出“DFS

Location”,在上方菜单栏点击“window->Open
Perspective->Other”,在弹出框选择“MapReduce栏”,最后点击“OK”。在界面下方会显示如下界面:

image

4、新建一个Location:鼠标右键点击空白区域。如下图:

image

5、编辑新建的Location。如下图:

image

编辑新建的Location,需要注意一下几点:

(a)、Location name 是你为所创建的Location的命名,可以任意填写。

(b)、Map/Reduce(V2)

Master区域,有两个参数需要配置,Host和Port,其中,Host为主节点的hostname或者IP,Port是jobtracker的端口号,这里使用9001。

(c)、DFS

Master区域,同样有两个参数要配置,Host和Port,其中,Host默认和Map/Reduce(V2)

Master区域的Host相同,不需要做更改,Port处需要填写与core-site.xml文件里面的端口,这里填写9000。

6、配置完毕之后,点击“Finish”。在界面下方会出现新建的Location。如下图:

image

在界面左侧的Project

Explorer中,则会出现相应的文件夹。(由于最开始没有建文件夹,因此这里显示为0)。如下图:

image

到这里,eclipse在hadoop-2.7.3上面的搭建已经完成。用户就可以使用Eclipse环境在hadoop集群上进行开发。

停止hadoop

执行停止命令,即:

stop-all.sh

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,214评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,307评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,543评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,221评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,224评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,007评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,313评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,956评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,441评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,925评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,018评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,685评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,234评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,240评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,464评论 1 261
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,467评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,762评论 2 345

推荐阅读更多精彩内容