HADOOP安装及分布式集群配置

一、环境及软件说明

1、虚拟机软件：

Oracle VM VirtualBox 5.2.0

2、系统镜像：

CentOS-7-x86_64-DVD-1611.iso

3、JDK：

jdk-8u121-linux-x64.rpm

4、hadoop安装包：

hadoop-2.7.3.tar.gz

二、安装系统环境

1、安装virtualBox

完成后会在电脑产生一块虚拟网卡：VirtualBox Host-Only Network，其默认地址为192.168.56.1 ，此次安装将会基于VirtaulBox的Host-Only网络模式。

2、安装Centos7 系统

按照网络教程安装。注意，这里在安装时，“软件选择” 以 “基础设施服务器”的模式安装。安装完成后，将当前系统IP设置为192.168.56.200，并开启ssh服务。

三、配置基础环境

1、安装配置JAVA环境

1）上传jdk-8u121-linux-x64.rpm到root用户根目录

2）执行rpm -ivh jdk-8u121-linux-x64.rpm命令进行jdk解压安装，会默认安装在/usr/java/目录下。

安装jdk

默认路径

3) 编辑/etc/profile文件，配置JAVA_HOME、PATH、CLASSPATH，保存后执行source /etc/profile命令是java环境变量配置生效。

配置java环境变量

java版本

2、修改Hostname

1）在centos7环境下，执行hostnamectl set-hostname master命令，将主机名称设置为master（重新登陆后生效）。

配置hostname

主机名称：master

2）编辑/etc/hosts/文件，预先添加slave1、slave2、slave3

添加host信息

3、配置Hadoop

1）创建Hadoop用户及用户组，并授予执行命令的权限

添加用户组：groupadd hadoop

添加用户：useradd hadoop -g hadoop

设置密码：passwd hadoop

授予权限

2）以hadoop用户登录，并将hadoop-2.7.3.tar.gz上传至用户根目录解压。变更目录名称为hadoop

解压并变更目录名称为hadoop

3）修改/home/hadoop/hadoop/etc/hadoop/hadoop-env.sh，配置java环境

配置Hadoop的java环境

4）修改/home/hadoop/hadoop/etc/hadoop/core-site.xml及hdfs-site.xml文件，保存完成后执行hdfs namenode -format格式化hdfs。

编辑core-site.xml

编辑hdfs-site.xml

5）以root用户登陆，编辑/etc/profile文件，配置HADOOP_HOME并更新PATH变量，然后执行source /etc/profile使之生效。可执行hadoop命令查看最终效果。

配置hadoop环境变量

四、配置伪分布式集群

1、物理及逻辑架构

伪分布式模式是在一台单机上运行，没有所谓的在多台机器上进行真正的分布式计算，但用不同的Java进程模仿分布式运行中的各类结点(NameNode,DataNode,SecondaryNameNode)。

2、配置伪分布式环境

1）复制上一步镜像为新的镜像，名称单节点集群，并启动。

复制并启动单节点集群镜像

2）修改设备ip为192.168.56.100

编辑IP配置文件

文件具体内容

执行systemctl restart network 命令使修改生效，执行ifconfig命令显示修改后的ip信息：

执行ifconfig显示IP信息

3）修改hostname为singlenodecluster，修改完成后重新登陆用户生效。

修改hostname

4）使用SSH远程工具、hadoop用户远程登陆singlenodecluster设备

5）修改hadoop配置文件core-site.xml

fs.defaultFS设置集群中NameNode结点的URI；

hadoop.tmp.dir设置默认存储目录为持久化目录。（若hdfs-site.xml中不配置dfs.namenode.name.dir 或者dfs.datanode.data.dir，则默认存储在此目录）

6）修改hadoop hdfs配置文件hdfs-site.xml

dfs.replication ，修改默认存储副本数量为1。

7）执行hdfs namenode -format格式化hdfs

8）清空slaves配置文件内容（之前制作镜像预留，此处需删除）

9) start-dfs.sh 启动集群（此处已做了ssh免密登陆，不需要输入密码。否则会提示输入密码）

启动HDFS集群

执行jps命令可查看当前运行的业务模块，发现NameNode、Datanode、SecondaryNameNode都已启动成功。

10）传输文件校验

执行hdfs dfs -ls /命令可查看到当前hdfs根目录下已有一个文件（早先试验上传），此处我们在上传一个文件。（同名文件在统一目录下只能存在一份）

执行 hdfs dfs -put 本地文件名称 /可将本地硬盘文件上传到HDFS根目录。红线部分标识上传成功。

五、配置完全分布式集群

1、复制虚拟系统

将master复制slave1

依照以上分别复制出slave1、slave2、slave3，并分别修改对应IP和host那么为

192.168.56.201 slave1 ；192.168.56.202 slave2 ；192.168.56.203 slave3 .

2、配置免密登陆

hadoop用户登陆master，执行ssh-keygen -t rsa生成公钥私钥（默认存储在当前用户目录.ssh目录下，如/home/hadoop/.ssh）

生成公钥、私钥

id_rsa:私钥 is_rsa.pub公钥

执行ssh-copy-id ip/hostname，如ssh-copy-id master/slave1/slave2/slave3，将master公钥分别传输到master、slave1、slave2、slave3，这样在执行集群命令时，就不需要再手动输入Namenode及各Datanode设备用户密码。

传输公钥到slave1

3、启动NameNode、DataNode

在master上执行hadoop-daemon.sh start namenode,

在slave上执行hadoop-daemon.sh start datanode，可分别在master和slave上启动namenode和datanode环境。可执行jps查看详情。

启动NameNode和DataNode

NN、DN启动成功

可分别执行hadoop-daemon.sh stop namenode/datanode关闭。

4、集群统一管理

登陆master设备，修改/home/hadoop/hadoop/etc/hadoop/slaves文件，将slave1、slave2、slave3添加到其中，配置datanode（slave）节点信息并保存。

master添加slave信息

至此，可在master管理整个集群。

start-dfs.sh 启动集群

stop-dfs.sh 停止集群

5、校验集群情况

A、报告集群情况

登陆master（即namenode），执行hdfs dfsadmin -report 命令，会显示出namenode以及datanode的集群情况。如图：

集群情况报告1

集群情况报告2

B、Web平台查看

执行netstat -ntlp 可查看当前系统占用的端口。其中9000端口为namenode与datanode之间进行通讯的端口；50070为namenode对外提供的web访问端口。

端口使用情况

浏览器访问http://masterIP:50070，即可显示如下：

Overview标签页显示当前集群的基础情况：

集群基础情况

DataNode标签页显示Slave（即DataNode设备的具体情况）

DataNode 具体信息显示

最后编辑于：2017.12.11 04:35:08

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,378评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,356评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,702评论 0赞 342
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,259评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,263评论 5赞 371
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,036评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,349评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,979评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,469评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,938评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,059评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,703评论 4赞 323
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,257评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,262评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,485评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,501评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,792评论 2赞 345