最详细云服务器Centos7下搭建Hadoop伪分布式集群(防各种坑)

前言:搭建期间各种踩坑,本教程基本上能解决Hadoop伪分布式集群搭建以及Hadoop-eclipse-plugin插件使用的各种坑
欢迎带原文链接进行转载:https://www.jianshu.com/p/59fe6cdba293

搭建环境

系统:Centos7.5

Hadoop版本:Hadoop-2.8.5

JDK版本:jkd1.8

Eclipse版本:Version: 2018-09 (4.9.0)

Hadoop-eclipse-plugin插件版本:2.8.5

插件额外需要的文件:hadoopbin_for_hadoop2.8.5.zip

所有资源下载链接:https://download.csdn.net/download/qq_40702317/10780754

一:关闭系统防火墙以及开放安全组端口(云服务器必须)

1.关闭防火墙

Centos6下:

service iptables stop;#立即关闭防火墙，但是重启后失效。
service iptables start;#立即开启防火墙，但是重启后失效。
chkconfig iptables on;#开启防火墙，重启后生效
chkconfig iptables off;#关闭防火墙，重启后生效

Centos7下:

systemctl stop firewalld.service #停止firewall
systemctl disable firewalld.service #禁止firewall开机启动

2.开放安全组,网上教程非常多

贴心小提示:

用云服务器搭建的话,很容易遭到黑客攻击,利用Hadoop的漏洞攻击服务器,让我们的服务器给他们挖矿,建议配置安全组时,仅允许自己的ip进行访问,当然在搭建Hadoop集群时,就需要单独配置给每台服务器公网ip访问的权限

二:配置主机名

Centos6下:

vim /etc/sysconfig/network 修改文件内容
source /etc/sysconfig/network 使修改生效

修改内容如下:
NETWORKING=yes
HOSTNAME=hadoop01

Centos7下:

vim /etc/hostname
修改内容为主机名,修改后重启系统(可以等下面讲解的配置全部修改完成之后进行重启)

三:修改hosts

vim /etc/hosts
以云服务器为例
增加内容为:本机私网ip 主机名

特别注意:如果是本机映射,只能填本机私网ip,如果是其他云服务器,则填写其他云服务器的公网ip地址加主机名,不然无法启动namenode

四:配置免密登录

ssh-keygen
ssh-copy-id [user]@[host]

五:安装jdk以及Hadoop

tar -xf hadoop-2.8.5.tar.gz -C /home/software
tar -xf jdk-8u181-linux-x64.tar.gz -C /home/software

六:配置环境变量

vim /etc/profile

增加内容:
export JAVA_HOME=/home/software/jdk1.8.0_181
export HADOOP_HOME=/home/software/hadoop-2.8.5
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source /etc/profile 使配置生效

七:配置Hadoop

①.进入配置文件目录
cd /home/software/hadoop-2.8.5/etc/hadoop

②.修改Hadoop启动所需的jdk环境目录
vim hadoop-env.sh
修改内容为:export JAVA_HOME=/home/software/jdk1.8.0_181

③vim core-site.xml 修改内容如下

<configuration>
  <property>
    <!--用来指定hdfs的老大，namenode的地址-->
    <name>fs.defaultFS</name> 
    <value>hdfs://miracle01:9000</value>
   </property>
   <property>
     <!--用来指定hadoop运行时产生文件的存放目录-->
   <!--如果不配置,默认放在/tmp目录下,这是一个临时目录,数据>可能会被系统清除-->
     <name>hadoop.tmp.dir</name>
      <value>/home/software/hadoop-2.8.5/tmp</value>
  </property>
</configuration>
欢迎带原文链接进行转载:https://www.jianshu.com/p/59fe6cdba293

④vim hdfs-site.xml 修改内容如下

<configuration>
   <property>
              <name>dfs.replication</name>
              <value>1</value>
  </property>
  <property>
          <name>dfs.client.use.datanode.hostname</name>
          <value>true</value>
  </property>
  <property>
          <name>dfs.datanode.use.datanode.hostname</name>
          <value>true</value>
  </property>
  <property>
      <name>dfs.permissions</name>
      <value>false</value>
  </property>
</configuration>
欢迎带原文链接进行转载:https://www.jianshu.com/p/59fe6cdba293

⑤vim mapred-site.xml 修改内容如下

注意:在/etc/hadoop的目录下，只有一个mapred-site.xml.template文件，复制一个
cp mapred-site.xml.template mapred-site.xml
<configuration>
      <property>  
             
             <name>mapreduce.framework.name</name>
             <value>yarn</value>
      </property>
</configuration>
欢迎带原文链接进行转载:https://www.jianshu.com/p/59fe6cdba293

⑥vim yarn-site.xml 修改内容如下

<configuration>
         <property>
             <!--指定yarn的老大resourcemanager的地址-->
             <name>yarn.resourcemanager.hostname</name>
             <value>miracle01</value>
         </property>
         <property>
             <!--NodeManager获取数据的方式-->
             <name>yarn.nodemanager.aux-services</name>
             <value>mapreduce_shuffle</value>
         </property>
</configuration>
欢迎带原文链接进行转载:https://www.jianshu.com/p/59fe6cdba293

⑦vim slaves 配置主从节点,因为是伪分布式,只需要配置当前主机名
miracle01

⑧reboot 重启

⑨hadoop namenode -format 格式化namenode存储路径

本文链接:https://www.jianshu.com/p/59fe6cdba293

⑩start-all.sh 启动Hadoop

1.查看是否启动成功

本文链接:https://www.jianshu.com/p/59fe6cdba293

2.如果启动失败,查看Hadoop安装目录下的logs目录中的报错信息,根据报错信息排错

3.如果启动成功,浏览器访问,出现如下界面代表成功
访问地址 : 云服务器公网ip:50070端口

本文链接:https://www.jianshu.com/p/59fe6cdba293

七:使用Hadoop-eclipse-plugin插件

1.下载Hadoop-eclipse-plugin.jar,把jar包放到Eclipse安装目录下的plugins下,然后重启Eclipse
2.解压Hadoop-2.8.5.tar.gz到本机电脑

本人目录:D:\Java\eclipsejee201809\Needs\hadoop-2.8.5

3.配置本机电脑的环境变量:

HADOOP_USER_NAME=root
HADOOP_HOME=D:\Java\eclipsejee201809\Needs\hadoop-2.8.5
PATH=%HADOOP_HOME%\bin

4.云服务修改hdfs存储文件的权限

hadoop fs -chmod 777 /

5.开启Eclipse,配置插件,详细看图

第一步:本文链接:https://www.jianshu.com/p/59fe6cdba293

第二步:本文链接:https://www.jianshu.com/p/59fe6cdba293

第三步:本文链接:https://www.jianshu.com/p/59fe6cdba293

第四步:本文链接:https://www.jianshu.com/p/59fe6cdba293

第五步:本文链接:https://www.jianshu.com/p/59fe6cdba293

第六步:本文链接:https://www.jianshu.com/p/59fe6cdba293

6.导入插件额外需要的文件,解压hadoopbin_for_hadoop2.8.5.zip,导入到本机Hadoop根目录的bin目录下,有的电脑还需要把hadoop.dll放到系统盘下的C:\Windows\System32目录下

插件所需文件

7.修改本机电脑的hosts文件

云服务器公网ip 云主机名
188.131.147.117 miracle01

巨坑解释:因为我们拿数据时,先请求到namenode中,namenode返回的是datanode的地址,但是datanode注册的地址是服务器的私网ip,我们本身电脑是无法访问私网ip的,就算是返回的是注册时使用的是主机名,在我们电脑里也没有进行映射,所以我们需要在自己电脑的hosts文件下进行映射

8.如果提示权限问题

在云服务器执行命令:hadoop fs -chmod 777 /

9.连接成功后就可以用插件进行操作了

本文链接:https://www.jianshu.com/p/59fe6cdba293

最后编辑于：2018.11.13 14:29:58

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,482评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,377评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,762评论 0赞 342
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,273评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,289评论 5赞 373
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,046评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,351评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,988评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,476评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,948评论 2赞 324
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,064评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,712评论 4赞 323
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,261评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,264评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,486评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,511评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,802评论 2赞 345

最详细云服务器Centos7下搭建Hadoop伪分布式集群(防各种坑)

搭建环境

所有资源下载链接:https://download.csdn.net/download/qq_40702317/10780754

一:关闭系统防火墙以及开放安全组端口(云服务器必须)

Centos6下:

Centos7下:

贴心小提示:

二:配置主机名

Centos6下:

Centos7下:

三:修改hosts

四:配置免密登录

五:安装jdk以及Hadoop

六:配置环境变量

七:配置Hadoop

七:使用Hadoop-eclipse-plugin插件

推荐阅读更多精彩内容