Hadoop安装部署过程

Hadoop安装部署过程

------------

1、配置hosts

------------

#在文件末添加

vim /etc/hosts

...

192.169.1.1 hadoop1

...

192.168.43.128 hadoop1

---------------

2、实现本地免密

---------------

#生成秘钥对(根据提示回车)

ssh-keygen

#将公钥拷贝到免密节点

ssh-copy-id hadoop1

#验证(ssh连接如果没提示输入密码,则免密成功)

ssh hadoop1

如果提示22;则需要安装ssh客户端

apt install openssh-server

如果提示登陆被拒绝,则需要修改配置文件为yes

vim /etc/ssh/sshd_config

重启ssh服务

service ssh restart

-----------------

3、解压相关软件包

-----------------

cd /opt

tar -zxvf jdk1.8.0_111.tar.gz

tar -zxvf hadoop-2.7.3.tar.gz

---------------

4、增加环境变量

---------------

#在文件末尾添加

vim /etc/profile

...

export JAVA_HOME=/opt/jdk1.8.0_111

export HADOOP_HOME=/opt/hadoop-2.7.3

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

#使添加环境变量生效

source /etc/profile

#验证

java -version

hadoop version

-------------

5、配置hadoop

-------------

cd hadoop-2.7.3/etc/hadoop

vim hadoop-env.sh

export JAVA_HOME=/opt/jdk1.8.0_111

将 slave 的主机名写入到该文件(这里是单节点伪分布式所以只需要加入本机host)

vim slaves

hadoop1

vim core-site.xml

...

<configuration>

  <property>

    <name>fs.defaultFS</name>

    <value>hdfs://hadoop1:9000</value>

  </property>

 <!-- 指定hadoop运行时产生文件的存储目录 -->

  <property>

    <name>hadoop.tmp.dir</name>

    <value>file:/usr/local/hadoop/tmp</value>

    <description>Abase for other temporary directories.</description>

  </property>

</configuration>

vim hdfs-site.xml

...

<configuration>

  <property>

    <name>dfs.namenode.http-address</name>

      <value>hadoop1:50070</value>

  </property>

  <property>

    <name>dfs.namenode.secondary.http-address</name>

      <value>hadoop1:50090</value>

  </property>

  <!-- 指定HDFS副本的数量 -->

  <property>

    <name>dfs.replication</name>

      <value>1</value>

  </property>

  <property>

    <name>dfs.namenode.name.dir</name>

      <value>file:/usr/local/hadoop/tmp/dfs/name</value>

  </property>

  <property>

    <name>dfs.datanode.data.dir</name>

      <value>file:/usr/local/hadoop/tmp/dfs/data</value>

  </property>

</configuration>

cp mapred-site.xml.template mapred-site.xml

vim mapred-site.xml

...

<!-- 指定mr运行在yarn上 -->

<configuration>

  <property>

    <name>mapreduce.framework.name</name>

    <value>yarn</value>

  </property>

  <property>

    <name>mapreduce.jobhistory.address</name>

    <value>hadoop1:10020</value>

  </property>

  <property>

    <name>mapreduce.jobhistory.webapp.address</name>

    <value>hadoop1:19888</value>

  </property>

</configuration>

vim yarn-site.xml

...

<configuration>

  <property>

    <name>yarn.resoursemanager.hostname</name>

    <value>hadoop1</value>

  </property>

<!-- reducer获取数据的方式 -->

  <property>

    <name>yarn.nodemanager.aux-services</name>

    <value>mapreduce_shuffle</value>

  </property>

</configuration>

-------------

6、启动hadoop

-------------

#注意:

如果以前启动过hadoop,再次格式化,需要将

/usr/local/hadoop/tmp

/usr/local/hadoop/tmp/dfs/name

删除掉,也可以直接删除

/usr/local/hadoop 这个目录,删除命令为:

rm -rf /usr/local/hadoop/

#首次启动需要先在master节点(这里的hadoop1)上执行namenode的格式化操作,成功的话,会看到 "successfully formatted"和"Exitting with status 0"的提示,若为"Exitting with status 1"则是出错。

hdfs namenode -format

#完成 Hadoop 格式化后,在namenode节点上启动Hadoop各个服务,使用jps命令验证相关服务是否运行起来。

start-dfs.sh

jps

**************

58993 NameNode

59601 Jps

59459 SecondaryNameNode

59304 DataNode

**************

start-yarn.sh

jps

**************

58993 NameNode

59649 ResourceManager

59459 SecondaryNameNode

60070 Jps

59767 NodeManager

59304 DataNode

**************

mr-jobhistory-daemon.sh start historyserver

jps

**************

58993 NameNode

59649 ResourceManager

60147 Jps

59459 SecondaryNameNode

59767 NodeManager

59304 DataNode

60108 JobHistoryServer

**************

-------------

7、验证hadoop

-------------

#另外还需要在Master节点(hadoop1)上通过命令

#查看DataNode是否正常启动,如果Live datanode不为0,则说明集群启动成功

HDFS管理界面(NameNode结点) http://hadoop1:50070

(SecondaryNameNode)        htpp://hadoop1:50090

MapReduce管理界面          http://hadoop1:8088

/opt/hadoop-2.7.3/logs/mapred-root-historyserver-hadoop3.out

------------------

hadoop平台性能调优

------------------

vim yarn-site.xml

...

  <property>

    <name>yarn.scheduler.maximum-allocation-mb</name>

    <value>1024</value>

  </property>

...

vim mapred-site.xml

...

  <property>

    <name>mapreduce.map.memory.mb</name>

    <value>2048</value>

  </property>

  <property>

    <name>mapreduce.map.java.opts</name>

    <value>-Xmx768m</value>

  </property>

  <property>

    <name>mapreduce.reduce.memory.mb</name>

    <value>2048</value>

  </property>

  <property>

    <name>mapreduce.reduce.java.opts</name>

    <value>–Xmx1536m</value>

  </property>

...

-------

8、实例

-------

#查看帮助命令

hdfs dfs -help

#创建一个数据导入文件夹

hdfs dfs -mkdir -p /data/input

-p:可以创建多级目录

#在本地创建两个文本,并加入有规律内容

echo "hello world">test1.txt

echo "hello hadoop">test2.txt

#将文件上传至hdfs上

hdfs dfs -put ./*.txt /data/input

#查看hdfs上的文件

hdfs dfs -ls /data/input/

#运行wordcunt(grep)方法进行计算

hadoop jar /opt/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /data/input/ output

#hadoop jar /opt/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep /data/input/ output 'hello'

#查看运行结果

hdfs dfs  -cat output/*

#将结果取回本地

hdfs dfs -get output ./output

#删除hdfs上的文件或文件夹

hdfs dfs -rm -r output

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,968评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,601评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,220评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,416评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,425评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,144评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,432评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,088评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,586评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,028评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,137评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,783评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,343评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,333评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,559评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,595评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,901评论 2 345