Hadoop学习笔记四:基于Yarn的MapReduce集群搭建

基于Yarn的MapReduce集群搭建可参照官方文档 https://hadoop.apache.org/docs/r2.6.5/hadoop-yarn/hadoop-yarn-site/ResourceManagerHA.html

基础知识

MapReduce
关于MapReduce基础知识,可查阅此篇文章:https://blog.csdn.net/luzhensmart/article/details/90202313
Yarn
关于Yarn基础知识,可查阅此篇文章:https://www.jianshu.com/p/3f406cf438be

服务器准备

本文搭建所用服务器环境是在上篇文章【Hadoop学习笔记三:高可用集群搭建(Hadoop2.x)】https://www.jianshu.com/p/666ff9bbf784 基础上进行的,基于Yarn的MapReduce集群服务器规划方案如下图。

基于Yarn的MapReduce集群.png

一、免密登录

两个ResourceManager节点类似于高可用集群NameNode一个级别,主备之间可能需要进行切换,所以主备节点需要免秘钥登录。按上图所示,需配置Node03和Node04之间免密钥登录。


rm-ha-overview.png

03节点 .ssh 目录下:

ssh-keygen -t dsa -P '' -f ./id_dsa
cat id_dsa.pub >> authorized_keys
scp id_dsa.pub node04:`pwd`/node03.pub

04节点 .ssh 目录下 :

cat node03.pub >> authorized_keys
ssh-keygen -t dsa -P '' -f ./id_dsa
cat id_dsa.pub >> authorized_keys
scp id_dsa.pub node03:`pwd`/node04.pub

03节点 .ssh 目录下:

cat node04.pub >> authorized_keys

二、配置项

1.mapred-site.xml

#重命名
mv mapred-site.xml.template mapred-site.xml 

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>
#参照 官网Single Node Cluster配置Yarn

2.yarn-site.xml

#配置数据洗牌阶段归于yarn管理
 <property>
   <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
 </property>
#参照 官网Single Node Cluster配置Yarn

#官网给出的最简配置
 <property>
   <name>yarn.resourcemanager.ha.enabled</name>
   <value>true</value>
 </property>
 <property>
   <name>yarn.resourcemanager.cluster-id</name>
   <value>cluster1</value>
 </property>
 <property>
   <name>yarn.resourcemanager.ha.rm-ids</name>
   <value>rm1,rm2</value>
 </property>
 <property>
   <name>yarn.resourcemanager.hostname.rm1</name>
   <value>node03</value>
 </property>
 <property>
   <name>yarn.resourcemanager.hostname.rm2</name>
   <value>node04</value>
 </property>
 <property>
   <name>yarn.resourcemanager.zk-address</name>
   <value>node02:2181,node03:2181,node04:2181</value>
 </property>

3.分发两个文件到:02 03 04节点

scp mapred-site.xml yarn-site.xml node02:`pwd`
scp mapred-site.xml yarn-site.xml node03:`pwd`
scp mapred-site.xml yarn-site.xml node04:`pwd`

三、启动集群

1.启动zookeeper

#02/03/04节点同时执行
zkServer.sh start

2.启动hdfs

#node01 节点启动
start-dfs.sh
#注意,有一个脚本不要用,start-all.sh
#如果nn1和 nn2没有启动,需要在node01,node02分别手动启动:
hadoop-daemon.sh start namenode 

3.启动yarn

#启动NodeManager
 start-yarn.sh
#在03,04节点 启动ResourceManager
yarn-daemon.sh start resourcemanager

浏览器访问: node03:8088 node04:8088

四、停止集群

#node01上执行
stop-dfs.sh 

#node01上停止NodeManager
stop-yarn.sh

#node03,node04停止ResourceManager
yarn-daemon.sh stop resourcemanager 

#node02,node03,node04上停止zk
zkServer.sh stop

五、测试计算能力

#test.txt 是 【Hadoop学习笔记二:全分布式搭建(Hadoop1.x)】 时上传
hadoop jar hadoop-mapreduce-examples-2.6.5.jar wordcount test.txt /wordcount

计算过程可在浏览器查看进度
http://node04:8088/cluster

19/12/01 04:40:46 INFO client.ConfiguredRMFailoverProxyProvider: Failing over to rm2
19/12/01 04:40:47 INFO input.FileInputFormat: Total input paths to process : 1
19/12/01 04:40:47 INFO mapreduce.JobSubmitter: number of splits:2
19/12/01 04:40:49 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1575143975107_0004
19/12/01 04:40:49 INFO impl.YarnClientImpl: Submitted application application_1575143975107_0004
19/12/01 04:40:50 INFO mapreduce.Job: The url to track the job: http://node04:8088/proxy/application_1575143975107_0004/
19/12/01 04:40:50 INFO mapreduce.Job: Running job: job_1575143975107_0004
19/12/01 04:41:49 INFO mapreduce.Job: Job job_1575143975107_0004 running in uber mode : false
19/12/01 04:41:49 INFO mapreduce.Job:  map 0% reduce 0%
19/12/01 04:43:30 INFO mapreduce.Job:  map 33% reduce 0%
19/12/01 04:43:31 INFO mapreduce.Job:  map 50% reduce 0%
19/12/01 04:46:44 INFO mapreduce.Job:  map 50% reduce 17%
19/12/01 04:46:46 INFO mapreduce.Job:  map 100% reduce 17%
19/12/01 04:46:50 INFO mapreduce.Job:  map 100% reduce 43%
19/12/01 04:46:53 INFO mapreduce.Job:  map 100% reduce 100%
19/12/01 04:46:55 INFO mapreduce.Job: Job job_1575143975107_0004 completed successfully

结果查看

hdfs dfs -cat /wordcount/part-r-00000
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,723评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,485评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,998评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,323评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,355评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,079评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,389评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,019评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,519评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,971评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,100评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,738评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,293评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,289评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,517评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,547评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,834评论 2 345

推荐阅读更多精彩内容