shell脚本编程(进阶)

以三台机器搭建的集群为例

1.查看三台机器的进程

[hadoop@ruozedata001 hadoop]$ vi jps.sh
#!/bin/bash

echo "-----------------ruozedata001 process---------------"
ssh ruozedata001 "$JAVA_HOME/bin/jps"
echo "                                                    "


echo "-----------------ruozedata002 process---------------"
ssh ruozedata002 "$JAVA_HOME/bin/jps"
echo "                                                    "


echo "-----------------ruozedata003 process---------------"
ssh ruozedata003 "$JAVA_HOME/bin/jps"
echo "                                                    "
[hadoop@ruozedata001 hadoop]$ ./jps.sh
----------ruozedata001 process------------
3385 Jps
                                                
----------ruozedata002 process------------
2903 Jps
                                                
----------ruozedata003 process------------
2611 Jps

2.拷贝文件脚本

[hadoop@ruozedata001 hadoop]$ vi sync_hadoop.sh 
#!/bin/bash -x

HADOOP_CONF=/home/hadoop/app/hadoop/etc/hadoop/

cd $HADOOP_CONF

# 此处由于机器少 可以直接一个一个写  如果机器多的话  可以使用for循环
scp hadoop-env.sh core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml  ruozedata002:$HADOOP_CONF
scp hadoop-env.sh core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml  ruozedata003:$HADOOP_CONF

exit 0

3.启动集群shell脚本

3.1 编写启动脚本

[hadoop@ruozedata001 hadoop]$ vi start_cluster.sh
#!/bin/bash -x

# 启动zk
ssh ruozedata001 "$ZOOKEEPER_HOME/bin/zkServer.sh start"
ssh ruozedata002 "$ZOOKEEPER_HOME/bin/zkServer.sh start"
ssh ruozedata003 "$ZOOKEEPER_HOME/bin/zkServer.sh start"

# 睡眠5s  zk启动之后不能立马就启动hadoop
sleep 5

#start hdfs+yarn+jobhistory
/home/hadoop/app/hadoop/sbin/start-all.sh

sleep 5s

# 启动ruozedata002机器上的resourcemanager historyserver
ssh ruozedata002 "/home/hadoop/app/hadoop/sbin/yarn-daemon.sh start resourcemanager"
/home/hadoop/app/hadoop/sbin/mr-jobhistory-daemon.sh start historyserver

# 退出
exit 0

3.2 执行脚本并查看进程

# 执行脚本
[hadoop@ruozedata001 hadoop]$ ./start_cluster.sh
# 启动日志如下
+ ssh ruozedata001 '/home/hadoop/app/zookeeper/bin/zkServer.sh start'
JMX enabled by default
Using config: /home/hadoop/app/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
+ ssh ruozedata002 '/home/hadoop/app/zookeeper/bin/zkServer.sh start'
JMX enabled by default
Using config: /home/hadoop/app/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
+ ssh ruozedata003 '/home/hadoop/app/zookeeper/bin/zkServer.sh start'
JMX enabled by default
Using config: /home/hadoop/app/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
+ sleep 5
+ /home/hadoop/app/hadoop/sbin/start-all.sh
This script is Deprecated. Instead use start-dfs.sh and start-yarn.sh
Starting namenodes on [ruozedata001 ruozedata002]
ruozedata001: starting namenode, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/hadoop-hadoop-namenode-ruozedata001.out
ruozedata002: starting namenode, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/hadoop-hadoop-namenode-ruozedata002.out
ruozedata001: starting datanode, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/hadoop-hadoop-datanode-ruozedata001.out
ruozedata002: starting datanode, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/hadoop-hadoop-datanode-ruozedata002.out
ruozedata003: starting datanode, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/hadoop-hadoop-datanode-ruozedata003.out
Starting journal nodes [ruozedata001 ruozedata002 ruozedata003]
ruozedata001: starting journalnode, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/hadoop-hadoop-journalnode-ruozedata001.out
ruozedata003: starting journalnode, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/hadoop-hadoop-journalnode-ruozedata003.out
ruozedata002: starting journalnode, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/hadoop-hadoop-journalnode-ruozedata002.out
Starting ZK Failover Controllers on NN hosts [ruozedata001 ruozedata002]
ruozedata001: starting zkfc, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/hadoop-hadoop-zkfc-ruozedata001.out
ruozedata002: starting zkfc, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/hadoop-hadoop-zkfc-ruozedata002.out
starting yarn daemons
starting resourcemanager, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/yarn-hadoop-resourcemanager-ruozedata001.out
ruozedata003: starting nodemanager, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/yarn-hadoop-nodemanager-ruozedata003.out
ruozedata002: starting nodemanager, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/yarn-hadoop-nodemanager-ruozedata002.out
ruozedata001: starting nodemanager, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/yarn-hadoop-nodemanager-ruozedata001.out
+ sleep 5s
+ ssh ruozedata002 '/home/hadoop/app/hadoop/sbin/yarn-daemon.sh start resourcemanager'
starting resourcemanager, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/yarn-hadoop-resourcemanager-ruozedata002.out
+ /home/hadoop/app/hadoop/sbin/mr-jobhistory-daemon.sh start historyserver
starting historyserver, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/logs/mapred-hadoop-historyserver-ruozedata001.out
+ exit 0

# 执行jps.sh 查看下各机器进程情况
[hadoop@ruozedata001 hadoop]$ ./jps.sh
----------ruozedata001 process------------
3265 Jps
2401 NameNode
3219 JobHistoryServer
2694 JournalNode
2504 DataNode
3066 NodeManager
                                                
----------ruozedata002 process------------
2787 ResourceManager
2628 NodeManager
2260 NameNode
2324 DataNode
2427 JournalNode
2829 Jps
                                                
----------ruozedata003 process------------
2357 JournalNode
2455 NodeManager
2263 DataNode
2585 Jps
# 查看进程会发现启动有问题 缺少zookeeper  zkfc

3.2.1 排查集群未启动成功问题

3.2.1.1 查看zookeeper进程

# 通过ps -ef | grep zookeeper 查看进程
[hadoop@ruozedata001 hadoop]$ ps -ef | grep zookeeper
hadoop    3527  2111  0 15:08 pts/0    00:00:00 grep --color=auto zookeeper
# 未发现zookeeper进程

由于zk没有启动成功，导致zkfc也启动失败

3.2.1.2 查看zk启动日志

# ① 查找zk配置文件 发现没有配置日志目录
[hadoop@ruozedata001 conf]$ cat zoo.cfg

# ② 查找conf目录下的log4j.properties文件
[hadoop@ruozedata001 conf]$ cat log4j.properties
......
zookeeper.log.dir=.
zookeeper.log.file=zookeeper.log
......
# 但通过给定的路径未找到日志文件 zookeeper.log 

# ③ find /home/hadoop -name 'zookeeper.log'
[hadoop@ruozedata001 conf]$ find /home/hadoop -name 'zookeeper.log'
# 没有任何信息打印 说明hadoop用户下不存在
# 用root在根目录下搜索
[root@ruozedata001 ~]# find / -name 'zookeeper.log'

# ④ 查看zk启动脚本  zkServer.sh
[hadoop@ruozedata001 bin]$ vi zkServer.sh
# 由于是启动  所以只需要看start那一块脚本即可
......
_ZOO_DAEMON_OUT="$ZOO_LOG_DIR/zookeeper.out"

case $1 in
start)
    echo  -n "Starting zookeeper ... "
    if [ -f "$ZOOPIDFILE" ]; then
      if kill -0 `cat "$ZOOPIDFILE"` > /dev/null 2>&1; then
         echo $command already running as process `cat "$ZOOPIDFILE"`.
         exit 0
      fi
    fi
    nohup "$JAVA" "-Dzookeeper.log.dir=${ZOO_LOG_DIR}" "-Dzookeeper.root.logger=${ZOO_LOG4J_PROP}" \
    -cp "$CLASSPATH" $JVMFLAGS $ZOOMAIN "$ZOOCFG" > "$_ZOO_DAEMON_OUT" 2>&1 < /dev/null &
......
# 经查找启动脚本会发现 日志文件的后缀被更改成了zookeeper.out

# ⑤ 全局搜索下 zookeeper.out
[root@ruozedata001 ~]# find / -name 'zookeeper.out'
/home/hadoop/app/hadoop-2.6.0-cdh5.15.1/etc/hadoop/zookeeper.out
/home/hadoop/app/zookeeper-3.4.6/conf/zookeeper.out
/home/hadoop/zookeeper.out # 该文件为日志文件
[root@ruozedata001 ~]# cat /home/hadoop/zookeeper.out
nohup: failed to run command ‘java’: No such file or directory
# 此时问题找到

# ⑥ 分析错误 直接执行ssh查找java   发现找不到java  但是却可以找到环境变量  且 单独执行which java也是存在的
[hadoop@ruozedata001 ~]$ ssh ruozedata001 "which java"
which: no java in (/usr/local/bin:/usr/bin)
[hadoop@ruozedata001 ~]$ ssh ruozedata001 "echo $JAVA_HOME"
/usr/java/jdk1.8.0_40
[hadoop@ruozedata001 ~]$ which java
/usr/java/jdk1.8.0_40/bin/java

# ⑦ 继续查看zkServer.sh启动脚本 从头开始看 主要为了找到zkServer.sh脚本中$JAVA在哪里赋值的
# 会发现如下部分
[hadoop@ruozedata001 bin]$ vi zkServer.sh
......
if [ -e "$ZOOBIN/../libexec/zkEnv.sh" ]; then
  . "$ZOOBINDIR/../libexec/zkEnv.sh"
else
  . "$ZOOBINDIR/zkEnv.sh"
fi
......
# 查看zkEnv.sh   找到如下赋值
[hadoop@ruozedata001 bin]$ vi zkEnv.sh
......
#手动加一句打印  为了查看环境变量是否存在
echo "---------------java: $JAVA_HOME-------------"

if [ "$JAVA_HOME" != "" ]; then
  JAVA="$JAVA_HOME/bin/java"
else
  JAVA=java
fi
......
# 尝试ssh启动zk
[hadoop@ruozedata001 bin]$ ssh ruozedata001 "$ZOOKEEPER_HOME/bin/zkServer.sh start"
JMX enabled by default
---------------java: -------------
Using config: /home/hadoop/app/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
# 上面结果显示未读取到环境变量JAVA_HOME  且下面结果中没有zk进程
[hadoop@ruozedata001 bin]$ ps -ef | grep zookeeper
hadoop    4284  3989  0 15:58 pts/2    00:00:00 grep --color=auto zookeeper

# ⑧ 解决方案：
# 1.在zkEnv.sh中写死java路径
[hadoop@ruozedata001 bin]$ vi zkEnv.sh
if [ "$JAVA_HOME" != "" ]; then
  JAVA="$JAVA_HOME/bin/java"
else
  JAVA=/usr/java/jdk1.8.0_40/bin/java
fi
# 2.将java环境变量配置到hadoop用户的 ~/.bashrc中
[hadoop@ruozedata001 bin]$ vi ~/.bashrc
export JAVA_HOME=/usr/java/jdk1.8.0_40
export PATH=$JAVA_HOME/bin:$PATH
# 验证下是可以读取到的
[hadoop@ruozedata001 bin]$ ssh ruozedata001 "which java"
/usr/java/jdk1.8.0_40/bin/java
[hadoop@ruozedata001 bin]$ ssh ruozedata001 "$ZOOKEEPER_HOME/bin/zkServer.sh start"
JMX enabled by default
---------------java: /usr/java/jdk1.8.0_40------------- # 可以读取到
Using config: /home/hadoop/app/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
[hadoop@ruozedata001 bin]$ jps
4507 Jps
4478 QuorumPeerMain # zk进程存在

# 对应的将~/.bashrc同步到另两台机器上面
[hadoop@ruozedata001 bin]$ scp ~/.bashrc ruozedata002:/home/hadoop/
.bashrc                                                 100%  306     0.3KB/s   00:00    
[hadoop@ruozedata001 bin]$ scp ~/.bashrc ruozedata003:/home/hadoop/
.bashrc                                                 100%  306     0.3KB/s   00:00

3.2.2 补充ssh知识点

3.2.2.1 ssh执行远程命令和脚本

三种环境变量配置

全局： /etc/profile

个人： ~/.bash_profile 或者 ~/.bashrc

⚠️⚠️⚠️ bash模式：加载环境变量配置文件：个人~/.bashrc

3.3. 再次通过shell脚本启动集群

# 启动前先关闭
[hadoop@ruozedata001 hadoop]$ ./stop_cluster.sh 

# 执行启动脚本
[hadoop@ruozedata001 hadoop]$ ./start_cluster.sh 

# 执行jps.sh验证下  zk zkfc都已启动成功
[hadoop@ruozedata001 hadoop]$ ./jps.sh 
----------ruozedata001 process------------
5186 QuorumPeerMain
5330 NameNode
6373 JobHistoryServer
5625 JournalNode
6025 NodeManager
5434 DataNode
5916 ResourceManager
6445 Jps
5805 DFSZKFailoverController
                                                
----------ruozedata002 process------------
4496 NodeManager
4659 ResourceManager
4292 JournalNode
4197 DataNode
4123 NameNode
4060 QuorumPeerMain
4413 DFSZKFailoverController
4717 Jps
                                                
----------ruozedata003 process------------
3090 JournalNode
3186 NodeManager
2995 DataNode
3319 Jps
2938 QuorumPeerMain

4.关闭集群

[hadoop@ruozedata001 hadoop]$ vi stop_cluster.sh 
#!/bin/bash -x

#stop history+yarn+hdfs
/home/hadoop/app/hadoop/sbin/mr-jobhistory-daemon.sh stop historyserver
ssh ruozedata002 "/home/hadoop/app/hadoop/sbin/yarn-daemon.sh stop resourcemanager"

/home/hadoop/app/hadoop/sbin/stop-all.sh

#stop zk
ssh ruozedata001 "$ZOOKEEPER_HOME/bin/zkServer.sh stop"
ssh ruozedata002 "$ZOOKEEPER_HOME/bin/zkServer.sh stop"
ssh ruozedata003 "$ZOOKEEPER_HOME/bin/zkServer.sh stop"

# 调用jps.sh脚本 查看进程
./jps.sh

exit 0

# 执行脚本
[hadoop@ruozedata001 hadoop]$ ./stop_cluster.sh 
+ /home/hadoop/app/hadoop/sbin/mr-jobhistory-daemon.sh stop historyserver
stopping historyserver
+ ssh ruozedata002 '/home/hadoop/app/hadoop/sbin/yarn-daemon.sh stop resourcemanager'
stopping resourcemanager
+ /home/hadoop/app/hadoop/sbin/stop-all.sh
This script is Deprecated. Instead use stop-dfs.sh and stop-yarn.sh
Stopping namenodes on [ruozedata001 ruozedata002]
ruozedata001: stopping namenode
ruozedata002: stopping namenode
ruozedata001: stopping datanode
ruozedata003: stopping datanode
ruozedata002: stopping datanode
Stopping journal nodes [ruozedata001 ruozedata002 ruozedata003]
ruozedata001: stopping journalnode
ruozedata002: stopping journalnode
ruozedata003: stopping journalnode
Stopping ZK Failover Controllers on NN hosts [ruozedata001 ruozedata002]
ruozedata002: stopping zkfc
ruozedata001: stopping zkfc
stopping yarn daemons
stopping resourcemanager
ruozedata002: stopping nodemanager
ruozedata003: stopping nodemanager
ruozedata001: stopping nodemanager
no proxyserver to stop
+ ssh ruozedata001 '/home/hadoop/app/zookeeper/bin/zkServer.sh stop'
JMX enabled by default
---------------java: /usr/java/jdk1.8.0_40-------------
Using config: /home/hadoop/app/zookeeper/bin/../conf/zoo.cfg
Stopping zookeeper ... STOPPED
+ ssh ruozedata002 '/home/hadoop/app/zookeeper/bin/zkServer.sh stop'
JMX enabled by default
Using config: /home/hadoop/app/zookeeper/bin/../conf/zoo.cfg
Stopping zookeeper ... STOPPED
+ ssh ruozedata003 '/home/hadoop/app/zookeeper/bin/zkServer.sh stop'
JMX enabled by default
Using config: /home/hadoop/app/zookeeper/bin/../conf/zoo.cfg
Stopping zookeeper ... STOPPED
+ ./jps.sh
----------ruozedata001 process------------
7132 Jps
                                                
----------ruozedata002 process------------
5142 Jps
                                                
----------ruozedata003 process------------
3483 Jps
                                                
+ exit 0

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,732评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,496评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,264评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,807评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,806评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,675评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,029评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,683评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 41,704评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,666评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,773评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,413评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,016评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,978评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,204评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,083评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,503评论 2赞 343

shell脚本编程(进阶)

1.查看三台机器的进程

2.拷贝文件脚本

3.启动集群shell脚本

3.1 编写启动脚本

3.2 执行脚本并查看进程

3.2.1 排查集群未启动成功问题

3.2.1.1 查看zookeeper进程

3.2.1.2 查看zk启动日志

3.2.2 补充ssh知识点

3.2.2.1 ssh执行远程命令和脚本

3.3. 再次通过shell脚本启动集群

4.关闭集群

推荐阅读更多精彩内容