Azkaban集群模式安装与execute-as-user配置

简介

Azkaban在官网上的说明中介绍是支持集群模式的,网上看了不少文章,写得最多的是solo-server安装,零星的有几篇集群安装,但也没有说到很详细的地步。 而且execute-as-user都是关闭的,这个特性对我们很重要,因为HDFS上的操作如果没有这个特性,就是所有操作都是一个用户做的,问题追溯很不方便。 这次正好工作中有机会做安装,运维同事又档期不足,所以顺便把整个过程记录下来。

注意:所有的配置与启动操作都需要使用root账号

准备工作

下载源码

Azkaban官网上没有构建好的发布包,代码版本:3.50.0。下载

构建环境准备

构建Azkaban代码,需要的组件: Gradle
gcc g++ git 这三个都用yum做安装。

构建

安装组件完毕后,进入到azkaban的源代码根目录,执行操作

./gradlew build
./gradlew installDist

构建之后,每个组件的包在自己的目录里,这些目录里有build/distributions,构建结果就在这里。

特殊组件

execute-as-user特性由单独的一个名为execute-as-user.c文件编译的结果提供的,但是用gradle构建不会编译这个c文件。
当前版本中,这个文件在 az-exec-util/src/main/c目录下。

使用 gcc execute-as-user.c -o execute-as-user 命令编译
然后使用chown root execute-as-user 和 chmod 6050 execute-as-user 设置权限
设置完权限后,ls -l 看下,这个文件的属性这样的

---Sr-s--- 1 root root 10185 Aug  3 13:02 execute-as-user

如果我们要把这个文件复制到其他目录下,就又会变成普通文件,记得复制完了再做一次 chmod 6050 execute-as-user

部署

把azkaban-web-server.0.1.0.tar.gz和azkaban-exec-server.0.1.0.tar.gz 分别放到不同的机器上。我测试用就放到了两台机器的/opt目录下,后面文章中两台机器分别命名为web-server和exec-server。

配置

MySQL

为Azkaban安装MySQL的操作网上太多了,此处忽略掉了。唯一要注意的是,这个版本的sql创建脚本中,有一些字段varchar类型长度超过了mysql的限制,所以创建表的时候如果报错,把varchar字段长度修改为128即可。目前发现的表一个是execution_logs,另外一个是execution_jobs。

web-server

登录到web-server机器上,进入/opt目录,解压azkaban-web-server-0.1.0-SNAPSHOT.tar.gz ,把azkaban-web-server-0.1.0-SNAPSHOT目录修改为azkaban-web目录,进入目录内部

补全目录

当前目录内有 bin lib web 三个目录,还需要手动建立 conf extlib plugins三个目录。

  • bin 启动停止脚本
  • conf 配置文件
  • extlib mysql驱动
  • lib azkaban的jar文件
  • web web-server的web资源,css js之类
  • plugins 插件

配置web-server

进入conf目录,这里面应该放四个配置文件 azkaban.properties、global.properties和azkaban-users.xml、log4j.properties,编译好的solo-server里有这些配置文件,可以copy过来。我们主要修改的就是azkaban.properties。

keystore

web-server内置的jetty会是可以开启ssl的,我们需要为ssl生成key,这个操作网上一搜一大把。比如这里,按照说明步骤,一顿无脑操作,得到keystore和truststore

azkaban.properties

这个文件里的内容如下

# web-server个性化设置,包azkaban的名称,标签,颜色,sevlet路径,web资源路径,时区。除了时区之外我们都用默认的
azkaban.name=Azkaban
azkaban.label=BigdataTeam
azkaban.color=#FF3601
azkaban.default.servlet.path=/index
web.resource.dir=web/
default.timezone.id=Asia/Shanghai
# 用户管理配置,使用默认的管理类XmlUserManager,配置文件就是之前说的azkaban-users.xml
user.manager.class=azkaban.user.XmlUserManager
user.manager.xml.file=conf/azkaban-users.xml
# 数据库配置
database.type=mysql
mysql.port=3306
mysql.host=ip地址
mysql.database=azkaban
mysql.user=数据库用户名
mysql.password=数据库密码
mysql.numconnections=100

#Velocity模板
velocity.dev.mode=false
# Jetty配置 开启ssl,没设置端口是因为ssl默认8443
jetty.use.ssl=true
jetty.maxThreads=25
jetty.keystore=刚才生成的keystore的路径+文件名称
jetty.password=keystore生成时输入的第一个密码
jetty.keypassword=keystore生成时输入的第二个密码
jetty.truststore=刚才生成的truststore的路径+文件名称
jetty.trustpassword=truststore生成时输入的密码

#任务监控时发送邮件的账号和目标邮箱地址,我们自己的监控是任务失败短信提醒,所以不需要
mail.sender=
mail.host=
job.failure.email=
job.success.email=
lockdown.create.projects=false
cache.directory=cache
# JMX stats
jetty.connector.stats=true
executor.connector.stats=true
# Azkaban plugin settings
azkaban.jobtype.plugin.dir=plugins/jobtypes

#集群多Executor时的配置,从官网copy的
azkaban.use.multiple.executors=true
azkaban.executorselector.filters=StaticRemainingFlowSize,MinimumFreeMemory,CpuStatus
azkaban.executorselector.comparator.NumberOfAssignedFlowComparator=1
azkaban.executorselector.comparator.Memory=1
azkaban.executorselector.comparator.LastDispatched=1
azkaban.executorselector.comparator.CpuUsage=1

注意:这个脚本里面所有的配置文件都写了相对路径,启动azkaban的时候,就在/opt/azkaban-web目录中使用bin/start-web.sh启动,不然azkaban会找不到配置文件

log4j.properties

官网没提这东西,但是没有这个文件启动不了。去azkaban-web-server的源码中搜了一个,然后放到conf目录里。

azkaban-users.xml

这个文件里我们配置azkaban的用户,具体的配置我先不写了,很简单看这里需要注意的是,因为我们开启了execute-as-user,所以添加的用户都需要是exec-server机器上的操作系统账号,且属于同一个用户组(原因参考exec-server部分的 配置plugins 小节)

exec-server

登录到exec-serve上,进入/opt目录,解压azkaban-exec-server.0.1.0-SNAPSHOT.tag.gz ,将解压得到的目录:azkaban-exec-server.0.1.0-SNAPSHOT重命名为azkaban-exec,进入到这个目录下。

补全目录

进入到这个目录里,子目录为bin和lib,还需要手动创建conf extlib plugins 三个目录

  • bin 启动停止脚本
  • conf 配置文件
  • lib azkaban的jar包
  • extlib mysql驱动包
  • plugins 插件配置

配置exec-server

进入conf目录,这里面应该放三个配置文件 azkaban.properties、global.properties和log4j.properties,编译好的solo-server里有这些配置文件,可以copy过来。我们主要修改的就是azkaban.properties。

azkaban.properties

# 时区配置
default.timezone.id=Asia/Shanghai

# 加载任务时需要的配置
executor.global.properties=conf/global.properties
# azkaban执行任务时,工程代码放的位置
azkaban.project.dir=projects
# MySQL配置
database.type=mysql
mysql.port=3306
mysql.host=IP地址
mysql.database=azkaban
mysql.user=
mysql.password=
mysql.numconnections=100

# 当前executor端口
executor.port=12321
# 邮件配置
mail.sender=
mail.host=
job.failure.email=
job.success.email=

lockdown.create.projects=false
cache.directory=cache
# JMX stats
jetty.connector.stats=true
executor.connector.stats=true
# 插件配置位置
azkaban.jobtype.plugin.dir=plugins/jobtypes

配置plugins

进入plugins目录,创建jobtypes目录,然后cd进去。在这里创建一个名为commonprivate.properties的配置文件。如果要关闭execute-as-user特性,就在这里写execute.as.user=false(默认是true)。但我们就是要这个特性,所以不对这个属性做设置。然后添加如下配置

# 这个配置是我们前面编译的execute-as-user.c文件编译后的结果(就是那个execute-as-user文件)的存储位置,
# 我没试过相对位置,但绝对位置肯定好用
azkaban.native.lib=/opt/azkaban-exec/plugins/jobtypes
# 任务执行的时候,我们开启了execute-as-user属性,
# azkaban不知道登录用户对应的系统用户的所属组,默认会使用azkaban这个组(但很可能当前机器上没有这个组)
# 所以我在executor这个机器上创建了一个bigdata用户组,未来所有使用azkaban的人员他们在这台机器上的账号所属的组都是bigdata
azkaban.group.name=bigdata

log4j.properties

官网同样没提这东西,但是没有这个文件启动不了。去azkaban-exec-server的源码中搜了一个,然后放到conf目录里。

启动

现在这个版本,启动各个节点是有顺序要求的。按下面的顺序来应该没问题

启动exec-server

到azkaban-exec目录下,执行 bin/start-exec.sh ,jps一下应该可以看到进程了。

坑爹要点

修改MySQL数据

启动完exec-server之后,需要到mysql中去把executors表更新一下,把对应的executor的active字段设置为 1 。不然没有状态为1的executor,web-server启动不了。我看exec-server代码中,有一个Servlet对外提供了方法,让web-server启动完毕后,http调用下这个方法,exec-server就会把自己设置为active=1的状态,但是web-server那边启动的时候先判断有没有处在active=1状态的executor,后面才发这个http请求,所以如果不手动设置一下web-server肯定启动报错。不知道是不是azkaban的bug。启动后我们手工发个http请求给exec-server设置active为1是不是可以我还没去尝试。

修改web-server的hosts

启动完executor后,观察executors表中的记录,会发现这个表里的host字段存储的是主机名,web-server通过这个字段和端口字段的值向exec-server发送消息,所以web-server那台机器上的hosts要增加配置。

关闭exec-server

关闭exec-server时要注意,exec-server的代码会根据host和端口把自己这条记录从executors表中删掉,下次启动的时候我们还要手工去设置active字段为1

启动web-server

到azkaban-web目录下,执行bin/start-web.sh,jps下就可以看到进程了。

关闭

web-server和exec-server的bin目录下都有对应的shutdown脚本,bin/shutdown-web.sh 和 bin/shutdown-exec.sh

日志

目前输出的日志文件都在web-server和exec-server的根目录下(/opt/azkaban-web或者/opt/azkaban-exec),有什么问题可以看这里的日志见招拆招

结束

到这里,azkaban应该已经可以正常运行了,到浏览器里敲下 https://xxx.xxx.xxx.xxx:8443 试试吧。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容

  • 安装azkaban时参考了网上的资料,结果没一篇能安装成功的。调试半天才成功,大部分的问题是资料版本太老,gith...
    天夭夭阅读 4,338评论 2 0
  • 一、概述 在上一篇文章中,描述了如果使用源码对Azkaban进行编译并打包的过程,如果用户不想自己手动编译,可以直...
    yannhuang阅读 7,801评论 4 5
  • Spring Boot 参考指南 介绍 转载自:https://www.gitbook.com/book/qbgb...
    毛宇鹏阅读 46,724评论 6 342
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,580评论 18 139
  • 睿王府,也就是霂翾的府邸。用过晚膳,霂翾好不容易把赖在府里不肯走的霂骏给赶走,刚在书房中坐下,侧妃赵悦灵便走了进来...
    时光吹尽眼泪阅读 306评论 0 0