KETTLE的基础使用

JVM参数

Kettle 8.1默认使用的最大jvm堆内存是2G,执行某些复杂作业可能会出现堆内存溢出错误(OutOfMemoryError),此时就需要调正Kettle的jvm参数。 依旧是data-integration目录下的Spoon.bat文件,找到
这一行,适当增大”-Xmx“参数值即可。 如果出现了栈溢出错误(StackOverFlowError)(一般不会出现),则需要再增加一个参数”-Xss“,数值需要根据本机内存配置适当填写。 如图所示:

1559114496566.png

转换流程

Kettle是个ETL工具,转换流程就是主要进行数据转换(T)步骤设计的地方。当然也包含数据源(E)和目标(L)。 新建转换流程的方式有很多,比如左上角 文件 -> 新建 -> 转换 ,或者点击欢迎页面WORK图标下的New transforation,亦可双击左侧主对象树下的转换图标,又可按快捷键Ctrl + N。 转换流程设计页面左侧核心对象下面是一个个的分类模块,每个分类下面又有许多个功能不同的组件,鼠标按住左侧组件图标拖拽到右侧流程设计面板即可增加一个步骤。

Typora_ckur485Vyl.png

步骤之间需要使用箭头连接,箭头方向表示步骤流向,按住Shift键的同时鼠标点住步骤图标向外拉即可拉出一条箭头(按住鼠标中键也可拉出箭头),将箭头拉向下一个步骤,即可形成一个简单的转换流程:


4OpHJBdx8M.gif

需要注意的是步骤之间箭头的颜色,深色表示连接状态,浅色表示断开状态。比如下面这个转换流程,表输出步骤与上一步骤是断开连接的,执行流程的时候执行到表输出这一步骤后就不会再往下执行了。单击箭头可以调整连接状态。

Gv0TiTIbM7.gif

Ctrl + S保存,将保存为ktr后缀的文件。

作业流程

作业流程,即是对转换流程进行调度的。除了调度转换流程还可以做一些其他的工作,比如文件管理、条件判断、脚本执行等等,也可以调度其他作业流程。 新建作业流程与转换流程类似,快捷键是Ctrl + Alt + N。核心组件在通用分类下,一个作业流程必须包含START组件,可以没有成功组件。作业流程中可以嵌套转换流程和作业流程:

GQwYqhBqMW.gif

与转换流程不同的是,除了步骤之间有连接状态(箭头颜色深浅),还有连接条件(箭头上的图标,一共三种)。上图的这个作业中包含了所有连接条件:

  • 小锁图标,表示不管上一步骤执行结果如何,都执行下一个步骤;

  • 红叉图标,表示只有上一步骤执行出错或者返回FALSE,才执行下一步骤;

  • 绿勾图标,表示只有上一步骤执行成功或者返回TRUE,才执行下一步骤。

单击连接条件图标可以调整连接条件,START步骤与下一步骤之间的连接条件不可修改。 START组件标识着工作流的开始,也是配置定时任务的地方:

img

定时调度功能还是很灵活的,只不过需要一直保持Spoon处于启动状态,一旦Spoon窗口被误关闭,定时任务就无效了,所以一般不使用Kettle自带的这个调度器。比较常用的是使用操作系统的定时任务功能,比如Windows的计划任务,或者可以编写Java程序进行调度 Ctrl + S保存,将保存为kjb后缀的文件。

创建数据库连接

新建一个作业或者转换,可以在主对象树下面看到DB连接选项,双击DB连接或者右键菜单点击新建,打开创建数据库连接窗口。

Typora_qqZkTurOEV.png

选择数据库类型以及连接方式(默认JDBC),填写相应配置:


img

配置完成后点击测试按钮测试一下数据库连接,如下图所示表示配置成功,然后就可以点击确认保存数据库连接了,新建的数据库连接会显示在DB连接分组下:

img

共享数据库连接

新建的数据库连接只能在当前转换或者作业中使用,好在Kettle提供了数据库连接共享功能,在数据库连接名称上鼠标右键,点击共享即可将该数据库连接共享给其他转换或者作业使用,共享成功后,数据库连接名称将加粗显示:

img

另外,数据库连接共享后还会在.kettle目录下生成一个shared.xml文件,文件中记录着被共享的数据库连接信息:

img

警告:如果数据库名为中文,则不能共享该连接,否则会报出异常,影响Spoon的正常使用:

img

如果手误已经发生这种情况,则可以使用记事本打开.kettle目录下的shared.xml文件,手动删除掉database标签值为中文的connection标签即可:

Typora_Q2f8v9uJHu.png

数据库连接参数

创建数据库连接的时候还可以配置一些连接参数,比如连接MySQL的时候可以添加连接编码:

img

这种方式可以解决由于编码不一致导致的中文乱码问题(上图的这个参数配置的前提是数据库字符集也是UTF8)。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,530评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,403评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,120评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,770评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,758评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,649评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,021评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,675评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,931评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,751评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,410评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,004评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,969评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,042评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,493评论 2 343

推荐阅读更多精彩内容