1、下载 安装 运行
下载 kettle最新下载地址:http://community.pentaho.com/projects/data-integration/
安装 需求环境:
kettle需要jre1.5及以上版本,可以通过oracle官网免费下载;
kettle无需安装,直接解压zip文件到指定的文件夹。在Lunix操作系统上,需要执行以下脚本:
cd Kettle
chmod +x*.sh
运行 kettle中的一个图形用户界面叫spoon,spoon可以设计和运行转换和作业。
在windows中执行spoon.bat,在lunix中执行spoon.sh;
spoon是一个图形设计工具,用来设计和测试数据交换处理流程,也可以通过命令行(终端)执行处理流程。
在spoon中设计作业和转换,kettle提供两种方式存储:资源库和文件;
如果你选择资源库,spoon第一次启动时需要创建资源库;选择文件方法,作业保存文件时的扩展名是kjb,转换文件的扩展名是ktr。
2、示例
1)创建一个新的transformation,点击保存到本地路径,
D:\hxm_test\转换1.ktr;
2)创建一个新的job,点击保存到本地路径,D:\hxm_test\作业1.kjb;
建立转换:
文件->新建转换。
新建转换后在左边的主对象树中建立DB连接用以连接数据库。
建立数据库连接的过程与其他数据库管理软件连接数据库类似。
注意:在数据库连接的过程中,可能会报错 某个数据库连接找不到。那是因为你没有对应的数据库连接驱动,需要下载对应的驱动,放入kettle的lib文件夹。
-
简单的数据表插入\更新
(1)新建表插入
在左边的面板中选择“核心对象”,在核心对象里面选择“输入->表输入”,用鼠标拖动到右边面板。如图所示:
双击拖过来的表,可以编辑表输入。
选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。
(2)通过插入\更新输出到表
在左边面板中选择核心对象,选择“输出->插入\更新”,如图所示:
编辑插入更新:
首先:表输入连接插入更新。(选中表输入,按住shift键,拖向插入更新。)
然后,双击插入更新,进行编辑。
最后,点击运行查看效果。先保存再运行。
-
建立作业
使用作业可以定时或者周期性的执行转换,新建一个作业。从左边面板拖入start和转换。
双击start可以编辑,可以设置执行时间等等
点开转换,可以设置需要执行的转换任务。
最后,点击运行即可。