详细图解 快速入门kettle


写在前面一:

数据仓库ETL工具有很多,基于大数据环境下的分析,Hive用的多些。本文介绍国外的 一款开源ETL工具——Kettle。

写在前面二:

所用软件说明:


一、什么是Kettle

Kettle是一款国外开源的ETL工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制

二、Kettle安装配置

2.1、安装jdk

2.2、下载Kettle

Kettle下载链接

2.3、解压缩

      cd /home/yujianxin/kettle/
      unzip pdi-ce-5.0.1-stable.zip

     安装完成后,可以看到生成一个新的文件夹data-integration,则/home/yujianxin/kettle/data-integration即是kettle的安装和执行目录

2.4、配置kettle环境变量

     

2.5、验证Kettle是否安装成功

        cd $KETTLE_HOME 
       执行./kitchen.sh,出现如下提示,则说明kettle安装成功

三、使用Kettle

      3.1、启动kettle

      cd $KETTLE_HOME 
      执行 ./spoon.sh,即可弹出kettle的操作界面


3.2、使用Kettle 

关于Kettle的使用,欢迎qq(1152596901)交流。


相关内容