开源etl工具 kettle
v5.1.0 免费Spoon版- 软件大小:579.60 MB
- 软件语言:中文
- 软件类型:国产软件 / 数据库类
- 软件授权: 免费软件
- 更新时间:2017-08-02 11:43:58
- 软件等级:
- 软件厂商: -
- 应用平台:WinAll, WinXP, Win7
- 软件官网: http://www.pentaho.com/
相关软件
phpMyAdmin For Linux(MySQL server数据库管理)v5.1.2 官方版
12.00 MB/多国语言[中文]/10.0
microsoft access 2013免费完整版
140.00 MB/中文/4.0
SQLite数据库管理(Navicat for SQLite)v15.0.23 企业注册版
57.98 MB/中文/10.0
HeidiSQL(MySQL图形化管理工具)v11.2.0.6219 绿色中文版
5.77 MB/中文/10.0
mysql数据库管理工具(navicat for mysql)v11.2.6 绿色中文版
20.34 MB/中文/10.0
软件介绍人气软件精品推荐相关文章网友评论下载地址
kettle5.1是生产环境使用的开源工具,用于文本文件,数据表,以及商业和免费的数据库引擎的输入和输出,功能非常齐全,使用面广,需要的用户欢迎来IT猫扑下载~
开源etl工具kettle简介
Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。Kettle是一款国外开源的etl工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法编译。用到的工具包括命令行工具(Pan),小型服务器(Carte),数据库存储库(repository)(Kitchen)或者直接使用IDE(Spoon)。
一款国外开源的etl工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
kettle清理数据库连接的方法:
1:清理shared.xml中的不用的数据库连接。(他的保存位置一般在用户主目录下边的.kettle目录中)
2:用文本编辑软件打开kjb,ktr文件删除用户到的connection项,保存。
Kettle使用教程:
Kettle自己有三个主要组件:Spoon,Kitchen,Pan。其中Spoon是一个图形化的界面,用于windows的时候,先设置环境变量:pentaho_java_home,例如:C:\Program Files\Java\jdk1.7.0_25,其实就是你的java安装目录,1.6以上即可。windows下双击Spoon.bat就可以了,界面如下:
这里我建立了资源库,其实可以用文件形式存储,存储的结构都是xml,但是我还是觉得建立一个资源库比较好,以后看job等情况也比较简单,因为数据表的可读性比xml要好得多。建立资源库和文件资源库只需要把右上角的小加号点一下,就会出现如下如的界面:
选择第一个就是建立数据库版的资源库,之后:
之后:
测试通过之后点击OK就回到最开始的界面,这时候选择test数据库连接,然后出入你的工程(我是这么叫的)ID和name,这里要记住,因为以后kitchen调度的时候要输入这个参数。
在接下来弹出的框中都点“是”,然后会出现这个界面:
这步会在你的用户下建立很多表,所以最好单独给资源库建立一个用户,当然这是在oracle下,mysql下和DB2下最好也采用同样的方式,把资源库和其他库分开。检查一下:
SQL> conn wings/wings@prism
已连接。
SQL> select count(1) from r_repository_log;COUNT(1)
----------
0SQL>
表已经建好了。回到最开始的界面,选择test,点击确定,然后就会出现登录对话框,用户密码默认都是admin,以后可以自己改。
接下来就可以开始用这个工具了。
其实对于简单的数据库数据的抽取,基本只需要转换和作业这两种东西。下面就是建立一个转换的步骤:
1 点击文件-->新建-->转换。
2 在左侧的树状列表中选“主对象树”,新建DB连接。步骤和上面建资源库一样。一个目标库一个源库。
3 在核心对象-->输入这个地方拖出一个表输入,在“输出”目录下拖出“表输出”,在“转换”处拖出一个字段选择来,如图:
每一个对象都可以双击修改属性,下面以抽取world数据库的city表为例。
双击表输入,选择数据库连接,选择源数据库,然后点击“获取SQL查询语句”,在弹出的对话框里进行选择即可,之后会变成这样:
下面点击表输出:
点击字段选择:
这样,一个简单的抽取数据的转换就完成了。执行之,点击上面的绿色开始按钮。
我也处在学习中,希望可以把我的经验分享给和我一样的入门者。
下面是补充部分:
在一个Job或者一个trans建立好之后,就可以建立定时任务了。如果是DS,那么DS客户端本身就支持schedule,但是Kettle因为没有服务端和客户端的概念,因此只有使用linux的crontab,其实Job本身也支持定时,但是你必须保证图形界面一直开着,这样并不如crontab那么好。在命令行里使用kettle很简单,Job用kitchen调度,trans用pan调度。
下面是一个kitchen的调度命令:
bash /home/kettle/data-integration/kitchen.sh /rep kettle_demo /user username /pass passwd /level Minimal /dir /dirname /job jobname
rep那里写自己的资源库名称。
trans和上面一样,略有不同:
bash /home/kettle/data-integration/pan.sh /rep kettle_demo /user username /pass passwd /level Minimal /dir /dirname /trans transname
Kettle项目介绍:
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle 将 ELT 流程编译为 XML 格式,学起来十分简单,Pentaho Data Integration (Kettle) 使用 Java (Swing)开发。Kettle 作为编译器对 XML 格式书写的流程进行编译。这些功能和组件比起 Talend 在丰富性方面稍逊一些,但是您建立复杂 ETL 流程需要的一切元素。Kettle 的 JavaScript 引擎(和 Java 引擎)可以深层地控制对数据的处理。
全球数千家机构依赖于Pentaho的,作出更快,更好的业务决策产生积极影响他们的底线。
运行 Spoon.bat 开始软件。
需要JRE支持,JRE(Java Runtime Environment) v6.0 Update 26 安装版
提取密码: nhau
更多>> 软件截图
推荐应用
navicat for mysql 64位 25.05 MB
下载/中文/2.0 v16.0.110 中文免费版microsoft access 2013 140.00 MB
下载/中文/4.0 免费完整版HeidiSQL(MySQL图形化管理工具) 5.77 MB
下载/中文/10.0 v11.2.0.6219 绿色中文版Oracle 11g 64位/32位 2.05 GB
下载/中文/2.0 v11.2.0.1.0 官方第二版sqlyog ultimate 64位 7.50 MB
下载/中文/7.0 v13.1.1 官方中文注册版Navicat for Oracle 16.70 MB
下载/中文/10.0 v12.0.29 中文版Access数据库查询分析器 6.74 MB
下载/中文/10.0 v2.4 免费中文版dbc2000 win7 64位 16.10 MB
下载/中文/10.0 中文汉化版
其他版本下载
精品推荐 数据库管理
- 更多 (49个) >> 数据库管理 数据库管理软件不仅可以对数据库信息的储存和维护,而且可以帮助开发者解决各种各样的开发问题,Mysql、sql数据库、excel数据库都有相配套的管理系统,本专题向用户推荐了一些十分实用的数据库管理工具。不知道数据库管理工具有哪些?没关系,下面都是一些免费开源的数据库管理工具,用户
Oracle 11g 64位/32位 2.05 GB
/中文/2.0microsoft access 2013 140.00 MB
/中文/4.0HeidiSQL(MySQL图形化管理工具) 5.77 MB
/中文/10.0sqlyog ultimate 64位 7.50 MB
/中文/7.0DB Commander 2000 Pro 8.00 MB
/中文/10.0SQLite Expert Professional(可视化SQL数据库管理) 11.45 MB
/英文/10.0SQLite数据库管理(Navicat for SQLite) 57.98 MB
/中文/10.0mysql数据库管理工具(navicat for mysql) 20.34 MB
/中文/10.0
相关文章
下载地址
开源etl工具 kettle v5.1.0 免费Spoon版
查看所有评论>> 网友评论
更多>> 猜你喜欢
Microsoft SQL Server 2000 Personal Edition
SQL Server 2005 SP2
Microsoft SQL Server 2000简体中文企业版
PowerDesigner
数据库文件转换工具(DBConvert for JSON and SQL)
DFB数据库修复工具DataNumen DBF Repair
mysql for ubuntu
MongoDB Compass可视图形化管理工具
Exportizer(修改编辑数据库软件)
SQL Server Compact 4 安装包
Navicat premium数据库管理软件
Oracle Database 12c数据库软件