天天看点

Kettle1、kettle概述2、kettle工程存储方式3、kettle的组成

目录

1、kettle概述

2、kettle工程存储方式

3、kettle的组成

1、kettle概述

开源ETL工具,支持数据库、FTP、文件、rest接口、hdfs、hive等平台的灵敏据进行抽取、转换、传输等操作、java编写跨平台,C/S架构,不支持浏览器模式。

1、易用性:有可视化设计器进行可视化操作,使用简单

2、功能强大:不仅能进行数据传输,能同时进行数据清洗和转换等操作

3、支持多种数据源

4、部署方便:独立部署,不依赖第三方产品

5、使用场景:数据量及增量不大,业务规则变化快

Kettle是一款开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定

2、kettle工程存储方式

1、以XML形式存储

2、以资源库方式存储,数据库资源库和文件资源库

3、kettle的两种设计模式

Transformation转换:完成针对数据的基础转换

job作业:完成整个工作流的控制

3、kettle的组成

勺子:Spoon.bat/Spoon.sh:是一个图形化的界面,windows是.bat,linux是.sh

煎锅:Pan.bat/pan.sh利用pan开源用命令行的形式调用Trans

厨房:kitchen可以使用命令行调用job

菜单:carte是一个轻量级的web容器,用于建立专用、远程的ETL Server