天天看點

kettle教程(1) 簡單入門、kettle簡單插入與更新。打開kettle

本文要點:Kettle的建立資料庫連接配接、使用kettle進行簡單的全量對比插入更新:kettle會自動對比使用者設定的對比字段,若目标表不存在該字段,則新插入該條記錄。若存在,則更新。

Kettle簡介:Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運作,資料抽取高效穩定。Kettle 中文名稱叫水壺,該項目的主程式員MATT 希望把各種資料放到一個壺裡,然後以一種指定的格式流出。Kettle這個ETL工具集,它允許你管理來自不同資料庫的資料,通過提供一個圖形化的使用者環境來描述你想做什麼,而不是你想怎麼做。Kettle中有兩種腳本檔案,transformation和job,transformation完成針對資料的基礎轉換,job則完成整個工作流的控制。(引用百度百科)

1、Kettle的下載下傳與安裝(在本文中使用的kettle版本為6.1.0.1-196)

  kettle的最新下載下傳位址:http://community.pentaho.com/projects/data-integration/

2、打開kettle。

  首先解壓下載下傳下來的壓縮包如:pdi-ce-6.1.0.1-196.zip

  然後打開Spoon.bat,如圖所示:

  

kettle教程(1) 簡單入門、kettle簡單插入與更新。打開kettle

  打開後請耐心等待一會兒時間。

3、建立轉換。

  在檔案->建立裝換。

  建立轉換後在左邊的主對象樹中建立DB連接配接用以連接配接資料庫。如圖所示:

kettle教程(1) 簡單入門、kettle簡單插入與更新。打開kettle

  建立資料庫連接配接的過程與其他資料庫管理軟體連接配接資料庫類似。

  注意:在資料庫連結的過程中,可能會報某個資料庫連接配接找不到的異常。那是因為你沒有對應的資料庫連結驅動,請下載下傳對應驅動後,放入kettle的lib檔案夾。

4、簡單的資料表插入\更新

  (1)建立表插入

  在左邊的面闆中選擇“核心對象”,在核心對象裡面選擇“輸入->表輸入”,用滑鼠拖動到右邊面闆。如圖所示:

kettle教程(1) 簡單入門、kettle簡單插入與更新。打開kettle

  輕按兩下拖過來的表,可以編輯表輸入。

  選擇資料庫連接配接和編輯sql語句,在這一步可以點選預覽,檢視自己是否連接配接正确。

kettle教程(1) 簡單入門、kettle簡單插入與更新。打開kettle

  (2)通過插入\更新輸出到表。

  在左邊面闆中選擇核心對象、選擇“輸出->插入\更新”如圖所示:

kettle教程(1) 簡單入門、kettle簡單插入與更新。打開kettle

  編輯插入更新:

  首先:表輸入連接配接插入更新。

    選中表輸入,按住shift鍵,拖向插入更新。

kettle教程(1) 簡單入門、kettle簡單插入與更新。打開kettle

  然後:輕按兩下插入更新,編輯它。

kettle教程(1) 簡單入門、kettle簡單插入與更新。打開kettle

  到這裡基本上,這個轉換就要做完了,可以點選運作檢視效果,看是否有誤,這個要先儲存了才能運作,可以随意儲存到任何一個地方。

5、使用作業控制上面裝換執行。

  使用作業可以定時或周期性的執行轉換,建立一個作業。并從左邊面闆拖入start 和轉換。

kettle教程(1) 簡單入門、kettle簡單插入與更新。打開kettle

  輕按兩下start可以編輯,可以設定執行時間等等

kettle教程(1) 簡單入門、kettle簡單插入與更新。打開kettle

  點開裝換,可以設定需要執行的轉換任務,比如可以執行上面我們做的轉換,XXX.ktr

kettle教程(1) 簡單入門、kettle簡單插入與更新。打開kettle

  最後點選運作即可。

  到這裡,一個簡單的通過作業排程的kettle就算做完了。

附錄:測試資料表

kettle教程(1) 簡單入門、kettle簡單插入與更新。打開kettle