軟體設定
配置Java環境,最好配置JAVA1.7以上
處理之後的資料中文亂碼
開發庫和測試庫是同一個mysql資料庫伺服器下不同的shemas而已,最後導到測試庫的資料庫出現中文亂碼。
然後就開始百度了:
添加characterEncoding為utf8的設定,可以看到資料源連接配接的進階選項中都已經顯示的制定字元集為utf8,但是文本檔案輸出和插入資料都是亂碼;
資料庫字元集都是utf8的,我試着指定為characterEncoding=gbk,然而還是亂碼。
最後:
在jvm的啟動參數中,添加參數-Dfile.encoding=UTF-8,亂碼問題就解決了(PS:kettle在windows下跑的,然而資料庫是utf8,這是個坑)。貼在這裡吧,如果你試了很多方法都不行,不妨指定kettle這個程式的字元集。
顯示正常
設定資料清洗
sh /home/data/kettle/data-integration/kitchen.sh -file=/home/data/kettle/data-integration/105-106.kjb -logfile=/var/log/kettle.log
執行以上指令即可
遇到驅動報錯需要将
window端
需要将MySQL驅動,jar包放到lib目錄下 重新啟動kettle即可
linux端
需要将MySQL驅動,jar包放到libext/JBDDC目錄下 重新啟動kettle即可