天天看點

kettle學習筆記(六)——kettle轉換步驟

  轉換步驟分類:

    1. 增加新的列

    2. 字元串處理

    3. 行列變換

    4. 排序/排重/字段選擇

    5. 其他轉換步驟

  1.增加常量列

    增加一列常量的列

    

kettle學習筆記(六)——kettle轉換步驟

  其它增加列的操作大同小異,不一一贅述,隻介紹電腦

kettle學習筆記(六)——kettle轉換步驟
kettle學習筆記(六)——kettle轉換步驟

  2.電腦

    可以進行數值運算、日期運算等...

kettle學習筆記(六)——kettle轉換步驟

  更多計算類型的介紹,參見wiki

  1.字元串拆分

kettle學習筆記(六)——kettle轉換步驟

    1.同Java的indexOf,左閉右開的形式

    2.将一個字段拆分為多個字段,注意配置拆分後接收的字段

kettle學習筆記(六)——kettle轉換步驟

    3.拆分成多行

      類似上面,不過拆分成多行是這樣的結果:

      

kettle學習筆記(六)——kettle轉換步驟

  2.字元串合并

kettle學習筆記(六)——kettle轉換步驟

  3.字元串替換

kettle學習筆記(六)——kettle轉換步驟

    值映射:對數值進行映射,例如經典的性别1 0映射為男 女:

kettle學習筆記(六)——kettle轉換步驟

    正則比對:

kettle學習筆記(六)——kettle轉換步驟

  4.字元串其它轉換

kettle學習筆記(六)——kettle轉換步驟

    字元串操作:

kettle學習筆記(六)——kettle轉換步驟

      可以進行字元串轉義(例如> 轉義為 &gt)、保留/去除字元串裡的數字、移除特殊字元、補充長度

  圖示如下:(也叫正規化-列轉行-寬表變窄表/        反正規化-行轉列-窄表變寬表)

  

kettle學習筆記(六)——kettle轉換步驟

  示例如下:

kettle學習筆記(六)——kettle轉換步驟

  窄表變寬表的配置:注意了解分組字段的含義

kettle學習筆記(六)——kettle轉換步驟

 

  1.排序

kettle學習筆記(六)——kettle轉換步驟

  2.排重

    Unique Row: 需要事先排序:

kettle學習筆記(六)——kettle轉換步驟

    Unique Row(Hash): 不排序,速度快,占記憶體。