轉換步驟分類:
1. 增加新的列
2. 字元串處理
3. 行列變換
4. 排序/排重/字段選擇
5. 其他轉換步驟
1.增加常量列
增加一列常量的列
其它增加列的操作大同小異,不一一贅述,隻介紹電腦
2.電腦
可以進行數值運算、日期運算等...
更多計算類型的介紹,參見wiki
1.字元串拆分
1.同Java的indexOf,左閉右開的形式
2.将一個字段拆分為多個字段,注意配置拆分後接收的字段
3.拆分成多行
類似上面,不過拆分成多行是這樣的結果:
2.字元串合并
3.字元串替換
值映射:對數值進行映射,例如經典的性别1 0映射為男 女:
正則比對:
4.字元串其它轉換
字元串操作:
可以進行字元串轉義(例如> 轉義為 &gt)、保留/去除字元串裡的數字、移除特殊字元、補充長度
圖示如下:(也叫正規化-列轉行-寬表變窄表/ 反正規化-行轉列-窄表變寬表)
示例如下:
窄表變寬表的配置:注意了解分組字段的含義
1.排序
2.排重
Unique Row: 需要事先排序:
Unique Row(Hash): 不排序,速度快,占記憶體。