天天看点

Kettle_数据转换

        本篇主要实现数据力度的转换。

        题目是《数据清洗》第六章课后操作题p252.

一、实现对文本文件personnel_data.txt中的数据进行数据粒度的转换,即将文本文件personnel_data.txt中字段为household_register的数据统一成省份(直辖市),并输出到文本文件personnel_data_new.txt中。

1.创建转换

        创建新转换,如下图配置。

Kettle_数据转换

图1-1 创建转换

2.配置控件

         “文本文件输入”控件,双击对其进行配置,包括“文件”,“内容”,“字段”。“文件”选项卡先通过浏览选择文件,然后增加。“内容”选项卡的分隔符为一个Tab。浏览具体配置如下。

Kettle_数据转换

图1-2 “文件”选项卡

Kettle_数据转换

图1-3 “内容”选项卡 

Kettle_数据转换

图1-4 “字段”选项卡

         “字段选择”控件配置如下。

Kettle_数据转换

图1-5 “字段选择”控件

        “排序记录”控件配置如下。

Kettle_数据转换

图1-6 “排序记录”控件

         “表输入”控件,新建数据库连接,配置如下。

Kettle_数据转换

 图1-7 “表输入”控件

        “排序记录”控件配置如下。

Kettle_数据转换

图1-8 “排序记录”控件

        “记录集连接”控件配置如下。

Kettle_数据转换

图1-9 “记录集连接”控件

          “字段选择2”控件配置如下。

Kettle_数据转换

图1-10 “字段选择2”控件

        “排序记录3”控件配置如下。

Kettle_数据转换

图1-11 “排序记录3”控件

        “表输入2”控件配置如下。

Kettle_数据转换

图1-12 “表输入2”控件 

         “排序记录3”控件配置如下。

Kettle_数据转换

图1-13 “排序记录3”控件

         “记录集连接2”控件配置如下。

Kettle_数据转换

图1-14 “记录集连接2”控件

         “字段选择3”控件配置如下。

Kettle_数据转换

 图1-15 “字段选择3”控件

        “表输出”控件配置也是连接数据库。

Kettle_数据转换

 图1-16 “字段选择3”控件

继续阅读