本篇主要实现数据力度的转换。
题目是《数据清洗》第六章课后操作题p252.
一、实现对文本文件personnel_data.txt中的数据进行数据粒度的转换,即将文本文件personnel_data.txt中字段为household_register的数据统一成省份(直辖市),并输出到文本文件personnel_data_new.txt中。
1.创建转换
创建新转换,如下图配置。
图1-1 创建转换
2.配置控件
“文本文件输入”控件,双击对其进行配置,包括“文件”,“内容”,“字段”。“文件”选项卡先通过浏览选择文件,然后增加。“内容”选项卡的分隔符为一个Tab。浏览具体配置如下。
图1-2 “文件”选项卡
图1-3 “内容”选项卡
图1-4 “字段”选项卡
“字段选择”控件配置如下。
图1-5 “字段选择”控件
“排序记录”控件配置如下。
图1-6 “排序记录”控件
“表输入”控件,新建数据库连接,配置如下。
图1-7 “表输入”控件
“排序记录”控件配置如下。
图1-8 “排序记录”控件
“记录集连接”控件配置如下。
图1-9 “记录集连接”控件
“字段选择2”控件配置如下。
图1-10 “字段选择2”控件
“排序记录3”控件配置如下。
图1-11 “排序记录3”控件
“表输入2”控件配置如下。
图1-12 “表输入2”控件
“排序记录3”控件配置如下。
图1-13 “排序记录3”控件
“记录集连接2”控件配置如下。
图1-14 “记录集连接2”控件
“字段选择3”控件配置如下。
图1-15 “字段选择3”控件
“表输出”控件配置也是连接数据库。
图1-16 “字段选择3”控件