資料內建的兩種架構:ELT和ETL
內建是資料工程師要做的工作之一。一般來說,資料工程師的工作包括了資料的ETL和資料挖掘算法的實作。算法實作 可以了解,就是通過資料挖掘算法,從資料倉庫中找到“金子 什麼是ETL呢? ETL是英文Extract. Transform和Load的縮寫,顧名思義它包括了資料抽取、轉換、加載三個過程。ETL可 以說是進行資料挖掘這項工作前的"備菜"過程。
我來解釋一下資料抽取、轉換、加載這三個過程。
ETL的過程為提取(Extract)——轉換(Transform)——加載(Load),在資料源抽取後首先進行轉換,然後将轉換的結果寫入 目的地。