天天看點

幹貨丨常用的資料內建ETL工具有哪些?

ETL工具是什麼呢?ETL是英文Extract-Transform-Load的縮寫,用來描述将資料從來源端經過抽取、轉換、加載至目的端的過程。ETL一詞較常用在資料倉庫,但其對象并不限于資料倉庫。

ETL工具用于将異構資料轉換為同類資料,然後由資料科學家用于從資料中獲得有價值的資料,常用的ETL工具有Microsoft-SQL Server內建服務、AWS Glue、Apache NiFi、Informatica PowerCenter、IBM的Infosphere Information Server等。

常用的資料內建ETL工具

1、Microsoft-SQL Server內建服務(SSIS)

為了建構高性能的資料內建解決方案,例如提取,轉換等,SSIS被認為是一個出色的平台。由用于建構和調試程式包的圖形工具和向導,用于執行工作流程功能(包括執行SQL語句,FTP操作等)的任務組成。

SSIS的功能:

資料內建和工作流應用程,用于ETL的資料倉庫工具。

2、AWS Glue

AWS Glue是一種簡單且具有成本效益的,完全托管的無伺服器ETL,用于對資料進行分類并将其跨多個資料源移動。由AWS Glue資料目錄(即中央中繼資料存儲庫,ETL引擎和靈活的計劃)組成。

AWS Glue的功能:

它生成ETL腳本以将資料從源轉換為目标,檢測架構更改并适應您的首選項。

3、Apache NiFi

Apache NiFi支援轉換,資料路由和系統中介邏輯的可擴充且功能強大的有向圖。開發它是為了使系統之間的資料流自動化。流控制器,Web伺服器,内容存儲庫,擴充是Java虛拟機上NiFi的某些元件。

Apache NiFi的功能:

高度可配置,基于Web的使用者界面。

4、Informatica PowerCenter

Informatica PowerCenter是一個資料內建平台,可幫助加快資料內建項目并迅速将資料傳遞業務。

Informatica PowerCenter的功能:

用于分析和應用程式的實時資料,可擴充性和零停機時間。

5、IBM的Infosphere Information Server

IBM Infosphere Information Server是一個提供大量并行功能的平台。此外,它提供了一個高度靈活且可擴充的平台,可以處理所有資料量,是一個平台,允許使用者清理,監視,了解和轉換資料。

Infosphere Information Server的功能:

跨各種系統連接配接資料,評估、分析和監視資料品質。

6、 Qlik Replicate

Qlik Replicate是一個資料內建平台,支援多種用例,其中包括實時資料倉庫,大型機現代化該平台可自動執行複制過程,其中包括跨所有主要資料庫,資料倉庫等生成目标架構。

Qlik Replicate的功能:

資料保護,高性能,實時更新,直覺的GUI,可複制資料攝取和複制

7、OracleData Integrator

Oracle Data Integrator是一個平台,可滿足從高性能批處理裝載到啟用SOA的資料服務等幾乎所有類型的資料內建需求。包括與Oracle Warehouse Builder到Oracle Data Integrator的互操作性。

Oracle Data Integrator的功能:

快速的開發和維護,資料品質防火牆。

8、SAP BusinessObjects資料內建器

借助SAP BusinessObjects Data Integrator,組織可以在分析環境中提取,轉換,內建和加載資料。組織可以從幾乎任何來源提取資料,進行轉換并将其內建到任何目标資料庫中。

SAP的功能:

先進的調試功能,資料品質功能。

9、SAS-資料內建工作室

SAS用于建構,實施和管理資料內建過程,而與平台,應用程式和資料源無關,是一個功能強大的設計工具。該工作室易于管理,具有多使用者環境,可以在大型項目上進行協作。

SAS功能:

提供标準轉換庫,使您可以查詢和使用跨多個系統的資料。

點贊 · 分享 · 轉發

幫助更多需要的人看到

幹貨丨常用的資料內建ETL工具有哪些?

END

幹貨丨常用的資料內建ETL工具有哪些?