天天看點

資料倉庫、資料中台、資料湖都是什麼?資料庫資料倉庫資料中台資料湖寫在最後

相信很多人都在最近的招聘市場上看到過招聘要求裡提到了資料倉庫、資料中台,甚至還有資料湖,這些層出不窮的概念讓人困擾。今天我就來跟大家講一講資料倉庫、資料中台以及資料湖的概念及差別。
資料倉庫、資料中台、資料湖都是什麼?資料庫資料倉庫資料中台資料湖寫在最後

資料庫

在了解資料倉庫、資料中台以及資料湖之前,我們首先要先認識一下資料庫,因為這幾個概念都離不開資料庫的支援。

資料倉庫、資料中台、資料湖都是什麼?資料庫資料倉庫資料中台資料湖寫在最後

資料庫是按照資料結構來組織、存儲和管理資料的倉庫,是一個長期存儲在計算機内的、有組織的、可共享的、統一管理的大量資料的集合。簡單來說,資料庫就是按結構存取資料的地方。

資料倉庫

資料倉庫(Data Warehouse)是一個面向主題的、內建的、相對穩定的、反映曆史變化的資料集合,用于支援管理決策。

  • 面向主題的:根據使用者的需求,将來自不同資料源的資料圍繞着各種主題進行分類整合。
  • 內建的:來自各種資料源的資料按照統一的标準內建于數倉中。
  • 相對穩定的:數倉中的資料是一系列的曆史快照,不允許修改或删除,隻涉及資料查詢。
  • 反映曆史變化的 :數倉會定期接收新的內建資料,進而反映出最新的資料變化。
資料倉庫、資料中台、資料湖都是什麼?資料庫資料倉庫資料中台資料湖寫在最後

簡而言之,資料倉庫也是存儲資料的地方,但不同于資料庫的是資料的來源有很多種,并且可以統一在資料倉庫中進行彙合,然後通過統一的模組化,加工成服務與資料分析的資料模型,輔助企業進行分析決策。

在這裡還要再提一個概念,就是經常會跟随資料倉庫一同出現的——資料集市。通常來說,資料集市是由資料倉庫産生的基于部門級或者工作組級别的特定主題的資料分析環境。這兩個之間最大的差別在于資料範圍的不同,數倉是基于企業搭建的環境,而資料集市則是基于部門搭建的特定分析環境。

資料中台

資料中台是将各個業務闆塊多年來積累的資料,按業務特征進行橫向關聯和統一,按資料用途進行縱向分層,最終沉澱為公共的資料服務能力。資料中台最典型的例子就是阿裡巴巴的 ONEID 體系,也有說 ONEDATA 體系的,資料中台一說也是源于阿裡巴巴的雲栖大會。

資料倉庫、資料中台、資料湖都是什麼?資料庫資料倉庫資料中台資料湖寫在最後

要更好地了解資料中台,可以結合着資料倉庫的概念來解讀。前面已經提到了數倉聚合多種資料源并進行統一模組化最後加工成資料模型輔助企業決策,而資料中台則不僅僅包含了數倉的功能,還能根據資料的表現支援精确推送、商品推薦等資料變現的業務,能夠把資料資産變成資料服務能力。

資料湖

資料倉庫、資料中台、資料湖都是什麼?資料庫資料倉庫資料中台資料湖寫在最後

資料湖相對數倉和資料中台來說是比較偏技術向的概念,它是一套産品組合起來的解決方案,其最主要的作用就是存儲來自不同裝置端、不同應用、不同管道的所有原始資料,包含了關系型和非關系型資料。資料湖就像是一個資料工廠一般,先把所有的資料往裡搬,然後再根據業務的需要進行資料的加工,同時這個工廠也具備了一定的科研能力,會對資料進行挖掘分析,進而幫助預測和發現問題。

寫在最後

産品經理雖然不需要懂技術,但對于市場上新興和比較火爆的概念一定要有足夠的認知了解,才能在需要的時候為團隊為産品創造更大的價值。

想了解更多産品經理相關的知識和經驗,歡迎關注我,和我一起共同進步。