談談我的資料倉庫經曆

2020-02-21 23:50:00

目前還是大資料的時代，傳統的資料倉庫早就跟不上大資料的發展。還記得初入資料倉庫這行時，那時候的用的還是oracle+obiee。資料量大到上千萬的時候，前端完全加載不出來。而且那時候的數倉設計，由于資料倉庫用的oracle，費用比較貴，是以盡量的用時間換空間，前端會存在很多元表和事實表的關聯，甚至有些計算都會放到前端計算。這樣就導緻使用者體驗非常差。後面hadoop起來了，分布式的資料倉庫很好的順應了大資料的時代要求，用空間換時間和使用者體驗，是以基本上計算邏輯都由背景計算了，前端隻是表對表的加載而已。是以，目前市面上的各種次元模組化都大同小異，無非都是ODS保留貼源資料，DW層會劃分為兩個細分層級，一個是明細，用來清洗資料，一個是彙總資料，用來過濾口徑等，最後還有一個DM層（有些廠可能不這麼叫），這一層主要是面向應用，包括可視化，大屏，移動端等等。不知道你們所在的公司，資料倉庫，在數倉模型這塊有什麼不同呢？歡迎留言讨論！！！

談談我的資料倉庫經曆

繼續閱讀

Nacos 2.0 更新前後性能對比壓測

hadoop 用MR實作join操作

Centos7 下 Hadoop 2.6.4 分布式叢集環境搭建摘要叢集準備安裝JDK 安裝 Hadoop 2.6.4 部署 slaver1-slaver4 啟動 hadoop 叢集成功了

尚矽谷—韓順平—圖解 Java設計模式（結構型）（55～）

Storm編譯打包過程中遇到的一些問題及解決方法

windows不能在本地計算機上運作oracleDbConsoleorcl

SQL語言基礎：常用的資料查詢語句

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

9.spark Core 進階2--Cashe

淺談企業活動中進行資料分析的重要性

ubuntu14.04下安裝hbse1.0.1.1

User Defined Hadoop DataType

Ambari介紹和架構原理

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

Oracle 批量查詢傳入List 傳回List