天天看點

什麼是企業資料倉庫?

如今,資料分析已經成為幫助企業做出戰略決策的關鍵。軟體工具可以幫助企業發現模式或者發現各種流程的洞察。用于實施這些政策的資料系統通常作為供應商特定的企業資料倉庫解決方案而存在。在這些應用程式中,資訊被加載和結構化,以便從非常大的資料集合中提供最有效的結果。

什麼是企業資料倉庫?

資料倉庫

資料倉庫是用來提供新的業務洞察力的資料中心存儲庫。這些資料代表了業務的全面一緻的觀點。通常,這些曆史資料集具有以下特征::

·面向主題:資料倉庫通常提供特定的主題或業務需求,如銷售或生産效率。

·時變性:資料是曆史性的,是以可以用特定的時間架構來分析結果,例如在過去兩年中按每月或按季度計算。企業資料倉庫通常是由事務系統中封裝的資料提供的,其中隻有最近的資料是必需的。例如,事務系統可能隻反映客戶最近的電話号碼,而資料倉庫将包含所有以前使用的号碼。

·內建性:資料倉庫将來自多個不同來源的資訊整合到同一視圖中。例如,不同的商店可能具有相同産品的不同名稱,但它們仍将具有相同的庫存單元(sku)或零件号。

·非易失性:存儲在企業資料倉庫中的資訊不會改變。為了保持曆史資料的完整性,它是隻讀的,從不改變。

什麼樣的資料加載到資料倉庫?

業務資料操作幾乎是實時的,例如從連鎖商店在pos機終端捕獲的銷售資訊。每日銷售資料由系統捕獲并送入資料檔案。然後,這些檔案将得到etl(提取,轉換和加載)軟體或腳本的管理,或将該資料“歸一化”到可直接上傳到資料倉庫表中的字段。

例如,一家大型零售連鎖店将要捕捉銷售商品的資料,例如,銷售人員,商店,時間,付款方式,特别優惠或優惠券等等。另一家公司可能更有興趣收集客戶服務活動以進行定期績效分析。

大多數存儲的資料是關系型的。這意味着資訊以能夠與單個表連結的數字id字段的形式存在,例如連結到文本的産品名稱的産品id清單和每個不同id的描述。這可以節省企業資料倉庫的空間,同時在資料報告中提供更有意義的資訊。

資料倉庫與傳統資料庫的差別

資料庫通過捕獲資訊(無論是電子自動的還是人工采集的)來支援日常操作。這些也稱為事務或操作資料庫。它們主要用于從源頭捕獲資訊。資料庫還允許對資訊進行編輯,以更加密切地反映真實世界的變化。它們針對資料輸入進行了優化:協調小型而頻繁的更新和添加。資料被組織成行或單個記錄。

什麼是企業資料倉庫?

雖然這兩個系統都可以用于報告,但資料倉庫是為聚集大量固定資訊而設計的。從事務資料中運作的報表中的資訊可能會發生更改。

資料倉庫主要用于報告和分析業務操作,以便識别模式。資訊通常從一個或多個資料庫中提取,成為資料倉庫中的曆史記錄。資料倉庫将反映所有的變化。大多數企業資料倉庫解決方案要求以列或以次元(如時間或位置)的方式存儲資訊,以檢索一系列度量機關,如美元或數量。這允許在相同的報告工具中深入了解各種細節。

資料集市

規模較小的公司,甚至大公司當接近一個特定的資料項目,可能将資料分割更小的、更有限的資料集,被稱為“資料集市”。這樣可以消除過多或不相關資訊的營運開銷。資料集市可以根據需要從資料倉庫中提取,或者單獨存在。

新公司或小公司可能不需要維護資料倉庫。但是在大中型企業中,通常每天都使用事務性資料庫和資料倉庫。重要的差別是,企業資料倉庫解決方案是隻讀和優化的,用于分析不斷增長的業務資料,以支援業務決策。

本文作者:harris

來源:51cto