資料倉庫(Data Warehouse)是一個面向主題的、內建的、相對穩定的、反映曆史變化的資料集合,用于支援管理決策。可以從兩個層次了解資料倉庫。首先,資料倉庫用于決策支援,面向分析型資料處理,不同于企業現有的操作型資料庫;其次,資料倉庫是對多個異構資料源(包括曆史資料)的有效內建,內建後按主題重組,且存在的資料倉庫中的資料一般不再修改。
1、資料倉庫是面向主題的。傳統的操作型系統是圍繞公司的應用進行組織的。
2、資料倉庫是內建的。資料倉庫實作資料由面向應用的操作型環境向面向分析的資料倉庫內建。資料倉庫中的資料是按照一定的主題域進行組織的。資料倉庫中的資料是在對原有分散的資料庫資料抽取、清理的基礎上經過系統加工、彙總和整理得到,消除了源資料當中的不一緻性,進而保證了資料倉庫内的資訊是關于整個企業的一緻的全局資訊。
3、資料倉庫是非易失的、相對穩定的。資料倉庫的資料主要供企業決策分析之用,所涉及的資料操作主要是資料查詢,隻有少量的修改和删除操作,通常隻需定期加載,重新整理。
4、反映曆史變化。資料倉庫中的資料通常包含曆史資訊,系統記錄了企業從過去某一時刻到目前各個階段的資訊,這這些資訊,可以對企業的發展曆程和未來趨勢作出定量分析和預測。資料倉庫中的資料随時間變化的特性還表現在:資料倉庫中的資料時間期限要遠遠長于操作型系統中的資料時間期限。操作型系統的時間期限一般是60-90天,而資料倉庫中的資料時間期限通常是5-10年。
前端工具主要包括各種報表工具、查詢工具、資料分析工具、資料挖掘工具以及各種基于資料倉庫或數扭集市的應用開發工具。其中資料分析工具主要針對OLAP伺服器,報表工具、資料挖掘工具主要針對資料倉庫。
部門級資料倉庫稱為資料集市。
本文轉自天鬼皇 51CTO部落格,原文連結:http://blog.51cto.com/ghostlan/1305039,如需轉載請自行聯系原作者