天天看點

大資料與機器學習:實踐方法與行業案例.1.4 本章小結

<b>1.4 本章小結</b>

<b></b>

首先,本章介紹了資料的基本形态以及與之相關的各種資料平台,從資料分析和應用角度來看,資料的基本形态包括生産資料、原始資料和分析資料三種,它們分别對應于三種環境,即生産環境、資料緩沖區和分析環境。

其次,本章着重介紹了分析環境的資料平台,包括傳統資料倉庫平台和大資料平台。在資料倉庫平台中介紹了資料的更新規則和存儲規則,這是資料倉庫平台解決資料入口和出口問題的重要方法。大資料平台主要介紹了大資料平台的基本元件,目的在于給讀者一個整體概念。

然後,本章介紹了mpp資料庫和nosql資料庫的cap定理。mpp資料庫是一種定位于高端分析市場的資料庫産品,一般應用于大型企業資料平台之中;nosql資料庫的cap定理雖然備受争議,但是了解該定理仍然可以為我們建構資料應用提供參考。

最後,本章簡單介紹了應用系統的分類。資料由應用系統而來,最後仍然需要應用到系統中去,才能轉化為價值。第2章的内容正是圍繞讓資料更好地産生價值這一主題展開的。