天天看點

大資料與機器學習:實踐方法與行業案例.1.3 應用系統

<b>1.3 應用系統</b>

<b></b>

前面已經為資料定義了三種基本形态,并認識了各種資料平台。從圖1-1中還可以看到,原始資料主要是由應用系統産生的。作為資料的源頭,我們有必要從資料的角度重新認識應用系統。

從資料角度看,應用系統可以分為兩類:業務驅動的應用系統和資料驅動的應用系統,如圖1-18所示。

圖1-18 應用系統的分類

業務驅動的應用系統側重于業務邏輯的處理,資料是業務邏輯運作的直接結果,它不依賴于現有資料。例如,信用卡交易系統即是一個業務驅動的應用系統,持卡人每一次刷卡消費(觸發業務邏輯),都會産生交易相關的各種資料,這些交易資料的産生是一個從無到有的過程。

資料驅動的應用系統,其主要特點在于業務邏輯需要作用于基礎資料,才能産生新的資料。資料驅動的應用系統一般需要與資料模型、資料标簽等結合使用,這些資料模型及資料标簽均基于已有的曆史資料建構而成。資料模型通常作為業務邏輯的一部分,為業務邏輯提供決策支援。典型的資料驅動的應用系統如個性化推薦系統、資料營銷系統等。

概括來說,業務驅動的應用系統是資料從無到有的過程,資料驅動的應用系統是資料産生資料的過程。無論是業務驅動的應用系統還是資料驅動的應用系統,其産生的資料經過資料脫敏、資料解耦後才能成為原始資料。

資料要産生價值,歸根結底要展現在應用系統中。國内有很多企業在資料離線應用中做得很好,包括資料的分析、資料模型等,但這些資料在系統化、自動化的過程中産生了嚴重的滞後,這顯然是資料向價值轉換路上的一個不足。後面第三部分的内容正是着眼于将資料的離線應用推廣到線上應用,将離線建立的資料模型和推薦模型系統化、自動化,進而更好地實作資料價值。

繼續閱讀