天天看點

如何直覺地了解什麼是企業資料架構?

作者:小劉老師聊數字化

在數字經濟時代浪潮下,幾乎每一個開展數字化轉型實踐的企業都會接觸到資料架構的概念。建構、完善和優化企業的資料架構,是數字化轉型活動中的核心工作。

在DAMA定義的資料管理架構中,資料架構包括企業資料模型和資料流設計兩部分重要内容。本文結合産業應用實踐,給出一些更加接近業務實操的形象化解釋說明。

資料架構是企業中資料的骨架,有了資料架構,就能清晰地了解企業中的資料,并能用好資料。簡單講,資料架構可以看作是企業中每一條資料的"索引"。

資料架構也是資料治理工作的成果輸出。

本來,企業中的資料是混亂的,缺乏有效的組織結構。當有了資料架構,企業中的資料就可以有結構地組織起來,彼此形成業務聯系。

此時,資料的消費者可以基于這些聯系不斷進行資料科學實驗,以及相應的數字化業務創新。

如何直覺地了解什麼是企業資料架構?

打個形象的比方:

資料架構就是企業的資料地圖,企業中出現的每一條資料,在資料架構上,都是有據可循的。資料架構把"散沙"狀的資料,變成"網絡"狀的資料,在資料與資料之間建構起聯系。

資料架構主要包括:資料模型、資料定義、資料标簽體系(針對定性資料)、資料名額體系(針對定量資料)四個方面的内容:

1. 資料模型

資料模型是系統中的資料在"現實域"中的映射。資料模型通過類、關系、執行個體,描述了資料所表達的業務内涵。

從資料的來源看,資料可以在生産環境和分析環境中。

在生産環境:通常采用"面向過程"的模型,面向過程,就是指,資料存在的意義在于要支援一個特定的業務活動執行完成。

在分析環境:通常采用"面向對象"的模型,面向對象,就是指,資料存在的意義在于要支援圍繞特定的業務實體(人、機器、商品、機構)各方面的特征進行綜合分析,并從中挖掘出基于該實體有價值的商業洞察。

如何直覺地了解什麼是企業資料架構?

從模型的抽象層級來看,模型由高到底可以分為,概念模型,邏輯模型,實體模型。

概念模型在内容上相對穩定,對應的通常是企業級的或業務主題級的資料需求。

邏輯模型與具體的數字化應用相關,對應的是項目級的資料需求。

實體模型是資料應用的設計結果産出,是軟體系統開發的具體技術參照。

2. 資料定義

資料定義是指,每一項資料都必須要有沒有歧義的描述、内涵,以及在系統中的格式限制。

資料的定義需要用"中繼資料"來進行規範。

中繼資料包括業務中繼資料和技術中繼資料。其中:

業務中繼資料規範資料在業務域中的内涵,幫助資料消費者準确了解資料含義,高效率地查詢和應用企業的資料資源。

技術中繼資料規範系統中資料如何存儲和資訊交換,幫助資料庫管理人員和軟硬體系統的開發人員進行可靠的技術項目實施落地。

3. 标簽體系

标簽是資料消費者最終關心的業務對象特征,标簽與資料的差別在于,标簽可以直接提供業務價值。

标簽的取值既可以是描述型的也可以是數值型的,也業務應用中,對描述型(表示分類)的标簽應用較為廣泛。

很多數字化應用的場景就在于為業務實體自動添加标簽,并基于标簽标注結果,進行相應的定制服務(對外支撐)或業務決策(對内支撐)。

标簽的定義來自于前端的具體業務需求。從資料(輸入)到标簽(輸出),可以基于知識規則(專家定義、資料挖掘),也可以基于資料模型(機器學習、深度學習)。

标簽之間可以組成标簽體系,或标簽樹,按照主題、實體、場景等不同次元,将标簽組織成有層次的群組結構。

如何直覺地了解什麼是企業資料架構?

4. 名額體系

名額是用來規定業務對象"定量"的資料特征。廣義上來看,名額屬于标簽的特殊類型。

名額與業務系統客觀感覺、采集到的資料不同,是基于原始資料,通過特定規則(或公式、函數、模型)用機器自動計算而來的。

名額和标簽一樣,背後有具體的業務需求支撐。名額的定義和計算可以支撐業務進度考核與生産營運監控等不同的數字化需求場景。

此外,名額之間可以組成名額體系。

名額體系和名額相比的應用特點在于,實踐中對很多業務對象的評估通常是多元度的,是以,需要基于多個相關的名額對業務對象進行系統、綜合、全面的分析。

如何直覺地了解什麼是企業資料架構?

《大話數字化轉型-迎接全行業的數字未來》,2023,

更多數字化精彩内容,歡迎關注微信公衆号:大話數字化轉型!

作者簡介:

劉通(筆名:數字化劉老師),上海交通大學管理科學博士,數易達科技創始人,數字化講師,自媒體專欄作家,企業數字化咨詢師。聚焦于大健康行業,全管道零售,以及電力産業等領域的數字化轉型解決方案。代表作《大話數字化轉型》、《AIGC新紀元》。

繼續閱讀