在當今資料驅動的商業環境中,對資料的有效管理變得尤為重要。其中,主資料管理(MDM)作為確定企業資料品質和一緻性的關鍵環節,一直受到資料管理者的重視。
01.影響主資料判定和識别的因素
上一篇文章(【資料治理】主資料的基本概念和未來展望),在說明主資料的基本概念時,給出了主資料的一些關鍵詞:穩定、複用、高價值。
但是主資料的判定和識别不能脫離具體場景和情況。某一個資料,在不同的情況下,可能會有不同的判定和識别結果。這也是之前文章提到過的。
“在具體實踐過程中,主資料并沒有一個金科玉律般的标準。同一行業不同企業、同一企業不同發展階段,主資料都可能是不一樣的。”
那麼,有哪些影響主資料判定和識别的因素呢?
一般情況下,主資料是相對穩定的。比如,公司的産品資訊、供應商資訊、組織架構、使用者資訊等。但是主資料也會随着業務發展階段、業務營運模式和業務管控政策發生變化,這種情況下,企業就需要根據具體情況進行主資料的增删操作。
1. 業務發展階段
随着業務的發展,某些資料的重要性開始提升并開始在不同系統内被重複使用,業務對這些資料的穩定性提出了更高的要求。是以,這些資料就需要納入主資料管理的範疇。
比如,現在有一個商店,業務發展初期維護了基本使用者資訊。随着業務更好地發展,推出了會員體系。此時,會員資訊會被很多其他業務系統重複使用,是以,使用者的會員相關資料,就需要納入到主資料管理範疇。
2. 業務營運模式
随着市場需求的變化,技術的進步,外部競争環境的變化等,企業也不得不主動或被動地轉變業務營運模式,而營運模式的轉變,會影響主資料的劃分。
比如,京東在初期,以線下銷售為主。在2004年開始嘗試線上銷售,後逐漸發展為以線上銷售為主。
如果京東從一開始就有主資料管理的話,可能在初期,更關注實體店鋪的營運,主資料可能主要集中在商品資訊、供應鍊資訊、庫存資料等方面。
線上銷售時期,除了初期的主資料,還會把線上的商鋪資訊、使用者資訊等都納入到主資料管理。
同樣的一個案例,也是因為業務營運模式的調整,導緻主資料劃分發生了變化。隻不過是對現有主資料進行删減。
2022年比亞迪宣布自2022年3月起停止燃油汽車的整車生産。這次調整,可能會對産品資訊資料、零部件資料産生影響。
3. 業務管控政策
對于一些大型的集團,想要掌控各個分公司的客戶資料,是非常困難的,阻力很大。是以,即使集團總部想掌握這些重要的客戶資料,但是因為沒有辦法被總部利用,沒有辦法在總部流通和使用,是以分公司的客戶,銷售資料,不算主資料。
02.主資料識别方法
主資料的識别是主資料管理中最終的一項工作。主資料不是拍腦袋确定的。需要有比較科學合理的方法。接下來介紹兩種主資料識别的方法。
1. 主資料特征識别法
「如果有一個動物長得像鴨子,叫聲像鴨子,走路像鴨子,那麼它是鴨子」
主資料特征識别法就是這種思路。假如某個資料完全符合主資料的特征,那可以肯定的說,這個資料就是主資料。
在定義的基礎上,擴充一下,可以從以下的幾個角度來判斷資料是否是主資料。
- 高價值性:主要看是否展現業務的核心價值。客戶的基本資訊肯定是具有核心價值的,但是客戶的配送位址所在省份就不是核心價值資料了;
- 實體獨立性:主要展現在不可分割性和完整性。例如,主資料管理中比較高頻的客戶主資料。客戶主資料是作為一個整體被管理的,其包含的各個資訊項(名稱、聯系方式、賬戶等)不會被單獨查分出來作為獨立的資料實體進行管理。完整性指的是,公司在維護相關實體資料時,會盡可能全面地收集資訊,以確定資料的完整、準确;
- 相對穩定性:主資料在時間範圍内保持相對穩定、不頻繁發生變更是主資料的一個重要特征。線上教育行業會維護使用者的基本資訊,其中年齡是一個每年都會變更的資料,那麼年齡就不是主資料,而可以把不變更的生日資料維護進主資料;
- 高共享性:是否被其他系統引用是一個很重要的特征,即使某個資料具有非常高的價值,但是,它隻在某一個系統内流轉,那也不能算是主資料;
- 識别唯一性:主資料具有權威性,而權威性展現在識别唯一性。有些資料在系統内是不具備識别唯一性的。比如,使用者昵稱;
- 長期有效性:短期、臨時使用的資料,一般不會作為主資料。
可以做一個表格,對資料進行判斷。對各個次元進行評估,然後根據每個次元的評估情況判定是否是主資料。
2. 業務共享矩陣法
在特征識别法中,有6個特征。那麼,這6個特征是否可以簡化一下,這樣主資料識别也會更簡便些。
在6個特征中,可以隻選取高價值和高共享。
其他的4個特征,從某種層面講,是這兩個特征的衍生。高共享在一定程度上決定了,資料一定是識别唯一性的。其他的特征也可以推理出。
基于此,有了評估資料的重要程度和共享程度的業務共享矩陣法。
根據兩個次元對字段進行評估,雙高的大機率是主資料,雙低的大機率不是主資料,難點就在于如何區分那些中間狀态的。
我自己總結了一個方法。可以從原點到最右上角畫一條直線。越靠近線右上角的,越有可能是主資料,不過,采用這個辦法也有可能拿不準,這就需要有業務經驗,資料治理經驗的專業老師進行區分了。這個步驟,主要是把那些明顯是,大機率是,明顯不是,大機率不是的資料區分出來。
本文由 @孟老濕 原創釋出于人人都是産品經理。未經許可,禁止轉載
題圖來自 Unsplash,基于CC0協定
該文觀點僅代表作者本人,人人都是産品經理平台僅提供資訊存儲空間服務。