天天看點

名額和标簽的基礎了解(附下載下傳)

名額和标簽的基礎了解(附下載下傳)

編 輯:理哥

彭友們好,我是老彭啊。之前寫過很多關于名額的内容,但還是總有彭友問我,什麼是名額,什麼是标簽,最本質的差別在哪?如何識别?

講真,不是我喜歡摳字眼,而是真的會遇到這種問題。不解釋清楚就沒辦法繼續溝通。難搞哦!

名額和标簽的基礎了解(附下載下傳)

名額

1.名額是說明總體綜合數量特征的概念,所有名額能用數值來表示,一個完整的統計名額,一定要講時間、地點、範圍(百度);

2.名額的評價較易量化,通常有一定的标準和尺度;

3.名額是生産性思維、拆解式思維,講究的是化整為零,将事物分解開來進行多角度的描述,得到很多的名額;

4.名額最擅長的應用是監測、分析、評價和模組化;

5.名額是業務管理導向的,需要提前規劃,應用場景很多,戰略目标、市場定位、業務監測、業績考核、任務分解、資料分析、資料模組化、BI應用等。

名額和标簽的基礎了解(附下載下傳)

标簽

1. 标簽是對象的屬性,顆粒度到字段級“标簽”則是指從原始資料清洗加工而來,能夠為業務所用并産生價值的資料資源,一般都需要結構化到字段粒度,保障服務化使用。(标簽類目體系)

2. 标簽是合成性思維、聚合式思維,講究的是化零為整,将多個分散的名額按照一定的原理進行綜合加工,得出概括性的結果;

3. 标簽經常也被稱呼為屬性、特征、名額、參數等;

4. 名額是半成品,标簽是成品,标簽是名額進一步産品化的結果;

5. 标簽面向資料應用端,解答的是“資料怎麼用”“資料的價值是什麼”的問題;

6. 标簽是資源,是資産,可定價、可售賣、可交易的一種資料産品;

8. 标簽是應用導向的,跟随業務需求的而變化,随時增加;

9. 标簽最擅長的應用是标注、刻畫、分類和特征提取;

10. 标簽主要應用在客戶分群、畫像、觸客、獲客、黏客、續客、資料模組化、資料可視化等;

11. 标簽的評價一般與使用者的感受、應用的結果有強關聯關系,不同的人、不同的應用場景,标簽能發揮的效果可能大相徑庭。

名額和标簽的基礎了解(附下載下傳)

标簽分層

之前其實說過名額和名額體系,今天就不複述了。主要給彭友們詳細講講标簽。研究标簽可以看一本書《标簽類目體系》,是數瀾的任姐姐的大作~~

1. 了解根目錄、标簽類目、标簽、标簽值四者的差別和聯系,對标簽體系就比較清晰了。下面是保險資産層級思考,可以對應資料中台架構設計思考。

名額和标簽的基礎了解(附下載下傳)

2. 根目錄指向标簽所屬的對象:根目錄往往是一種較為模糊、寬泛、簡單的名詞或動名詞,例如使用者、購房者、酒店、浏覽(記錄)、交易(記錄)、報修(記錄)。

按照資料思維,世上的一切事物都可以歸為人、物、關系三類對象,是以一個用來指向某個對象的詞(名詞指向人、物,動名詞指向關系)都不應該是标簽,往往是标簽根目錄。

在資料實體層面往往映射為某張大寬表中的主鍵,這張大寬表中的資訊都是對該主鍵對象的詳細刻畫和資料記錄:大寬表的列即映射為标簽,大寬表的行記錄則對應于具體的對象在各标簽屬性上的具體屬性值記錄。

3.類目是對标簽的分類:客戶标簽可以分類為基本資訊、地理位置、社交關系等,這些分類名也是類目名。

類目往往由名詞構成。一個類目及其所歸類的标簽在資料實體層面可以和某張具體表對應,例如“客戶”對象的【基本資訊】類目下,有“性别”“年齡”“籍貫”等多個标簽,一般對應于客戶資料庫中的一張客戶基本資訊表,該表中會有“性别”“年齡”“籍貫”等多個字段。

4. 标簽是對象的屬性,顆粒度到字段級:“客戶姓名”“客戶電話”“客戶居住位址”等字段粒度的屬性就是“客戶”對象的标簽。标簽往往由前後兩個名詞構成,前一個名詞作為對象定語修飾後一個名詞。标簽一般對應于某資料庫中某張資料表中的某字段。

5. 标簽值是對象屬性的具體取值:例如【小明】【小紅】是“客戶姓名”标簽的标簽值,【男】【女】是“性别”标簽的标簽值。标簽值往往是形容詞、名詞或數字,一般對應于資料庫中某張資料表中的某字段取值。标簽值的取值類型可以是數值型、文本型、日期型、Key-value型,但主要為數值型。數值型中又分可枚舉的離散值和不可枚舉的連續值。

名額和标簽的基礎了解(附下載下傳)

标簽分類

标簽的分類是為應用服務的,大家可以按需添加。

1. 按照标簽的變化性分為靜态标簽和動态标簽;

2. 按照标簽的指代和評估名額的不同,可分為定性标簽和定量标簽;

3. 按照标簽資産分級分層的方式,可以分為一級标簽、二級标簽、三級标簽等,每一個層級的标簽相當于一個業務次元的切面,符合MECE原則。

5. 按照複雜程度分為:事實标簽、規則标簽和模型标簽。事實标簽通常是寫實的,與名額有較高的重合度,

6. 比如性别,年齡等;規則标簽一般是有一些簡單的規則來控制,符合某種規則時才生成相應的标簽;模型标簽一般需要通過某些機器學習算法來生成。

名額和标簽的基礎了解(附下載下傳)

結論

标簽是對象的屬性,一般到字段粒度,面向資料應用端,是資源,是資産,可定價、可售賣、可交易的一種資料産品,包含屬性、特征、名額、參數等;

名額是可量化的,用數值表示的字段,面向業務管理,需要提前規劃,擅長的應用是監測、分析、評價和模組化;