天天看點

資料應用場景之标簽管理體系

标簽特點:精确描述定位和搜尋,具有生命周期的特性,可以計算,配置和規則化處理。可以用标簽來描述各種結構和非結構化[文檔、圖檔、視訊等]的資料,進而使這些内容被高效的管理。

一、标簽簡介

标簽概念

标簽,最初用來對實物進行分類和标記,例如标明物品的品名、重量、體積、用途等簡要資訊。後來逐漸流行到資料行業,用來标記資料,對資料快速分類擷取和分析。

标簽特點

精确描述定位和搜尋,具有生命周期的特性,可以計算,配置和規則化處理。可以用标簽來描述各種結構和非結構化[文檔、圖檔、視訊等]的資料,進而使這些内容被高效的管理。

  • 描述特征:标簽[手機顔色],特征[紅色,白色];
  • 描述規則:标簽[活躍使用者],規則[每日登陸,産生交易];

标簽價值

  • 精細營運的基礎,有效提高流量精準和效率。
  • 幫助産品快速定位需求資料,進行精準分析;
  • 能幫助客戶更快切入到市場周期中;
  • 深入的預測分析資料并作出及時反應;
  • 基于标簽的開發智能推薦系統;
  • 基于某類下的資料分析,洞察行業特征;

标簽的核心價值,或者說最常用的場景:實時智能推薦,精準化數字營銷。

二、标簽定義

資料應用場景之标簽管理體系

屬性标簽

屬性标簽是描述基本特征,不需要行為産生,也不是基于規則引擎分析,例如基于使用者實名認證資訊,擷取:性别,生日,出生日期等特征。變動頻率極小,且精準性較高。

行為标簽

通過不同業務管道埋點,捕捉使用者的行為資料,基于這些資料分析,形成結果描述的标簽,例如:分析使用者「網購平台」,得到的結果拼多多,淘寶,京東,天貓等。這些都是需要通過行為資料來判斷的标簽。

規則标簽

規則下分析出來的标簽,更多是基于産品或者營運角度來看,例如電商平台需要對會員等級超過5級,且近7天活躍的會員發一次福利,這裡就涉及兩個标簽應用:1.「會員等級」基于什麼規則判斷;2.「近7天活躍」如何判斷,是基于登入,還是産生交易行為,這些都要可以動态配置,然後基于規則引擎把結果生成。基于動态的規則配置,經過計算和分析,生成描述的标簽,也就是規則标簽。

拟合标簽

拟合類标簽極具複雜性,通過對多種标簽智能組合分析,給出預測描述,或者直接給出進階定義,例如所謂的讀心術,即通過多個特征,眼神資訊,判斷人的心理活動。在機器學習中有一句話:通過長期對使用者行為的判斷和學習,機器可能比使用者還了解使用者。

三、标簽管理體系

層級分類

标簽管理的基本手段,通常以行業來分:金融,教育,娛樂等;通過多級分類細化管理。

基礎标簽

即資料的關鍵标簽,特點精确扁平,不可再細分,用來精确的描述資料,類似中繼資料。當使用多個标簽組合描述資料特征,就會形成結構化的表管理。

标簽值類型

值類型:數字,字典,布爾,日期,文本框,自定義等,是對标簽具體值的管理。例如标簽「性别」,标簽值「男.女.未知」,這種典型通過羅列字典來描述的場景。

四、标簽生産流程

1、基礎流程

資料應用場景之标簽管理體系

資料采集

資料采集的管道相對較多,比如同一APP内的各種業務線:購物、支付、理财、外賣、資訊浏覽等等。通過資料通道傳輸到統一的資料聚合平台。有了這些海量日志資料的支撐,才具有資料分析的基礎條件。不管是資料智能,深度學習,算法等都是建立在海量資料的基礎條件上,這樣才能擷取具有價值的分析結果。

資料加工

結合如上業務,通過對海量資料的加工,分析和提取,擷取相對精準的使用者标簽,這裡還有關鍵的一步,就是對已有的使用者标簽進行不斷的驗證和修複,尤其是規則類和拟合類的相關标簽。

标簽庫

通過标簽庫,管理複雜的标簽結果,除了複雜的标簽,和基于時間線的标簽變,标簽資料到這裡,已經具有相當大的價值,可以圍繞标簽庫開放一些收費服務,例如常見的,使用者在某電商APP浏覽某些商品,可以在某資訊流平台看到商品推薦。大資料時代就是這麼令人感覺智能和窒息。

标簽業務

資料走了一大圈轉換成标簽,自然還是要回歸到業務層面,通過對标簽資料的使用者的分析,可以進行精準營銷,和智能推薦等相關操作,電商應用中可以提高成交量,資訊流中可以更好的吸引使用者。

應用層

把上述業務開發成服務,內建到具有的應用層面,不斷提升應用服務的品質,不斷的吸引使用者,提供服務。當然使用者的資料不斷在應用層面産生,在轉到資料采集服務中,最終形成完整的閉環流程。

2、資料聚合池

  • 基于IDmapping技術,置換唯一辨別[uid];
  • 基于uid關聯标簽,放入計算池;
  • 相同的uid攜帶的标簽會以貪吃蛇的方式運作;
  • 不斷豐富該uid下攜帶的标簽内容;

以此方式豐富标簽的場景,産生更大的資料價值;

五、源代碼位址

GitHub·位址
https://github.com/cicadasmile
GitEE·位址
https://gitee.com/cicadasmile
           
資料應用場景之标簽管理體系

繼續閱讀