如何通過RALM模型架構實作種子人群擴充的思想,達成“準而全”的營銷投放述求呢?本文作者通過微信看一看廣告資源位場景下的執行個體,對“Look alike”政策進行了分析,一起來看一下吧。
上篇講完“look alike”常見的機器學習&深度學習政策,我們今天找個具體在微信看一看廣告資源位場景下的執行個體,更加深切感受一下look alike的政策,如何通過RALM模型架構實作種子人群擴充的思想,如何達成“準而全”的營銷投放訴求。
一、RALM模型架構在微信看一看中的應用
RALM模型架構說明
大體的過程主要分成三個子產品,分别是最下層的離線訓練、到線上異步處理,再到線上服務。
1. 離線訓練
離線訓練架構圖
離線訓練,主要包含representation learning(使用者表示學習)和look alike learning(使用者相似性學習),進行完 look alike learning 之後,可以把 user 經過全連接配接層的 user 表達 Eu緩存起來。全量使用者,有10多億,可以 catch 到 KV 中。可以提供給線上服務做緩存,線上不用做實時全量傳播。
1)representation learning(使用者表示學習)
使用者表示學習
這個模型有點類似經典的Youtube 的 DNN雙塔模型,左側下班部分是使用者的各種Feature,通過embeding lookup 然後再pooling,最後把所有的特征做融合,過一個全連接配接層就輸出了User emedding;右邊則是感興趣的item,也會做embedding生成。最後要預測内容:使用者在點選了這麼多 item 之後,下一個要點選的 item,最後要預測的就是表達使用者興趣的 embedding。(每個域表示一個行為分布,例如電商下單行為、公衆号閱讀行為)
2)Look-alike learning(使用者相似性學習)
使用者相似性學習
一個種子使用者需要包含的資訊,可以先做假設,種子使用者的表達= 共性資訊+個性資訊。
- 每個使用者都有自己的興趣,但對整個群體的人群資訊存在不同的貢獻度,我們稱為群體的共性資訊:global info。共性資訊和目标使用者無關,隻和使用者群體自身有關。
- 種子使用者群體的個性資訊。種子群體中一定存在一小部分使用者和 target 使用者興趣相似,這時,當 target 人群變化時,資訊會變化,稱為 local info。
擷取global info的使用者的embedding,首先用 global attention,隻和 user 相關,和 attention merge 的方法類似,也是一個 self-attention。作用是把種子使用者乘以矩陣轉換,再乘以種子使用者自己,所做的就是捕捉使用者群體自身内部的興趣分布。
local info呢,它的公式是把種子使用者的矩陣乘以 w,再乘以 target user 的 embedding,再做一層 softmax,再乘以種子使用者自己,這是一個典型的乘法 attention。它的作用是提取種子使用者群體中和 target user 相關的部分,捕獲種子使用者的 local info。是一個用公式得到的這兩種 local & global embedding 之後,進行權重和,這就是種子使用者群體的全部資訊。
2. 線上異步處理
線上異步處理架構圖
離線訓練結束後,是線上異步處理,主要作用是某些可以離線且和線上請求無關的計算,可以先計算完,如更新種子使用者。每個 item 候選集都會對應一個種子使用者清單,更新種子使用者清單,可以每一分鐘更新一次,這和通路使用者無關,隻和候選集的 item 有關。可以實時拉取使用者的點選日志,更新點選某個候選集的種子清單,保證種子使用者實時性。
- 可以把 global embedding 預計算 ( gl 隻和種子使用者有關,是 self-attenion,可線上做異步處理,如每隔一分鐘算一次 )。
- 計算 k-means 聚類中心,也是隻和種子使用者有關,可以提前計算好,如推到推薦系統記憶體中。
- 所有的東西都是定時更新,不需要線上實時計算。
3. 線上服務
線上服務說明
線上把聚類中心、global embedding 和所有使用者的 embedding 都已緩存好,隻需要拉取 user embedding,和候選集的 global embedding 和聚類中心。線上隻需要計算 local embedding,是 target user 到種子使用者的 attention,這需要根據線上請求的 urn 來實時計算。再計算一次 cosine,就可以得到相似度,這個計算量很小。
4. 最後實驗結果
在微信看一看上的實驗結果
算出 look alike 相似度之後,相似度的分數,可直接給到排序服務,做曝光依據。這是當時原文作者寫論文之前做的線上計劃 AB testing結果,對比的是使用者畫像比對推送的政策,上線之後,在擴大曝光規模的前提下,CTR 基本正向穩定+1.09%(說明擷取到了更多相關性的流量),種類豐富性+8.435%,标簽豐富多樣性+15.938%,說明在擴充過程中同時也獲得了更多多樣性展開的流量。
二、關于look-alike定向政策總結與思考
Look-alike政策RALM模型的在微信看一看政策大體如上,整體上的思路從使用者興趣特征出發,去探究使用者的個性興趣和人群共性興趣去探索種子人群的邊界,并且在上線實驗中也取得了明顯的收益效果,通過離線+線上計算的方式保證了種子人群的實時性和效果。
業界還有非常多關于Look alike的論文,我在這裡就不一一枚舉了,像是阿裡媽媽目标人群擴充政策、網易雲音樂種子人群擴充政策等等。
和大家一起在政策産品道路上“日拱一卒,功不唐捐”,幫助你成為極具職場壁壘的政策産品,如果有幫助到大家歡迎點贊、收藏以及評論一下。
作者:政策産品Arthur,5年大廠政策産品專家。
本文由 @政策産品Arthur 原創釋出于人人都是産品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協定
該文觀點僅代表作者本人,人人都是産品經理平台僅提供資訊存儲空間服務。