天天看點

搜廣推政策産品:灰盒“look alike”政策在微信看一看上的應用

作者:人人都是産品經理
如何通過RALM模型架構實作種子人群擴充的思想,達成“準而全”的營銷投放述求呢?本文作者通過微信看一看廣告資源位場景下的執行個體,對“Look alike”政策進行了分析,一起來看一下吧。
搜廣推政策産品:灰盒“look alike”政策在微信看一看上的應用

上篇講完“look alike”常見的機器學習&深度學習政策,我們今天找個具體在微信看一看廣告資源位場景下的執行個體,更加深切感受一下look alike的政策,如何通過RALM模型架構實作種子人群擴充的思想,如何達成“準而全”的營銷投放訴求。

一、RALM模型架構在微信看一看中的應用

搜廣推政策産品:灰盒“look alike”政策在微信看一看上的應用

RALM模型架構說明

大體的過程主要分成三個子產品,分别是最下層的離線訓練、到線上異步處理,再到線上服務。

1. 離線訓練

搜廣推政策産品:灰盒“look alike”政策在微信看一看上的應用

離線訓練架構圖

離線訓練,主要包含representation learning(使用者表示學習)和look alike learning(使用者相似性學習),進行完 look alike learning 之後,可以把 user 經過全連接配接層的 user 表達 Eu緩存起來。全量使用者,有10多億,可以 catch 到 KV 中。可以提供給線上服務做緩存,線上不用做實時全量傳播。

1)representation learning(使用者表示學習)

使用者表示學習

這個模型有點類似經典的Youtube 的 DNN雙塔模型,左側下班部分是使用者的各種Feature,通過embeding lookup 然後再pooling,最後把所有的特征做融合,過一個全連接配接層就輸出了User emedding;右邊則是感興趣的item,也會做embedding生成。最後要預測内容:使用者在點選了這麼多 item 之後,下一個要點選的 item,最後要預測的就是表達使用者興趣的 embedding。(每個域表示一個行為分布,例如電商下單行為、公衆号閱讀行為)

2)Look-alike learning(使用者相似性學習)

搜廣推政策産品:灰盒“look alike”政策在微信看一看上的應用

使用者相似性學習

一個種子使用者需要包含的資訊,可以先做假設,種子使用者的表達= 共性資訊+個性資訊。

  • 每個使用者都有自己的興趣,但對整個群體的人群資訊存在不同的貢獻度,我們稱為群體的共性資訊:global info。共性資訊和目标使用者無關,隻和使用者群體自身有關。
  • 種子使用者群體的個性資訊。種子群體中一定存在一小部分使用者和 target 使用者興趣相似,這時,當 target 人群變化時,資訊會變化,稱為 local info。

擷取global info的使用者的embedding,首先用 global attention,隻和 user 相關,和 attention merge 的方法類似,也是一個 self-attention。作用是把種子使用者乘以矩陣轉換,再乘以種子使用者自己,所做的就是捕捉使用者群體自身内部的興趣分布。

local info呢,它的公式是把種子使用者的矩陣乘以 w,再乘以 target user 的 embedding,再做一層 softmax,再乘以種子使用者自己,這是一個典型的乘法 attention。它的作用是提取種子使用者群體中和 target user 相關的部分,捕獲種子使用者的 local info。是一個用公式得到的這兩種 local & global embedding 之後,進行權重和,這就是種子使用者群體的全部資訊。

2. 線上異步處理

搜廣推政策産品:灰盒“look alike”政策在微信看一看上的應用

線上異步處理架構圖

離線訓練結束後,是線上異步處理,主要作用是某些可以離線且和線上請求無關的計算,可以先計算完,如更新種子使用者。每個 item 候選集都會對應一個種子使用者清單,更新種子使用者清單,可以每一分鐘更新一次,這和通路使用者無關,隻和候選集的 item 有關。可以實時拉取使用者的點選日志,更新點選某個候選集的種子清單,保證種子使用者實時性。

  • 可以把 global embedding 預計算 ( gl 隻和種子使用者有關,是 self-attenion,可線上做異步處理,如每隔一分鐘算一次 )。
  • 計算 k-means 聚類中心,也是隻和種子使用者有關,可以提前計算好,如推到推薦系統記憶體中。
  • 所有的東西都是定時更新,不需要線上實時計算。

3. 線上服務

搜廣推政策産品:灰盒“look alike”政策在微信看一看上的應用

線上服務說明

線上把聚類中心、global embedding 和所有使用者的 embedding 都已緩存好,隻需要拉取 user embedding,和候選集的 global embedding 和聚類中心。線上隻需要計算 local embedding,是 target user 到種子使用者的 attention,這需要根據線上請求的 urn 來實時計算。再計算一次 cosine,就可以得到相似度,這個計算量很小。

4. 最後實驗結果

搜廣推政策産品:灰盒“look alike”政策在微信看一看上的應用

在微信看一看上的實驗結果

算出 look alike 相似度之後,相似度的分數,可直接給到排序服務,做曝光依據。這是當時原文作者寫論文之前做的線上計劃 AB testing結果,對比的是使用者畫像比對推送的政策,上線之後,在擴大曝光規模的前提下,CTR 基本正向穩定+1.09%(說明擷取到了更多相關性的流量),種類豐富性+8.435%,标簽豐富多樣性+15.938%,說明在擴充過程中同時也獲得了更多多樣性展開的流量。

二、關于look-alike定向政策總結與思考

Look-alike政策RALM模型的在微信看一看政策大體如上,整體上的思路從使用者興趣特征出發,去探究使用者的個性興趣和人群共性興趣去探索種子人群的邊界,并且在上線實驗中也取得了明顯的收益效果,通過離線+線上計算的方式保證了種子人群的實時性和效果。

業界還有非常多關于Look alike的論文,我在這裡就不一一枚舉了,像是阿裡媽媽目标人群擴充政策、網易雲音樂種子人群擴充政策等等。

和大家一起在政策産品道路上“日拱一卒,功不唐捐”,幫助你成為極具職場壁壘的政策産品,如果有幫助到大家歡迎點贊、收藏以及評論一下。

作者:政策産品Arthur,5年大廠政策産品專家。

本文由 @政策産品Arthur 原創釋出于人人都是産品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協定

該文觀點僅代表作者本人,人人都是産品經理平台僅提供資訊存儲空間服務。

繼續閱讀