新零售智能引擎事業群出品
1. 成交轉化率預估:背景和挑戰
電商推薦系統幫助使用者尋找感興趣的商品。在這個系統中,兩個任務扮演了 至關重要的角色,點選率預估(CTR Estimation)和成交轉化率預估(CVR Estimation)。顧名思義,點選率是商品從被曝光到被點選的機率,成交轉換率 是商品從被點選到被購買的機率。 雖然學界和業界在 CVR 預估方面做了不少有意義的工作,但是工業應用中 的 CVR 預估仍然是個有挑戰性的任務。我們總結了目前 CVR 預估還面臨的三個 挑戰:
- 資料中與購買相關的正回報非常少;
- CVR 預估的訓練資料稀疏(Data Sparsity);
- 樣本選擇偏差(Sample Selection Bias)。
首先,使用者的決策過程是非常複雜的,但是訓練資料中與購買相關的正回報 不足。實踐中我們發現,根據使用者的購買行為得到的标簽本身太稀疏了,不足以 幫助模型精準地推斷使用者的購物意圖。比如在我們的生産資料集中有 36 億條曝 光樣本,但是成交資料隻有 2700 萬條,這意味着大多數的訓練資料對于成交轉 化率預估模型來說都是負樣本。此外,購買本身是件門檻比較高的事情,沒有最 終下單并不意味着使用者沒有任何購買傾向。 其次,CVR 預估任務的訓練資料總體上比較稀疏。因為 CVR 預估任務需要 用點選的樣本來訓練,是以相比于 CTR 預估任務,CVR 預估任務的訓練資料大 概要少兩個數量級,因為使用者的點選行為是稀疏的。對于一些模型中比較大的 embedding 特征(商品 ID 等),這樣的訓練資料是不夠充分的。 最後,傳統的 CVR 預估還存在着樣本選擇偏差的問題。CVR 預估模型是用 點選樣本上訓練的,但是線上服務的時候,卻是對所有曝光的樣本打分。因為點 擊樣本對應的資料分布可能和曝光樣本的資料分布有很大的差別,就導緻通過點 擊樣本學習到的 CVR,可能和真實的 CVR 之間産生偏差。 針對以上三個問題,我們提出了 GMCM(Graph-based Micro-behavior Conversion Model)這個模型。首先,GMCM 通過引入使用者在商品詳情頁的控件 行為來緩解正回報不足的問題。實踐中我們發現,使用者在下單前,通常會在商品 詳情頁産生一系列的微觀控件行為(Micro behaviors)。這些控件行為和使用者的 購買決策行為有很強的關聯,在 GMCM 中我們把這部分資訊引入到了 CVR 預估 模型中,并通過圖卷積神經網絡(Graph Convolutional Networks)來模組化。此外針 對資料稀疏和樣本選擇偏差這兩個問題,GMCM 采用了多任務學習(Multi-task Learning)以及逆傾向權重(Inverse Propensity Weighting)這兩種方法來緩解以上 問題。

2. 現有的工作
一些 CTR/CVR 預估任務通用的模型包括,邏輯回歸(Logistic Regression) , 因 子分解機(Factorization Machine),深度神經網絡(Deep Neural Networks)等等。 最近很多方法關注于怎麼通過使用者的行為序列來更好的做 CTR/CVR 預估,典型 的工作包括阿裡媽媽廣告團隊的深度興趣網絡(Deep Interest Network),深度興 趣演化網絡(Deep Interest Evolution Networks)等。 如上文提到,工業應用中的 CVR 預估模型面臨資料稀疏和樣本選擇偏差兩 個問題。已有的一些解法主要通過調整采樣政策來解決以上問題。最近阿裡媽媽 團隊提出了一個轉化率預估模型,ESMM(Entire Space Multi-task Model),通過 多任務學習共享 embedding 來緩解資料稀疏,通過引入了一個輔助的 CTCVR 任 務來解決樣本選擇偏差問題。 很少有工作研究怎麼利用使用者的微觀控件行為。京東的一篇發表于 WSDM 2018 的工作是我們已知的第一篇利用使用者微觀行為做商品推薦的論文。在這篇 論文中,作者提出把使用者的微觀控件行為用序列模型模組化。這樣的模組化方式可能 存在兩個問題,第一是不同的微觀行為順序可能代表了相似的使用者購物意圖。比 如當使用者考慮購買一件商品時,先點選圖檔還是先檢視評論可能差別不大。第二 是微觀行為之間往往是互相關聯的,比如點選問大家的使用者很可能也會檢視評 論。基于以上兩點觀察,我們提出用圖而不是序列來模組化使用者的微觀行為。
3. 我們的工作
GMCM 旨在解決傳統 CVR 模組化中的三個實際問題,即與購買相關的回報有 限,資料稀疏性和樣本選擇偏差。為了解決第一個問題,GMCM 把使用者的微觀行 為表示為了一個購物微觀行為圖(Purchase-related Micro-behavior Graph),并采 用 GCN 來捕獲圖上節點的相關性。在實踐中,我們發現這些微觀行為與使用者購 買決策高度相關,是以可以作為推測使用者購買意圖的線索。此外,我們觀察到這
些微觀行為往往互相關聯,并且不同順序可能代表相似的使用者購物意圖。是以, 我們将微觀行為表示為圖而非序列。為了緩解資料稀疏性和樣本選擇偏差問題, 我們采用了多任務學習架構和逆傾向權重技術。具體來說,GMCM 同時訓練 CTR 和 CVR 任務,并在兩個任務之間共享嵌入層。這樣嵌入特征就可以同時通過曝 光樣本以及點選樣本得到訓練。此外,GMCM 通過估計一個點選傾向(即 CTR 分數)對 CVR 預測誤差進行反向權重。這種逆傾向權重的方式在理論上可以完 全消除樣本選擇偏差,實踐中,估計的點選傾向分數(即 CTR)肯定不是百分之 百準确的,不過已有的一些文獻證明了類似方法在實踐中确實可以降低樣本選擇 偏差帶來的影響。接下來我們具體介紹 GMCM 模型的一些重要部分。 首先,我們把使用者的微觀行為表示為一個購買微觀行為圖(PMG)。在這個 圖上,每個節點代表使用者的一種微觀控件行為,每條邊代表兩種微觀行為之間的 連接配接關系。PMG 的示意圖如下。
我們用訓練資料中微觀行為之間的統計共現機率來作為每條邊權重的初始值,然 後讓網絡學習一個邊權重的偏置矩陣,來自适應地調節不同行為之間的連接配接強 弱。 基于定義好的 PMG,我們用 GCN 來學習微觀行為的表征,GCN 會通過每個 節點的輸入特征,以及圖的拓撲結構,來得到每個節點的一個表征。最終每個節 點的表征都會被用來計算一個分數,作為使用者産生這一種控件行為的預測分,這 個預測分和我們樣本中這個控件行為的标簽計算 loss,輔助 CVR 預測任務的學 習。具體的計算過程見論文。最終 GMCM 的模型結構如下圖所示:
我們使用了淘寶店鋪内的底部接着逛和猜你喜歡兩個場景的生産資料來評 測 GMCM 模型的性能。底部接着逛(SM)資料集包括 36 億曝光,6.億點選以及 2700 萬成交樣本。猜你喜歡(GUL)資料集包括 11 億曝光,2.2 億點選以及 2000 萬成交樣本。我們進一步把這兩份資料按時間拆成了六個子資料集,目的是觀察 随着訓練資料量的累計,模型在預測集上的表現。整個實驗旨在回答以下三個問 題:
- GMCM 是否優于目前最好的成交轉化率預估模型?
- GCN 是否能幫助我們更好的模組化使用者的微觀控件行為?
- 網絡的一些超參數對于模型有什麼影響?
我們采用了 AUC 和 MSE 兩種名額來衡量模型的性能。大體而言,AUC 反應 了模型對于正負樣本排序的好壞,MSE 反應了模型預估分數的準确程度。下表 為模型在 6 個子資料集上的表現:
我們發現 GMCM 模型在所有資料集上都得到了最高的 AUC/GAUC, 在大多數資料集上得 到了最低的MSE。進一步分析,我們認為GMCM 模型在預測集上性能的提升主要歸功于 對使用者微觀行為的引入以及正确的模組化。 我們做了一組消融實驗,來對比不同的微觀行為模組化方式對于最終模型效果的影響。具 體來說,我們對比了GCN模組化(圖的方式),GRU模組化(序列的方式),以及直接通過 全連接配接層模組化這幾種方式。最終的結論是GCN模組化微觀行為會取得最好的效果。實驗結果 如下圖所示:
4. 結論
在這項工作中,我們提出了一個全新的CVR預估模型GMCM,以解決工業應用中CVR 估計面臨的三個問題:與購買相關的回報有限,資料稀疏和樣本選擇偏差。我們提出将使用者 的微觀行為表示為與購買相關的購買微觀行為圖(PMG)。基于此圖表示,我們将CVR估 計問題轉化為了在PMG上的圖分類問題。此外,我們還采用了多任務學習和逆傾向權重的 方式,來緩解資料稀疏和樣本選擇偏差等問題。在淘寶生産資料集上的實驗證明了GMCM 的有效性。
5. 參考文獻
[1]XiaoMaetal.,Entirespacemulti-taskmodel:Aneffectiveapproachforestimating post-clickconversionrate.The41st InternationalACMSIGIR [2]WenhaoZhangetal.,Large-scaleCasualApproachestoDebiasingConversionRate EstimationwithMulti-taskLearning,,theWebConference2020 [3]GuoruiZhouetal.,Deepinterestevolutionnetworkforclick-throughrateprediction, AAAI,Vol.33.5941-5948 [4]GuoruiZhouetal.,Deepinterestnetworkforclick-throughprediction,the24th ACM KDD [5]MeiziZhouetal.,Microbehaviors,AnewPerspectiveinE-commerceRecommender Systems,WSDM727-735 [6]ThomasNKipfetal., Semi-supervisedclassificationwithgraphconvolutional networks,ICLR2017
更多資訊檢索技術内容請檢視:
獨家下載下傳!《SIGIR 頂會論文解讀》電子書重磅釋出