天天看點

推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統

作者:一進制  
公衆号:煉丹筆記  
           

背景

推薦系統(RS)已經成為大多數web應用程式的關鍵子產品。最近,大多數RSs都是基于雲到邊緣架構的瀑布式的,

其中推薦的結果通過在雲伺服器中預先計算傳送到edge(例如使用者移動)

。盡管有效,但雲伺服器和邊緣之間的網絡帶寬和延遲可能會導緻系統回報和使用者感覺的延遲。是以,

edge上的實時計算可以幫助更精确地捕捉使用者的偏好,進而提出更令人滿意的建議。

本文首次嘗試設計和實作邊緣推薦系統(EdgeRec),它實作了實時的使用者感覺和實時的系統回報。此外,本文還提出了基于行為注意網絡的異構使用者行為序列模組化和上下文感覺重排序,以捕捉使用者的不同興趣并相應地調整推薦結果。在淘寶首頁feeds的離線評測和線上性能測試結果表明了EdgeRec的有效性。

之前架構

推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統

如上圖所示,手機端先向雲端伺服器初始化一個頁面請求,matching和ranking模型對應頁面請求生成一個排序商品集合,而這套架構有諸多問題:

  • 系統回報延遲,在相鄰的兩個頁面請求,雲端的RS無法實時調整推薦結果,是以較難滿足用變化的需求。
  • 使用者感覺延遲,RS模型部署在雲端,往往會因為網絡延遲導緻1min種左右的延遲,很難抓住使用者的實時需求。網絡的帶寬會進一步限制目前RS捕捉端上使用者的大量的和詳細的行為細節。

基于上述的情況,我們采用邊緣計算來滿足實時的性能要求。EdgeRec可以獲得實時使用者感覺和實時的系統回報。

系統

系統概覽

推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統
  • Client Native (CN):初始化頁面請求并且将從RS伺服器中傳回的對應候選商品的特征進行緩存,從RS傳回的商品個數被設定為100,然後CN收集使用者對曝光商品的行為并且除法模型服務子產品,在接收到候選商品的rank之後,CN就會調整商品的UI展示。
  • Model Serving(MS):當由CN觸發時,MS對從CN處接收到的使用者行為和候選商品進行特征工程,然後基于神經網絡的模型,其目的是通過使用者行為模組化來及時捕捉使用者行為,并對上下文感覺的Reranking以及時響應使用者,MS向雲發送日志,并将候選商品的排名結果傳回給CN;
  • Recommender System(RS): 響應來自CN的頁面請求,并為候選項提供初始排序。此外,它還可以在響應CN之前從雲上的key-value存儲中查找MS子產品中的模型需要的商品特征和嵌入;
  • Offline Training(OT): 在模型訓練之前,子產品首先從MS中收集日志并構造樣本。然後,将訓練後的模型分為三個部分:(1).使用者行為模組化子模型;(2).上下文感覺重排子模型;(3).嵌入矩陣(如類别和品牌)。最後,将前兩個子模型部署在MS子產品上,嵌入矩陣作為key-value形式儲存在雲上

算法子產品

問題定義

給定雲端現有RS得到的初始排序商品清單Sr,對于在模型服務子產品的reranking請求r∈R,我們的目标是尋找到一個得分函數:

推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統
  • 商品i的特征是xi;
  • 從初始模型得到的局部排序s;
  • 目前推薦環境下的實時使用者行為上下文C;

Reranking模型考慮在局部排序上下文,局部排序上下文表示為初始排序候選項之間的清單式互動,可以用RNN或Transformer來模組化。在這裡,我們認為

實時的使用者行為

上下文對于重排序問題也很重要,特别是在瀑布式推薦場景中,而以前很少有人考慮過這一點。

特征系統

1. Insight

之前很多模型:

  • 隻考慮使用者的直接正回報,而忽略間接的負回報,例如skipping或者删除操作等。
  • 隻考慮與使用者互動的商品的特性(例如類别和品牌等),使用者的行為則被忽略了。

此外,

雖然使用者沒有點選某個項目,但對該項目曝光的操作(如滾動速度和曝光)可以代表該項目被視為“負面回報”的程度

。有時,如果使用者長時間關注某個項目而不單擊它,它不能絕對表明他/她不喜歡它。特别是在目前的瀑布流RS中,

商品的顯示資訊越來越豐富,比如大圖檔、各種關鍵詞甚至自動播放的視訊,點選已經成為一些使用者非常“奢侈”的正面回報。

基于我們提出的EdgeRec系統,所有的使用者行為特征都是在邊緣(即使用者的移動裝置)上收集、提取和消費的,與目前基于雲到端的RS系統相比,這可以突破網絡延遲和帶寬的限制。是以,

可以結合大量詳細的行為來更實時地推斷使用者偏好

。另外,使用者的原始行為在自己的移動裝置上進行處理和利用,在一定程度上緩解了使用者的資料隐私問題。

基于上面的讨論,我們發現這項工作的意義是非常重大的,新的特征工程:

  • 從“隻依賴正回報互動”到“同時關注正回報和負回報互動作用”;
  • 從“隻關注互動項”到“同時考慮互動項及其對應的動作”;
  • 從“準實時”到“超實時”。
推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統

關于端上的實時特征:

推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統

2. 商品曝光使用者行為特征

商品曝光使用者行為特征分為四塊:

  • 商品曝光統計特征;
  • 使用者滑動統計特征;
  • 使用者删減回報;
  • 時間延遲。

3. 商品頁面浏覽使用者行為特征

商品頁面浏覽(ipv)特征分為三類:

  • 商品頁面浏覽的統計特征;
  • 在每個block是否有點選;
  • 時間延遲;

4. 商品特征

商品特征可以分為:

  • embedding學習的離散特征;
  • 從base排序模型學習得到的原始特征;

異質使用者行為序列模組化

推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統

這邊我們有兩個異質,第一個是:

  • 商品曝光行為和商品頁面浏覽行為:

因為商品的點選相較于商品的曝光是更加稀疏的,是以一旦一起編碼,那麼page-view的行為将會主導這一切。是以我們選擇

分開模組化

(商品曝光行為序列+商品浏覽行為序列模組化);

第二個是:

  • 使用者行為操作以及對應的使用者互動的商品;

我們首先對他們進行編碼,然後進行在下面的上下文感覺的重排模型中對行為注意機制進行融合;

我們使用多層GRU網絡定義序列編碼函數:

推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統
1. 商品曝光行為序列模組化
推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統
2. 商品頁面浏覽行為序列模組化
推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統
3. 行為Attention網絡的上下文感覺重排

我們使用GRU網絡對初始排序模型排序的候選項序列進行編碼,

并将最終狀态作為局部排序上下文

,借助Attention技術,我們的重排序模型可以自動(軟)搜尋與目标項目排序相關的部分使用者行為上下文。

4. 候選商品序列編碼
推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統
5. 行為Attention
推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統
6. 模型訓練
推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統

實驗

推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統
  • CRBAN+HUBSM(IE&IPV)取得了巨大的提升;
Heterogeneous User Behavior Sequence Modeling (HUBSM)+Contextaware Reranking with Behavior Attention Networks (CRBAN);

2. 線上效果&性能

2.1 線上效果

推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統

采用完整型号CRBAN+HUBSM(IE&IPV)的EdgeRec平均為PV貢獻1.57%,CTR為7.18%,CLICK為8.87%,GMV為10.92%,帶來了巨大的提升;

2.2 線上性能
推薦系統煉丹筆記:EdgeRec阿裡邊緣計算推薦系統
  • 使用者行為的延遲時間大大降低,系統的響應時間大大降低,系統回報數大大變多;

結論

本文設計并實作了EdgeRec來解決瀑布式RS中使用者感覺和系統回報的延遲問題,這是RS與邊緣計算相結合的首次嘗試。具體地說,本文提出了異構使用者行為序列模組化和基于行為注意網絡的上下文感覺重排序方法來對使用者豐富的行為進行模組化。大量的線下和線上評估驗證了EdgeRec在工業RS中的有效性。

參考文獻

  1. EdgeRec: Recommender System on Edge in Mobile Taobao:https://arxiv.org/pdf/2005.08416.pdf

http://weixin.qq.com/r/XSjP1zrEzGezrX60931P (二維碼自動識别)