Reminders在電商推薦中的價值

原論文在UMAP'16。文章并沒有太高深的模型，比較接地氣；但其觀點與結論很獨到，并且在工業界具有很強的實際操作價值。

針對推薦系統的研究大多關注在挖掘使用者并不知道但是卻與其興趣相關的物品。不過每個推薦系統所在的領域都有其各自的特點，本文所讨論的是電商領域的推薦系統，在電商領域中，給使用者适當地推薦其過去曾經浏覽過（或者消費過）的物品（reminders）同樣具有一定的價值。

實驗證明，在推薦結果中同時包含有reminders以及協同過濾（CF）等推薦方式的結果時，具有最好的效果。但是在推薦reminders時候也有很多需要改進的點：（1）如何避免太過明顯的重複浏覽的商品，避免已經無效商品（下架等）；（2）如何推薦與使用者目前購物需求相關的reminders。

首先，文章分析了使用者對于電商網站的推薦内容中的reminders的接受度。以Zalando網站（一家歐洲的線上購物網站）為例，抽樣了3000個重度使用者，他們對18w+的商品有過310w量級左右的商品浏覽記錄，以及10w+的購買記錄。對于這些使用者，從日志中分析出有一下幾個重要點：

1. 一個使用者的購物session中平均有9次商品的浏覽行為；平均每3次購物session會轉化為一次購買行為。

2. 在推薦的商品中，有約1/10的商品是reminders，即使用者之前已經浏覽過這些商品；有約1/4的推薦清單中包含有至少一個reminders。

3. 在成功推薦的商品（在同一次session中，使用者對該商品的點選浏覽行為最終轉化為購買行為）中，有約40%的商品為reminders。

4. 在使用者最終轉化成購買行為的reminders中，使用者對這些商品在此前有過若幹次的浏覽行為。如下圖所示：有成功推薦商品數與使用者距離對該商品首次浏覽時候的天數間隔的關系；以及成功推薦商品數與使用者對該商品的浏覽次數的關系。

5. 在一次購物session中，使用者平均浏覽的商品類目約為2.7個，說明使用者在一次session中的意圖還是比較有目的性的。

reminders的推薦政策

一個通用的流程是：

1. 擷取使用者在過去時間内有過浏覽行為的商品集合，并從中篩選出哪些商品可以用作reminders。

2. 對這些reminders進行一定規則的過濾，并進行排序得到最終的reminders推薦結果。

排序的政策有：

1. Interaction Recency（IRec）

對某商品的浏覽行為發生的時刻越接近，排序分越高。

2. Interaction Intensity（IInt）

對某商品的浏覽行為發生的次數越多，排序分越高。

3. Item Similarity（ISim）

有過浏覽行為的商品，與目前使用者的購物意圖（以目前實時浏覽的商品來表示）越接近，排序分越高。

4. Session Similarity（SSim）

有過浏覽行為的session，與目前使用者的購物意圖（以目前實時浏覽的session來表示）越接近，排序分越高。然後再對排序較高的session中的商品進行IInt政策的重排序。

Feature-based Category Filtering

在電商領域，使用者一般很少對相同類目下的商品進行重複購買，是以至少在一定時間間隔内，不應該給使用者推薦與其之前已經購買過的商品屬于相同類目的商品。

維護一個blacklist，對使用者已經購買過的商品，将其類目加入到這個blacklist中，直至其又重新開始浏覽該類目的商品再将其移出blacklist。

為了防止推薦商品太過于obvious，增加一個obvious gap的時間間隔，對于與目前時刻過近的時間段内使用者浏覽過的商品，我們不應當将其看作reminders。

本文由笨兔勿應所有，釋出于http://www.cnblogs.com/bentuwuying。如果轉載，請注明出處，在未經作者同意下将本文用于商業用途，将追究其法律責任。

繼續閱讀