案例位址: https://www.iyiou.com/p/62735 (以下為案例的簡要概述,便 于之後能快速檢索到相關内容。部分文字與圖檔可能直接來自原文,如有侵權請告知,謝謝)
1. 目标:在已有推薦結果的基礎上,選擇更可能吸引使用者的個性化海報配圖,進一步提高推薦結果點選率
2. 舉例: 1)對于看過很多愛情片的使用者,采用接吻鏡頭的劇照 2)對于看過很多喜劇片的使用者,采用羅賓•威廉姆斯(Robin Williams,著名喜劇演員)的劇照
3. 面臨的挑戰: 1)如何進行測評:有可能該推薦結果太好,不管我們采用哪張劇照使用者都會點選進去。如何檢驗點選率的增加是否來自于個性化的海報? 2)對于一個使用者,當我們在多次推薦時采用不同的海報,是否會讓使用者誤解為是不同的電影? 3)同一頁影片海報之間的影響。我們需要考慮到同一頁圖檔的多樣性,如果全是接吻劇照,那整個頁面可能會比較奇怪 4)在技術上進行大規模個性化配圖:需要在電影上映時快速響應,并且算法要不斷适應,因為觀衆的口味随影片的生命周期也可能産生變化
4. 采用“上下文老虎機”進行線上學習 1)“多臂老虎機”:當你進入一個賭場,你發現A老虎機赢的機率高,B老虎機赢的機率低,你當時一個政策是全是用A老虎機。但是接着往下,可能A老虎機赢的機率低,B老虎機反而一直吐錢了。 “多臂老虎機”就是合理利用現有資訊(如A老虎機勝率高),同時進行一些探索(試一試B老虎機,但資料探索有代價),尋找最優政策。 2)由于Netflix擁有大量使用者,探索過程分攤到使用者群裡,每個使用者受到的影響可以忽略不計,而Netflix就可以獲得訓練所需要的資料 3)采集的資料主要是三元組(使用者,影片,圖檔) 4)“上下文老虎機”即利用了上下文資料的圖檔推薦模型
5. 如何評估模型表現: 1)對于使用者群A,采用随機選擇海報的方式進行推薦 2)對于使用者群B,采用模型推薦的個性化海報 3)找到A和B中看到同一張海報的樣例,用這些樣例來計算推薦轉化率【對與A群使用者,他們看到這張海報是随機産生的;對于B群使用者,他們看到這張海報是模型産生的。通過該方法去除海報品質的影響,有些海報本來就吸引人點選】
6. 效果