第1章 好的推薦系統
1.1 什麼是推薦系統
- 面對資訊過載的問題,搜尋引擎滿足了使用者有明确需求時的查找需求,推薦系統則幫助沒有明确需求的使用者發現他們感興趣的内容
- 網際網路時代,傳統的二八原則受到挑戰,電子商務網站上長尾商品(即冷門商品)的總銷售額不容小看,而個性化推薦系統可以更好的發掘物品的長尾
1.2 個性化推薦系統的應用
1.3 推薦系統評測
- 推薦系統實驗方法
- 離線實驗:無法計算商業上關心的名額
- 使用者調查:成本和統計意義之間難以控制平衡
- AB測試:周期比較長
- 評測名額
- 滿意度
- 直接通過滿意/不滿意的回報按鈕收集
- 通過點選率、使用者停留時間、轉化率等名額度量
- 預測準确度
- 評分預測:RMSE,MAE(絕對值誤差)
- TopN推薦:準确率,召回率
- 覆寫率:衡量推薦系統發掘長尾的能力
- 直接計算推薦物品總數占所有物品的比例
- 通過研究物品在推薦清單中出現次數的分布來描述,即資訊熵/基尼系數
- 多樣性:描述推薦物品兩兩之間的不相似性
- 新穎性 VS 驚喜度:前者僅取決于使用者是否聽說過推薦結果;後者是在推薦結果和使用者曆史性趣不相似的情況下,讓使用者感覺滿意
- 信任度、健壯性、商業目标