吳恩達《Machine Learning》精煉筆記 11：推薦系統

推薦系統簡介
基于内容的推薦系統
協同過濾

推薦系統

問題形式化

推薦系統應用的十分廣泛：如果你考慮網站像亞馬遜，或網飛公司或易趣，或iTunes Genius，有很多的網站或系統試圖推薦新産品給使用者。如，亞馬遜推薦新書給你，網飛公司試圖推薦新電影給你，等等。

這些推薦系統，根據浏覽你過去買過什麼書，或過去評價過什麼電影來判斷。這些系統會帶來很大一部分收入，比如為亞馬遜和像網飛這樣的公司。

是以對推薦系統性能的改善，将對這些企業的有實質性和直接的影響。

通過一個栗子來了解推薦系統

假使我們是一個電影供應商，我們有 5 部電影和 4 個使用者，我們要求使用者為電影打分

前三部是愛情片，後面兩部是動作片。Alice和Bob更傾向于愛情片，Carol和Dave更傾向于動作片。一些标記

nu使用者的數量
nm電影的數量
r(i,j)如果使用者j給電影i評過份則r(i,j)=1
y(i,j)代表的是使用者j給電影i的評分
mj表示的是使用者j評過分的電影總數

基于内容的推薦系統Content Based Recommendations

在一個基于内容的推薦系統算法中，我們假設對于我們希望推薦的東西有一些資料，這些資料是有關這些東西的特征。現在假設電影有兩個特征：

x1浪漫程度
x2動作程度

那麼每部電影都有一個特征向量，如第一部電影的是[0,9 0]

針對特征來建構一個推薦系統算法。假設使用的是線性回歸模型，針對每個使用者使用該模型，θ(1)表示的是第一個使用者的模型的參數。定義如下：

θ(j)第j個使用者的參數向量
x(i)電影i的特征向量

針對電影i和使用者j，該線性回歸模型的代價為預測誤差的平方和，加上正則化項：

其中 i:r(i,j)表示我們隻計算那些使用者 j 評過分的電影。在一般的線性回歸模型中，誤差項和正則項應該都是乘以1/2m，在這裡我們将m去掉。并且我們不對方差項θ0進行正則化處理。

針對所有使用者的代價函數求和：

協同過濾Collaborative Filtering

上面基于内容的過濾算法是通過電影的特征，使用特征來訓練出每個使用者的參數。相反，如果使用使用者的參數，也可以學習得出電影的特征：

如果沒有使用者的參數和電影的特征，協同過濾算法便可以同時學習這兩者

對代價函數求出偏導數的結果是：

協同過濾算法的過程：

初始化x，θx，θ為很小的值
使用梯度下降算法最小化代價函數minJ(x,θ)minJ(x,θ)
訓練完算法後，預測使用者j給電影i的評分

協同過濾算法

協同過濾的優化目标：

向量化：低秩矩陣分解Vectorization_ Low Rank Matrix Factorization

協同過濾算法可以做的事情：

給出一件商品，找到與之類似的商品
當一個使用者浏覽了一件産品，找出類似的商品推薦給他

假設5部電影，4位使用者，存放在矩陣中：

推出相應的評分

找出類似的影片

均值歸一化Mean Normalization

上圖中，假設新來個使用者Eva，他沒有對任何的電影進行評分，那我們以什麼依據來給他推薦電影呢？

對上面的Y矩陣進行均值歸一化，将每個使用者對某一部電影的評分減去所有使用者對該電影評分的平均值，得到如下的矩陣：

利用新的矩陣Y來訓練算法。如果我們要用新訓練出的算法來預測評分，則需要将平均值重新加回去，模型會人為其給每部電影的評分都是該電影的平均分。

吳恩達《Machine Learning》精煉筆記 11：推薦系統

推薦系統

推薦系統概述

問題形式化

基于内容的推薦系統Content Based Recommendations

協同過濾Collaborative Filtering

協同過濾算法

向量化：低秩矩陣分解Vectorization_ Low Rank Matrix Factorization

均值歸一化Mean Normalization

繼續閱讀

27. Remove Element(清單)題目代碼

httpd服務的部署、啟動、配置和簡單優化一、部署二、啟動三、配置檔案

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

資料結構與算法（27）——排序（二）

nginx 安裝錯誤資訊解決

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入

hdu7108哈希