分析說明
本文主要對下面博文進行分析
推薦系統方法(利用使用者行為資料)
基于物品的協同過濾算法
原文中的公式:
W i j = ∣ N i ∩ N u ∣ ∣ N i ∣ W_{ij}=\dfrac{|N_i \cap N_u|}{|N_i|} Wij=∣Ni∣∣Ni∩Nu∣
W i j W_{ij} Wij 表示物品i和j之間的相似度;
那麼這個公式可以用條件機率的方法推導,那麼 W i j W_{ij} Wij其實可以表示為使用者在喜歡物品i的條件下,又喜歡物品j的機率,類似公式如下:
W i j = P ( j ∣ i ) = P ( i j ) P i W_{ij}=P(j|i)=\dfrac{P(ij)}{Pi} Wij=P(j∣i)=PiP(ij)
隐語義模型
R,P,Q這三個矩陣為例,其中的class1,class2,class3 三個類别,其實可以了解為對物品的3個特征參數( x 1 , x 2 , x 3 x_1,x_2,x_3 x1,x2,x3),即表示分别屬于這3中類别的程度用數值表示,将Q矩陣轉置一下(即 Q T Q^T QT)更為合理些,以物品item為樣本點集合,那麼P矩陣就是每個使用者對3個特征參數的 θ \theta θ向量構成的矩陣,這裡的 θ \theta θ屬于3維向量,P矩陣為使用者數量*3。
那麼R矩陣也進行轉置(即 R T R^T RT)就合理了,它表示使用者對每一個物品的喜好程度的數值表示矩陣,這就和吳恩達機器學習中的電影評分推薦的講解比較吻合了。