一、基于内容的推薦(根據商品内容進行推薦)
二、協同推薦(根據使用者的好友評價進行推薦)
tf-idf:
tf——term frequency詞頻 頻率
idf——inverse document frequency 在其他文檔中出現的頻率
三、向量空間模型
将文檔轉換為向量,兩篇文檔的相似度就可以用向量的夾角餘弦表示(1的時候相似度最大,0的時候相似度最小)
難點:同義詞、多義詞難以識别
解決方法:做矩陣分解,類似pca,将原本的空間壓縮(保留特征值大的幾項),去掉備援資訊、噪點。
LSA:
四、pagerank
其中一種算pagerank的方法是根據指向自己的連結的外向連結數以及該連結的pagerank值确定(rank=Σ(ranki)/outbound num i)
五、協同過濾
基于使用者:
利用和自己最接近(相關)的使用者資訊來預測缺失的資訊
r是該使用者已知的平均分
基于商品:
用商品和商品之間的相關性來預測
基于模型:
把打分矩陣轉化為分類問題,将打分當做标簽
閱讀材料: