天天看點

資料挖掘學習筆記8-推薦算法

一、基于内容的推薦(根據商品内容進行推薦)

二、協同推薦(根據使用者的好友評價進行推薦)

tf-idf:

tf——term frequency詞頻 頻率

idf——inverse document frequency 在其他文檔中出現的頻率

資料挖掘學習筆記8-推薦算法

三、向量空間模型

将文檔轉換為向量,兩篇文檔的相似度就可以用向量的夾角餘弦表示(1的時候相似度最大,0的時候相似度最小)

難點:同義詞、多義詞難以識别

解決方法:做矩陣分解,類似pca,将原本的空間壓縮(保留特征值大的幾項),去掉備援資訊、噪點。

LSA:

資料挖掘學習筆記8-推薦算法

四、pagerank

其中一種算pagerank的方法是根據指向自己的連結的外向連結數以及該連結的pagerank值确定(rank=Σ(ranki)/outbound num i)

資料挖掘學習筆記8-推薦算法

五、協同過濾

基于使用者:

利用和自己最接近(相關)的使用者資訊來預測缺失的資訊

資料挖掘學習筆記8-推薦算法

r是該使用者已知的平均分

基于商品:

用商品和商品之間的相關性來預測

基于模型:

把打分矩陣轉化為分類問題,将打分當做标簽

閱讀材料:

資料挖掘學習筆記8-推薦算法

繼續閱讀