資料挖掘學習筆記8-推薦算法

2023-07-02 05:59:30

一、基于内容的推薦（根據商品内容進行推薦）

二、協同推薦（根據使用者的好友評價進行推薦）

tf-idf：

tf——term frequency詞頻頻率

idf——inverse document frequency 在其他文檔中出現的頻率

資料挖掘學習筆記8-推薦算法

三、向量空間模型

将文檔轉換為向量，兩篇文檔的相似度就可以用向量的夾角餘弦表示（1的時候相似度最大，0的時候相似度最小）

難點：同義詞、多義詞難以識别

解決方法：做矩陣分解，類似pca，将原本的空間壓縮（保留特征值大的幾項），去掉備援資訊、噪點。

LSA：

資料挖掘學習筆記8-推薦算法

四、pagerank

其中一種算pagerank的方法是根據指向自己的連結的外向連結數以及該連結的pagerank值确定（rank=Σ（ranki）/outbound num i）

資料挖掘學習筆記8-推薦算法

五、協同過濾

基于使用者：

利用和自己最接近（相關）的使用者資訊來預測缺失的資訊

資料挖掘學習筆記8-推薦算法

r是該使用者已知的平均分

基于商品：

用商品和商品之間的相關性來預測

基于模型：

把打分矩陣轉化為分類問題，将打分當做标簽

閱讀材料：

資料挖掘學習筆記8-推薦算法

繼續閱讀