协同过滤相似度

2023-06-30 06:47:35

使用不同相似度计算方式实现协同过滤

如果买/没买点/没点数据 0/1 适合使用杰卡德相似度

-
from sklean.metrics import jaccard_similarity_score - jaccard_similarity_score(df['item A'],df['item B']) -
一般使用评分去做协同过滤推荐使用皮尔逊相关系数

- 评分预测

协同过滤相似度
基于用户和基于物品的协同过滤严格来说属于两种算法

，实践中可以都做出来，对比效果，选择最靠谱的。

协同过滤基于模型的算法

用户-物品矩阵比较稀疏的时候直接去取物品向量用户向量计算相似度不太合适
基于模型的方法可以解决用户-物品矩阵比较稀疏的问题
矩阵分解

- 把大矩阵拆成两个小的用户矩阵物品矩阵

- 大矩阵约等于用户矩阵乘物品矩阵

- 使用als 交替最小二乘法来优化损失

- 优化之后的用户矩阵取出用户向量

- 优化之后的物品矩阵取出物品向量

- 用户向量点乘物品向量得到最终评分预测

协同过滤数据分析推荐系统

上一篇: 推荐系统项目基础（二）基于相似度的协同过滤基于相似度的协同过滤算法

下一篇: 推荐系统——协同过滤协同过滤

继续阅读