天天看点

数据挖掘学习笔记8-推荐算法

一、基于内容的推荐(根据商品内容进行推荐)

二、协同推荐(根据用户的好友评价进行推荐)

tf-idf:

tf——term frequency词频 频率

idf——inverse document frequency 在其他文档中出现的频率

数据挖掘学习笔记8-推荐算法

三、向量空间模型

将文档转换为向量,两篇文档的相似度就可以用向量的夹角余弦表示(1的时候相似度最大,0的时候相似度最小)

难点:同义词、多义词难以识别

解决方法:做矩阵分解,类似pca,将原本的空间压缩(保留特征值大的几项),去掉冗余信息、噪点。

LSA:

数据挖掘学习笔记8-推荐算法

四、pagerank

其中一种算pagerank的方法是根据指向自己的链接的外向链接数以及该链接的pagerank值确定(rank=Σ(ranki)/outbound num i)

数据挖掘学习笔记8-推荐算法

五、协同过滤

基于用户:

利用和自己最接近(相关)的用户信息来预测缺失的信息

数据挖掘学习笔记8-推荐算法

r是该用户已知的平均分

基于商品:

用商品和商品之间的相关性来预测

基于模型:

把打分矩阵转化为分类问题,将打分当做标签

阅读材料:

数据挖掘学习笔记8-推荐算法

继续阅读