天天看点

基于图的模型

用户行为数据的二分图表示

基于图的模型( graph-based model )是推荐系统中的重要内容。其实,很多研究人员把基于

邻域的模型也称为基于图的模型,因为可以把基于邻域的模型看做基于图的模型的简单形式。

在研究基于图的模型之前,首先需要将用户行为数据表示成图的形式。本章讨论的用户行为

数据是由一系列二元组组成的,其中每个二元组 (u, i) 表示用户 u 对物品 i 产生过行为。这种数据集

很容易用一个二分图表示。

基于图的模型

基于图的推荐算法

将用户行为表示为二分图模型后,下面的任务就是在二分图上给用户进行个性化推荐。如果

将个性化推荐算法放到二分图模型上,那么给用户 u 推荐物品的任务就可以转化为度量用户顶点

v u 和与 v u 没有边直接相连的物品节点在图上的相关性,相关性越高的物品在推荐列表中的权重就

越高。

度量图中两个顶点之间相关性的方法很多,但一般来说图中顶点的相关性主要取决于下面 3个因素:

 两个顶点之间的路径数;

 两个顶点之间路径的长度;

 两个顶点之间的路径经过的顶点。

而相关性高的一对顶点一般具有如下特征:

 两个顶点之间有很多路径相连;

 连接两个顶点之间的路径长度都比较短;

 连接两个顶点之间的路径不会经过出度比较大的顶点。

基于上面3个主要因素,研究人员设计了很多计算图中顶点之间相关性的方法。

解释如下:

基于图的模型