天天看點

基于使用者和基于物品的協同過濾算法的比較

首先回想一下,協同過濾算法主要有兩種,一種是基于使用者的協同過濾算法(UserCF),還有一種是基于物品的協同過濾算法(ItemCF)。

基于使用者的協同過濾算法主要有兩步:

1)找到和目标使用者興趣類似的使用者集合 

  2)找到這個集合中的使用者喜歡的,且目标使用者沒有聽說過的物品推薦給目标使用者。

基于物品的協同過濾算法主要有兩步:

1)計算物品之間的類似度。

2)依據物品的類似度和使用者的曆史行為給使用者生成推薦清單。

由此能夠看出UserCF是推薦使用者所在興趣小組中的熱點,更注重社會化,而ItemCF則是依據使用者曆史行為推薦類似物品,更注重個性化。是以UserCF一般用在新聞類站點中。如Digg,而ItemCF則用在其它非新聞類站點中。如Amazon,hulu等等。

由于在新聞類站點中,使用者的興趣愛好往往比較粗粒度,非常少會實使用者說僅僅看某個話題的新聞,往往某個話題也不是天天會有新聞的。

個性化新聞推薦更強盜新聞熱點。熱門程度和時效性是個性化新聞推薦的重點,個性化是補充。是以UserCF給使用者推薦和他有同樣興趣愛好的人關注的新聞,這樣在保證了熱點和時效性的同一時候,兼顧了個性化。另外一個原因是從技術上考慮的,作為一種物品。新聞的更新非常快,并且實時會有新的新聞出現,而假設使用ItemCF的話,須要維護一張物品之間類似度的表。實際工業界這表通常是一天一更新的。這在新聞領域是萬萬不能接受的。

可是,在圖書。電子商務和電影站點等方面,ItemCF則能更好的發揮作用。

由于在這些站點中,使用者的興趣愛好通常是比較固定的。并且相比于新聞站點更細膩。在這些站點中,個性化推薦通常是給使用者推薦他自己領域的相關物品。另外。這些站點的物品數量更新速度不快。一天一次更新能夠接受。并且在這些站點中,使用者數量往往遠遠大于物品數量,從存儲的角度來講。UserCF須要消耗更大的空間複雜度,另外,ItemCF能夠友善的提供推薦理由,添加使用者對推薦系統的信任度。是以更适合這些站點。

轉載于:https://www.cnblogs.com/xfgnongmin/p/10786717.html

首先回想一下,協同過濾算法主要有兩種,一種是基于使用者的協同過濾算法(UserCF),還有一種是基于物品的協同過濾算法(ItemCF)。

基于使用者的協同過濾算法主要有兩步:

1)找到和目标使用者興趣類似的使用者集合 

  2)找到這個集合中的使用者喜歡的,且目标使用者沒有聽說過的物品推薦給目标使用者。

基于物品的協同過濾算法主要有兩步:

1)計算物品之間的類似度。

2)依據物品的類似度和使用者的曆史行為給使用者生成推薦清單。

由此能夠看出UserCF是推薦使用者所在興趣小組中的熱點,更注重社會化,而ItemCF則是依據使用者曆史行為推薦類似物品,更注重個性化。是以UserCF一般用在新聞類站點中。如Digg,而ItemCF則用在其它非新聞類站點中。如Amazon,hulu等等。

由于在新聞類站點中,使用者的興趣愛好往往比較粗粒度,非常少會實使用者說僅僅看某個話題的新聞,往往某個話題也不是天天會有新聞的。

個性化新聞推薦更強盜新聞熱點。熱門程度和時效性是個性化新聞推薦的重點,個性化是補充。是以UserCF給使用者推薦和他有同樣興趣愛好的人關注的新聞,這樣在保證了熱點和時效性的同一時候,兼顧了個性化。另外一個原因是從技術上考慮的,作為一種物品。新聞的更新非常快,并且實時會有新的新聞出現,而假設使用ItemCF的話,須要維護一張物品之間類似度的表。實際工業界這表通常是一天一更新的。這在新聞領域是萬萬不能接受的。

可是,在圖書。電子商務和電影站點等方面,ItemCF則能更好的發揮作用。

由于在這些站點中,使用者的興趣愛好通常是比較固定的。并且相比于新聞站點更細膩。在這些站點中,個性化推薦通常是給使用者推薦他自己領域的相關物品。另外。這些站點的物品數量更新速度不快。一天一次更新能夠接受。并且在這些站點中,使用者數量往往遠遠大于物品數量,從存儲的角度來講。UserCF須要消耗更大的空間複雜度,另外,ItemCF能夠友善的提供推薦理由,添加使用者對推薦系統的信任度。是以更适合這些站點。

繼續閱讀