推薦系統的分類方式有很多種,在不同的資料中也給出了不同的分類方式。
我們可以獲得的資料總體來說有三種:使用者的資訊,物品的資訊,和使用者的行為資訊。按照獲得資料的不同也可以将推薦系統分為三種:(1).基于人口統計學的推薦。(2).基于内容的推薦。(3).基于協同過濾的推薦。
基于人口統計學的推薦

當我們拿到使用者的一些标簽資訊時,我們可以采用基于人口統計學的推薦,根據使用者的特征可以找到與目标使用者相似的使用者,再根據相似使用者的喜好對目标使用者進行推薦。
·基于人口統計學的推薦機制(Demographic-based Recommendation)是一種最易于實作的推薦方法,它隻是簡單的根據系統使用者的基本資訊發現使用者的相關程度,然後将相似使用者喜愛的其他物品推薦給目前使用者
·對于沒有明确含義的使用者資訊(比如登入時間、地域等上下文資訊),可以通過聚類等手段,給使用者打上分類标簽
·對于特定标簽的使用者,又可以根據預設的規則(知識)或者模型,推薦出對應的物品。
使用者資訊标簽化的過程一般被稱為使用者畫像。
基于内容的推薦算法
當拿到物品的基本資訊時,可以計算物品的相似度來進行推薦。
. Content-based Recommendations (CB)根據推薦物品或内容的中繼資料,發現物品的相關性,再基于使用者過去的喜好記錄,為使用者推薦相似的物品。·通過抽取物品内在或者外在的特征值,實作相似度計算。
-比如一個電影,有導演、演員、使用者标簽UGC、使用者評論、時長、風格等等,都可以算是特
征。
·将使用者(user)個人資訊的特征(基于喜好記錄或是預設興趣标簽),和物品(item)的特征相比對,就能得到使用者對物品感興趣的程度
-在一些電影、音樂、圖書的社交網站有很成功的應用,有些網站還請專業的人員對物品進行基
因編碼/打标簽(PGC)。
相似度計算
相似度的評判,可以用距離表示,而一般更常用的是"餘弦相似度。
餘弦相似度可以看作是衡量倆個向量的夾角大小,夾角越小,餘弦相似度越大,兩個向量的相似程度越大。
特征提取
對于物品的特征提取——打标簽(tag)
-專家标簽(PGC)
-使用者自定義标簽(UGC)
-降維分析資料,提取隐語義标簽(LFM)
對于文本資訊的特征提取———關鍵詞
-分詞、語義處理和情感分析(NLP)
-潛在語義分析(LSA)