天天看點

一種挖掘使用者評論文本的跨領域冷啟動使用者推薦網絡 | sigir論文解讀

新零售智能引擎事業群出品

CATN: Cross-Domain Recommendation for Cold-Start Users via Aspect Transfer Network

文章連結:

https://arxiv.org/abs/2005.10549

代碼連結:

https://github.com/AkiraZC/CATN

一、背景

在大型推薦場景中,存在着衆多類目(例如亞馬遜平台中的書籍、影視推薦等)。使用者往往隻與其中部分類目有過互動,對于其他類目,由于缺少相應的曆史行為記錄,協同過濾方法會遭遇冷啟動問題。

為了緩解冷啟動問題,一類可行的方法為利用使用者在其他類目上的曆史互動記錄進行知識遷移(跨領域推薦),比如,給喜歡武俠小說的使用者推薦古裝電影。同時,為了更細緻地刻畫使用者形象,參考使用者的曆史評論進行輔助推薦也能起到促進作用。

近年來,跨領域推薦和基于評論的個性化推薦均取得了不俗的進展,卻鮮有工作将二者結合。這類工作主要存在以下挑戰:1)使用者在不同類目下的關注點是不同的,且隻有少量稀疏特性存在關聯,導緻模型較難發現此類隐式關聯;2)對于在目前類目下無曆史記錄的冷啟動使用者,若直接利用其他類目下該使用者的評論文本,則會不可避免地帶來使用者特征的抽取誤差,例如,喜歡粗糙質地工藝品的使用者,不一定會喜歡粗糙材質的衣物。鑒别不同類目間評論文本的語義差異,也是一個不小的挑戰。

針對以上問題,本文提出了一種挖掘使用者在不同類目下的評論關聯,進而對冷啟動使用者進行推薦的深度模型,稱作CATN。CATN将使用者在其他類目的曆史評論融合為使用者文檔,将商品在目前類目的曆史評論融合為商品文檔,通過抽取文檔中的多源aspect來表示使用者/商品的細粒度特征關系,并引入“同好使用者”進一步增強使用者表示。實驗表明CATN能夠有效挖掘類目間的深層關聯,進而提升冷啟動使用者的推薦系統評分預測任務。

二、問題定義和抽象

電商平台中有多個類目,設定目前類目為Target Domain,其他類目為Source Domain,我們的目标使用者為在Source Domain上有過曆史互動記錄,而在Target Domain上無曆史記錄的冷啟動使用者,推薦系統任務為評分預測任務。

現有的針對冷啟動使用者的跨領域推薦算法往往包含三個步驟,如Figure 1:① Target Domain下使用者/商品的表示學習;② Source Domain下使用者/商品的表示學習;③ 兩個類目下重疊使用者的映射學習。對于Target Domain中的冷啟動使用者,依據步驟③訓練的模型進行表示映射,進而展開推薦。

然而此類方法存在着以下缺陷:

1)将使用者/商品特征映射為單個向量,忽略了細粒度模組化;

2)步驟③的學習完全依賴于步驟①②的訓練結果,容易導緻誤差積累;

3)不同類目間的關聯學習僅能通過重疊使用者的表示顯式學出,當兩個類目間重疊使用者的數量較少時,易導緻訓練不足。

同時,現有方法僅僅基于使用者的曆史點選行為進行表示學習,未能将評論文本納入其中,因而在使用者/商品特征模組化方面有所欠缺。

一種挖掘使用者評論文本的跨領域冷啟動使用者推薦網絡 | sigir論文解讀

三、技術選擇

本文建構了一個端到端的深度神經網絡模型,主要解決Target Domain中冷啟動使用者的推薦問題。模型的基本思想是利用使用者在Source Domain中的評價文本資料進行知識遷移,整體訓練流程如Figure 2。其中左側藍色矩形和右側綠色矩形分别代表兩類訓練流程:将使用者在Source Domain的曆史評論文本應用到Target Domain進行推薦,反之亦然。這兩個流程在網絡結構上完全相同,我們定義了全局共享參數和流程特有參數,使兩個流程在訓練過程中以小批量輪流訓練,進而能夠充分學習兩個類目間的資訊互動。

一種挖掘使用者評論文本的跨領域冷啟動使用者推薦網絡 | sigir論文解讀

以左側流程為例,我們的模型結構如Figure 3,主要分為以下三個部分:

一種挖掘使用者評論文本的跨領域冷啟動使用者推薦網絡 | sigir論文解讀

1)使用者興趣(商品特性)的細粒度抽取。我們将使用者的曆史評論文本彙總構成“使用者文檔”,“商品文檔”同之。以“使用者文檔”為例,首先将其映射

一種挖掘使用者評論文本的跨領域冷啟動使用者推薦網絡 | sigir論文解讀

到詞向量空間E_u=(e_1,e_2,…,e_l ),接着進行一維文本卷積操作得到C_u=(c_(1,u),c_(2,u),…,c_(l,u) ),使用門控機制進行多細粒度的aspect特征抽取g_(m,j,u)=(W_m c_(j,u)+b_m )⊙σ(W_m^g c_(j,u)+b_m^g ),m=1,2,…,M,其中M為預定義的aspect個數。“商品文檔”的操作與上述相同,且同一個流程中參數共享。為了克服不同類目間評論文本的語義差異,我們基于不同類目aspect query的注意力機制進行抽取,得到使用者的aspect表示A_u=[a_(1,u),...,a_(M,u)]。

其中v_(m,s)為Source Domain的aspect query,同樣地,Target Domain的aspect query v_(m,t)将作用于目前類目下評價文本的特征抽取。

2)“同好使用者”評論輔助增強。鑒于兩個類目間的重疊使用者數量可能較少,我們嘗試利用與目标使用者有着相同興趣的使用者(同好使用者)評論進行輔助增強。“同好使用者”的定義可以根據其個人資訊、曆史行為或社交關系作為依據,本文中我們參考了PARL [Wu et al. CIKM“2018]中的定義,将對同一件商品打分相同的使用者作為“同好使用者”,并将目标使用者的所有“同好使用者”所寫的評論融合得到其的輔助評論。鑒于輔助評論由不同使用者所撰寫,文字風格存在較大差異,我們設計了額外的文本卷積層,如Figure 3所示。經過與1)中相似的特征抽取過程,得到輔助評論的aspect表示A_(u_aux ),最後利用基于門控機制的表示融合,得到最終的使用者特征表示A_u。

一種挖掘使用者評論文本的跨領域冷啟動使用者推薦網絡 | sigir論文解讀

3)跨領域關聯學習。使用者在不同類目間的興趣關聯往往是稀疏而有針對性的,是以我們設計了對應的稀疏矩陣結構進行刻畫。具體來講,全局aspect相關矩陣S由Source Domain和Target Domain下的aspect query表示相乘得到(leakyRelu激活函數展現稀疏性),具體的aspect比對矩陣S_(u,i)由從文本特征挖掘而來的aspect表示相乘得到,公式如下,其中b_u和b_i為使用者和商品的偏置項,r ̂_(u,i)為推薦預測分數。

一種挖掘使用者評論文本的跨領域冷啟動使用者推薦網絡 | sigir論文解讀

四、技術創新

相較于現有方法,CATN主要在以下幾個方面具有創新性:

1)通過對使用者評論的細粒度特征模組化,有效刻畫了使用者/商品的細粒度特征/興趣,以及跨類目間使用者的興趣關聯;

2)摒棄了先前工作的3-step訓練流程,通過端到端的訓練方式,有效避免了各階段的誤差累積;

3)通過引入“同好“使用者增強使用者表示,一方面增加了訓練資料的多樣性,另一方面從相似使用者的層面增強了對冷啟動使用者的推薦效果。

五、實驗

本文實驗在Amazon資料集中最大的三個類目(Book, Movie, Music)展開,兩兩配對形成三個場景,并在訓練集中按照不同比例采樣重疊使用者。實驗結果如Table 3,前5個baseline基于三步訓練政策,ANR [Chin et al. CIKM’18]為基于評論的aspect推薦方法,這裡直接将使用者在Source Domain 的評論與Target Domain的商品評論進行互動。由Table 3可知,CATN達到了最優的效果。

一種挖掘使用者評論文本的跨領域冷啟動使用者推薦網絡 | sigir論文解讀

我們對模型的可解釋性進行分析,Figure 5為全局aspect相關矩陣S可視化圖,類目間的相關特征往往集中于某一個/幾個區域。Table 6展示了場景1(Book-Movie)中評論文檔attention權重排名top5的詞彙,通過人工歸納标簽,發現Book類目第二/三個aspect為故事情節性的特征,Movie類目第三個aspect為電影内容,二者具有強烈的相關性,展現在全局aspect相關矩陣S中右下角的幾個方塊顔色最深,說明CATN具有一定的推薦可解釋性。

一種挖掘使用者評論文本的跨領域冷啟動使用者推薦網絡 | sigir論文解讀

更多資訊檢索技術内容請檢視:

獨家下載下傳!《SIGIR 頂會論文解讀》電子書重磅釋出

繼續閱讀