天天看點

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

引言

本人英語水準較低,翻譯文章必有不足之處,是以希望大家嘴下留情。

1. 摘要

傳統的推薦系統主要是對使用者固有的、長期的偏好進行模組化,而動态的使用者需求也非常重要。通常,曆史消費會影響使用者對其關系項的需求。例如,使用者往往會同時購買補充性的産品(iPhone和Airpods),而不會購買替代性的産品(Powerbeats和Airpods),盡管替代品仍然可以滿足使用者的偏好。為了更好地模拟曆史序列的影響,以往的研究引入了物品關系的語義來捕獲使用者的推薦需求。然而,我們認為,不同關系所引起的效應的時間演化是不可忽視的。在上面的例子中,當使用者需要一個新的耳機時,使用者對耳機的需求可以在很長一段時間後提升。為了建立項目在不同序列環境下的動态意義模型,Chorus提出了一種考慮項目關系和相應時間動态的新方法合唱。合唱的目标是通過一種知識感覺和時間感覺的方式來推導目标項的嵌入,每個項目将得到它的基本表示和相關表示。然後,根據曆史序列中是否存在關系項以及運作時間,設計時态核函數來動态組合這些表示。增強的目标項嵌入可以靈活地與各種算法一起計算排名分數并生成推薦。根據在三個真實資料集的廣泛實驗,合唱獲得了顯著的改進,相比最先進的基線方法。此外,時間相關參數具有較高的可解釋性,可以增強推薦的可解釋性。

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

1.介紹

随着網際網路上資訊的過載,推薦系統在日常生活中扮演着越來越重要的角色。它不僅提供了迎合使用者口味的資訊,而且有助于發現使用者的内在偏好。傳統的推薦方法主要側重于使用者偏好模組化[11,13,19,33]。例如,潛在因素模型[21]将使用者和物品都嵌入到一個潛在空間中,使用者的嵌入代表了各個方面的偏好,在不同的推薦時間不會發生變化。

然而,雖然使用者的偏好大部分時間是靜态的,但使用者的消費需求實際上是動态的、可變的。在不同的環境中,對于同一使用者來說相同的項會有不同的含義。實際上,順序消費行為可以看作是在不同方面滿足使用者需求的過程。一項物品的消費可能會對其他相關物品産生影響,而這種不同關系的影響也各不相同。以互補關系和替代關系為例,圖1說明了購買不同關系物品的效果如何随時間變化。補充:假設使用者目前購買了iPhone,他/她可能會在短期内購買AirPods(即iPhone的一個補充)。但一段時間後,積極的效果将會降低(使用者可能已經有了耳機,推薦系統不應該繼續提供AirPods)。對于替代品:如果他/她剛剛消費的是AirPods的替代品,如Powerbeats,預計短期影響主要是負面的,因為使用者不會立即需要另一個耳機。雖然消極的影響可能會在中期轉變為積極的,因為使用者可能需要購買一個新的耳機,而新釋出的AirPods可能會有吸引力。這種積極的效果也會逐漸減弱,使用者可能會對這種耳機失去興趣,或者通過其他方式購買了另一款耳機。

從上面的例子中,我們可以看到不同關系項的目前消費對目标項有不同的影響。更重要的是,每一種關系的時間趨勢也不同。也有研究将項目關系引入推薦系統[16,40,44,45],但沒有考慮不同關系的時間動态。雖然一些研究涉及長期和短期偏好[16],但項目關系僅用于模組化短期項目的轉換,缺乏對不同關系效應的持續演化的模組化。最近的另一項研究調查了重複消費[41]的時間動态。然而,消費不僅會影響同一商品本身,還會影響相關商品。是以,項目關系和相應的時間動态都是在不同語境中擷取項目動态意義的關鍵。

本文提出了一種基于知識和時間感覺的目标項嵌入方法——合唱。據我們所知,我們是第一個明确模型的不同關系的影響随時間的演變,這有助于更好地捕捉每個項目在不同序列上下文中的意義。特别地,Chorus基于基于平移的圖嵌入方法為每個項目配置設定了一個基本表示和各種關系表示。然後,這些表示通過臨時核心函數動态地組合在一起,這取決于自關系消費以來所消耗的時間,這就是它被命名為Chorus的原因。提出的時态核函數使關系表示能夠以不同的方式對最終項嵌入做出貢獻。是以,Chorus能夠動态擷取知識和時間感覺的項目嵌入,這很容易被各種推薦算法利用。此外,高可解釋性的時間相關參數使得解釋不同時間段的推薦結果成為可能。本工作的主要貢獻總結如下:

•我們建議同時考慮項目關系和相應的時間動态。據我們所知,我們是第一個明确的模型,不同關系的影響的持續時間演化。

•我們設計了一種新穎靈活的方法Chorus,當目标物品在序列中扮演不同的角色時,通過動态組合不同的表示來增強目标物品的模組化。最後的項目嵌入可以很容易地與各種推薦算法一起工作。

•在三個真實資料集上的對比實驗表明了Chorus的有效性,且高可解釋性參數進一步有助于提高模型的可解釋性。

2.相關工作

2.1 時序建議

與傳統的推薦方法不同,序列推薦基于馬爾可夫鍊,利用序列資料預測使用者的下一次消費,馬爾可夫鍊假設下一個動作依賴于上一個動作序列[34,37]。Rendleet al.[34]結合矩陣分解[21]和馬爾科夫分解鍊,給出前一籃子項的下一籃子推薦。最近,有很多工作利用遞歸神經網絡(RNN)[36]将互動曆史編碼到隐藏向量中[6,12,23,27,32,38]。Hidasi等人[12]首先将RNN引入到順序推薦中,并取得了令人印象深刻的性能增益。Loyolaet al.[27]和Peiet al.[32]均将注意機制[39]應用于RNN,以獲得更有效的推薦。此外,許多後續研究都集中在擴充基于RNN的模型的能力。

盡管基于RNN的順序推薦方法具有很強的表達能力,但由于缺乏外部知識,它們仍然不能很好地模拟複雜的使用者需求,并嚴重存在可解釋性問題[26]。不同的是,我們的方法顯然解決了項目關系和相應的時間動态,以更好地捕捉使用者需求。

2.2 項目關系模組化

在真實的應用程式中,具有具體語義的項之間通常有多個關系。最近的一些研究集中在如何将項目關系引入推薦系統[16,28,30,40,44,45],其中大多數使用知識圖(KG)[42]來表示項目關系。CFKG[45]将使用者與商品關系圖作為實體引入,将購買行為視為另一種關系,然後使用TransE[3]表示異構資訊網絡并提出建議。Xin等人[44]提出了一個通用的推薦任務,該任務包含了項目之間的多個關系,并将關系資料內建到協同過濾(CF)[35]中。Ma等人[28]提出了一個聯合學習架構,內建了從知識圖中歸納可解釋規則。

然而,所有這些方法都假定關系項消費的影響是靜态的,并且與時間資訊無關,在這種情況下,即使使用者不需要補語,也可能在很長一段時間後持續推薦補語。

2.3 時間動力學模組化

考慮到時間資訊,主要有兩種工作。一方面,一些工作旨在将時間資訊作為上下文特征。TimeSVD++[20]将時間劃分為槽,并設計與時間相關的參數。TransMF利用FM将時間戳作為額外的上下文特性[31]。張量分解也是一種主要的方法[2,17],其中時間被視為使用者-物品互動立方體的第三維。另一方面,一些工作側重于模拟曆史互相作用的時間衰減效應。在這一行中,Hawkes Process (HP)[8]總是被用來模組化使用者消費序列的互激特性[7,22,24,41]。Du等人[7]首先将Hawkes過程應用于時間敏感的推薦。SLRC[41]結合了Hawkes過程和協同過濾來模拟重複消費的時間動态。

然而,這些方法沒有考慮不同關系的時間動态。是以,為了更好地模組化動态使用者需求,我們創造性地考慮了項目關系和相應的時間演化。

3 預賽

3.1 任務定義

定義3.1(問題定義):鑒于使用者 u ∈ U u \in U u∈U和互動曆史 S u = ( i 1 , t 1 ) , ( i 2 , t 2 ) . . . ( i N u , t N u ) ∈ S S_u={(i_1,t_1),(i_2,t_2)...(i_{N_u},t_{N_u})}\in S Su​=(i1​,t1​),(i2​,t2​)...(iNu​​,tNu​​)∈S,在時間 t n < t n ′ t_n< t_{n′} tn​<tn′​内對于任意的 n < n ′ < N u n < n′< N_u n<n′<Nu​的 N u N_u Nu​次互動,推薦任務為:考慮目标時間t(記為 S u t S^t_u Sut​)之前的互動序列,生成一個有序清單,其中包含使用者在t時可能感興趣的k個項目。

此外,設R為所有項關系的集合,每個項關系 r ∈ R r\in R r∈R有一個矩陣 I r ∈ N M × M I_r\in N^{M\times M} Ir​∈NM×M,其中M為項的總數,如果關系r對項i和j成立則 I r ( i , j ) I_r(i,j) Ir​(i,j) = 1,否則為0。關系r可以是互補的,替代的等等。

3.2 知識圖嵌入

項目關系的資訊可以看作是一個知識圖,其組成部分是一組三元組(i,r,j),其中i和j表示不同的項目,r表示關系類型。例如,(AirPods, is_complementary _o f,iPhone)表示AirPods是iPhone的補充。需要注意的是,有時三元組的反義詞可能不成立(例如iPhone不是AirPods的補充),是以關系圖是有方向性的。

為了将關系圖的結構資訊引入到推薦系統中,獲得具有項目關系語義意義的嵌入是非常重要的。在各種嵌入方法中,基于翻譯的模型[3,25,43]以其效率和有效性突出。其内在思想是将項目和關系嵌入到同一個潛在空間中,并尋找一個平移函數來最小化評分函數:

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

其中D(·)是度量距離的度量函數(通常是 l 2 − n o r m l_2-norm l2​−norm)。Trans(i,r)是一個任意的平移函數,可以是一個簡單的平移操作,也可以是一個專門設計的神經網絡。很多工作都集中在翻譯功能的能力擴充上,如TransE [3], TransH [43], TransR[25]等。對于TransE[3],平移函數為Trans(i,r) = i +r,對于任何三元組(i,r,j)應用 l 2 − n o r m l_2-norm l2​−norm時的評分函數為 f ( h , r , t ) = ∣ ∣ h + r − t ∣ ∣ 2 f (h,r,t) = ||h +r−t||_2 f(h,r,t)=∣∣h+r−t∣∣2​。

為了從關系圖中學習項目和關系嵌入,将基于邊際的損失[45]最小化,如下所示:

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

對于每一個三元組,尾部項被一個随機抽樣項 j ′ j ' j′替換,以確定 ( i , r , j ′ ) (i,r,j ') (i,r,j′)在知識圖中沒有被觀察到。類似地,标題項被 i ′ i ' i′替換,并且 ( i ′ , r , j ) (i ',r,j) (i′,r,j)不成立。上述目标函數的目的是區分觀察到的三元組和損壞的三元組,并強迫嵌入保持項目之間的關系。

3.3 推薦基礎方法

本文提出的項目模組化方法可以靈活地與各種推薦算法配合使用。由于貝葉斯個性化排序(Bayesian Personalized Ranking, BPR)[33]是一種應用廣泛的矩陣分解方法,而廣義矩陣分解(Generalized matrix factorization, GMF)[11]是一種最先進的基于神經網絡的方法,我們選擇它們作為基本推薦模型來驗證我們方法的有效性。

本文簡要回顧了這兩種協同過濾方法。CF方法假設相似的使用者喜歡相似的物品。在BPR情況下,每個使用者和物品都存在一個k維潛在因子,其排名得分計算如下:

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

其中 b u b_u bu​和 b i b_i bi​分别是每個使用者和項目的偏好。

在GMF的情況下,排名得分由多層神經網絡得到,可以表示為:

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

其中 ϕ o u t \phi_{out} ϕout​和 ϕ x \phi_{x} ϕx​分别表示輸出層和第X個神經協同過濾層的映射函數,共有X個神經CF層。然後,根據預測的分數 y ^ u i \hat y_{ui} y^​ui​對候選項目進行排名。

為了學習推薦模型中的參數,可以對兩兩排序損失[33]進行優化:

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

其中, σ \sigma σ為s型函數,一個負項 j ∉ S u j \notin S_u j∈/​Su​是每個訓練執行個體的随機抽樣。

4 合唱模型

4.1 模型概述

合唱是一個兩階段模型,它綜合了項目關系及其特定的時間效應。圖2示範了整個模型結構。在第一階段(關系模組化),利用圖嵌入将項目關系的結構資訊編碼到嵌入中。在這裡可以靈活地使用第3.2節中描述的各種基于翻譯的方法。關系圖嵌入的結果将用于推導我們的合唱模型中的基本和關系表示。

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

在第二階段(Dynamic Item Representation)中,有兩個關鍵子產品:(1)動态內建,(2)時序核心函數的設計。首先,除了基于平移函數的基本關系表示外,每個條目将得到 ∣ R ∣ |R| ∣R∣關系表示,平移函數表示目标條目在上下文中扮演不同角色時的表示。然後,根據曆史序列中是否存在相應的關系消費以及運作時間,動态內建這些表示。為了結合每個關系的時間動态,我們提出了特定關系的時間核函數來控制效應的極性和強度。是以,關系表示對不同上下文中的最終項嵌入有不同的貢獻,進而導緻知識感覺的動态項嵌入。最後,許多算法都可以利用增強的項目嵌入來計算排名分數并提出建議。在本節的其餘部分,我們将在第二階段詳細闡述合唱的關鍵子產品。

4.2 動态內建

首先,根據關系圖嵌入的結果,定義每一項的基本表示(記為 i b i_b ib​)和關系表示(記為 i r i_r ir​代表關系 r ∈ R r\in R r∈R)。基本表示對項的固有特征進行編碼,利用第一階段學到的項嵌入來初始化 i b i_b ib​,然後利用平移函數得到關系表示:

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

其中 e r e_r er​是 r ∈ R r\in R r∈R的關系嵌入,這樣,關系表示将對應于每個關系的語義資訊整合在一起。

在獲得基本和關系項表示之後,這裡我們重點讨論如何根據不同的上下文動态地組合它們,這是我們的Chorus模型的核心思想。注意,關系表示是知識感覺的,但仍然是靜态的。我們的目标是為每個關系表示派生一個上下文感覺系數 f r f_r fr​,以反映目前上下文中的實際影響程度。最後的上下文和知識感覺項嵌入 i C h o r u s i_{Chorus} iChorus​提出如下表示:

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

它由兩個部分組成:基本項目表示和縮放的關系項目表示,其中上下文(曆史序列 S t u S^u_t Stu​,時間t和目标項目i)作為系數 f r f_r fr​的輸入。接下來我們重點讨論如何從給定的上下文中獲得合理的 f r f_r fr​。

直覺地說,某些關系表示在某些情況下可能沒有影響,甚至有負面影響。圖3給出了一些示例,說明這些表示如何在不同上下文中對最終的嵌入做出貢獻。三角形的三個角代表目标物品的不同表示。當沒有關系消費(上下文A)時,最後的嵌入隻是基本項表示,而其他兩個關系項不産生影響。當Powerbeats或iPhone剛剛購買時(上下文B和C),相應的關系表示應該分别有消極和積極的影響。而如果替代品是很久以前購買的(上下文D),替代品表征可能會對最終嵌入産生積極的影響。此外,當序列中有許多不同的關系項時,這三種表示都将以不同的程度起作用。

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

為了整合不同關系的時間動态,我們創新性地為每個關系設計了時間核函數,它是消費之間滞後時間的連續函數。時序核函數的目的是控制每個先前關系消費的影響程度。函數值的極性表示效果的極性。假設我們已經得到了時間核函數 κ r i ( ∆ t ) κ^i_r(∆t) κri​(∆t),以項i和關系r為索引(具體設計和相關讨論在下一節中留下),我們建議定義關系系數 f r f_r fr​如下:

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

其中 I r I_r Ir​為關系矩陣。以前的每一次消費與目标項目i的關系r将對系數 f r f_r fr​有疊加效應,由核函數 k r i ( ⋅ ) k^i_r(·) kri​(⋅)控制。這樣,不同于以往的靜态項目嵌入的研究,相關系數使得不同的表征對最終的嵌入有不同程度的貢獻。由于時間核函數的存在,關系表示可能由于間隔時間太長而幾乎不起作用,在某些情況下甚至會産生負面影響。是以,合唱嵌入可以更好地捕捉不同語境中項目的意義,進而更好地模拟使用者需求随時間的變化。

此外,為了簡單和高效,我們可以隻考慮曆史序列中最新的關系項,在這種情況下,Equ.(7)可以直接表示為:

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

式中, ∆ t r ∆t_r ∆tr​表示從最近一項消費開始經過的時間,與目前項r相關。如果一個關系的曆史序列中沒有關系項,我們假設有一個具有正無窮時間間隔的關系項( ∆ t r = + ∞ ∆t_r= +\infty ∆tr​=+∞)。假設時序核函數随時間趨近于零,則相應的關系嵌入不受影響。

4.3 時序核函數的設計

接下來,我們重點讨論了如何為每個關系設計時态核函數。實際上,時間核函數的具體形式可以看作是對模型的一種人為幹預。一方面,我們可以根據每個關系的特點來設計功能。例如,如圖1所示,互補關系在短時間内具有積極的影響,這種影響随着時間的推移而衰減。另一方面,可以根據系統的主觀要求進行設計。如果我們希望替代品在短期内也出現在推薦清單中,可以将時域核函數設計為初值為正,衰減更快。在本文中,我們主要研究兩種關系:互補關系和取代關系。作為執行個體,我們根據這兩種關系的一般認知和特點設計了相應的時間核函數。

對于補品而言,除了整體下降趨勢外,其正面效應一般會持續一段時間,然後在日常生活中開始衰減。是以,我們選擇均值為零的正态分布作為其時間核函數,而不是衰減過快的直覺指數分布:

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

式中 N ( ∆ t ∣ μ , σ ) N(∆t|\mu,\sigma) N(∆t∣μ,σ)是∆t随 μ \mu μ均值和 σ \sigma σ标準差的正态分布。注意這裡的參數 σ c z ( i ) \sigma^{z(i)}_c σcz(i)​與z(i)有關,z(i)表示項目i的類别。我們不估計項目特定的參數,因為類别通常是一個更适合的水準,以模拟一組項目的特征。特定于項的參數也可能受到資料稀疏問題的困擾。

對于替代品,我們預計其影響将由負向正,因為我們短期内不需要另一種類似效用的物品,但希望在其壽命結束[41]時更換新的物品。是以,我們使用兩個相反的正态分布來模拟這樣的特征:

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

這是(1)短期抑制(負)和(2)終身促進(正)的疊加。負正态分布被設計為零均值,因為再教育訓練的效果通常在替代消費之後最強。在正數中,參數 μ s z ( i ) \mu^{z(i)}_s μsz(i)​在某種程度上代表了該類的生命周期,也就是說影響将在此時達到峰值。

圖2顯示了這兩個臨時核心函數。還可以設計其他形式的臨時核心函數來滿足不同的需求。此外,合唱并不局限于這兩種關系。可以合并許多關系,如相同品牌、相同生産商等等,

唯一要做的就是在先驗知識的基礎上設計一個相應的時序核函數。

在這裡,我們得到了最終的知識感覺的動态項目嵌入。然後利用各種算法來進行推薦,用我們的算法代替原始目标項的嵌入。與之前的模型不同,Chorus同時內建了順序資訊、項目關系模組化和相應的時間動态。最近提出的CFKG和SLRC要麼隻關注商品關系,要麼隻關注消費順序中的時間動态。表1列出了相關方法與我們的Chorus模型之間的差別。關于這些基線的更多細節将在第5.1.3節中描述。

4.4 參數學習

為了獲得更好的魯棒性能,我們采用兩階段的訓練過程來學習模型參數:首先,優化 L r e l L_{rel} Lrel​得到帶有結構資訊的項目和關系嵌入,并在第二階段初始化基本項目表示和關系嵌入;然後最小化 L r e c L_{rec} Lrec​來學習模型的所有參數。在第二階段,我們不會當機之前學到的東西。實驗表明,用 L r e c L_{rec} Lrec​進行優化能獲得較好的效果。另一方面,它也可能在訓練開始時破壞有意義的嵌入。是以,在第二階段,我們将基本項目表示和關系嵌入的學習率降低0.1。由于Adam[18]在許多推薦模型中都取得了成功,是以在每個階段都使用它作為學習算法。

5.實驗

5.1 實驗設定

5.1.1 資料集 實驗在公開通路的Amazon資料集[9]上進行。除了帶有時間戳的使用者互動序列外,它還具有項目中繼資料,包括also_view,also_buy和category information的清單。繼前人的研究[28,29]之後,我們将also_view作為替代關系,also_buy作為補充關系。不同的是,在我們的工作中,關系意味着是互補的和被取代的。是以,原來的also_view,also_buy關系的方向應該颠倒過來。

我們采用三個有代表性的子資料集:Grocery and Gourmet Food (Grocery), phones and Accessories (Cellphones), 和 Home and Kitchen (Home)。表2總結了三個資料集的統計量。注意,在Home資料集中,與曆史項相關的測試用例的比例很低,而且關系資料相對稀疏。

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作
Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

5.1.2 評估協定 我們采用留一法來評估,該方法在文獻中被廣泛采用[4,10,15]。對于每個消費序列 S u ∈ S S_u\in S Su​∈S,我們使用每個使用者最近的互動進行測試,使用最近的第二個條目進行驗證,使用剩餘的條目進行訓練。考慮到在資料集較大的情況下,某些方法對所有項目進行排序比較耗時,我們随機抽取99個目标使用者沒有互動過的項目,将ground-truth項目與這些negative項目一起進行排序。這種方法也被廣泛采用[11,41,44]。

為了評價推薦品質,我們使用命中率(HR)和歸一化折現累積增益(NDCG)[14]作為評價名額。[email protected]是評價“ground-truth”是否出現在推薦排名前k位的網站,[email protected]是評價“ground-truth”是否出現在推薦排名前k位的網站。我們用不同的随機種子重複每個實驗5次,并報告平均分數。

5.1.3 基線的方法 我們将我們的Chorus模型與7種基線方法進行了不同方面的比較,包括傳統的協同過濾、順序推薦以及包含項目關系或時間動态的方法:

•BPR[33]:該方法提出采用兩兩排序損失優化矩陣分解模型。

•GMF[11]:這是一種先進的協同過濾方法,利用多層神經網絡。

•Tensor[17]:該方法将時間分成多個容器,并分解出一個三維張量(使用者-項目-時間)。

•GRU4Rec[12]:這是一個順序推薦模型,應用GRU[5]得出排名分數。

•NARM[27]:該模型利用GRU和注意機制來提高順序推薦的性能,這是一種基于會話的方法。

•CFKG[45]:該方法考慮了各種商品關系,并将購買視為使用者與商品之間的另一種關系。然後,利用TransE學習圖嵌入并提出建議。

•SLRC的[41]:SLRC結合Hawkes和CF來模拟重複消費的時間動态。考慮到亞馬遜資料集中已經删除了重複消費,我們将其設定擴充到關系項的影響,命名為SLRC '。但它仍然缺乏項目關系的語義模組化。

5.1.4 實作細節 我們在PyTorch中實作了所有模型。實作代碼已經釋出。為便于比較,所有模型的嵌入尺寸均設定為64。所有超參數都被調優以在驗證資料集中獲得最佳結果。對于CFKG,我們考慮了also_view和also_buy關系與我們的一緻。對于SLRC '和Chorus,我們發現在曆史序列中有兩個或兩個以上關系項的互動很少。是以,為了簡單和高效,我們在不損失通用性和性能的情況下,将最新的關系互動考慮在序列中。此外,在合唱中還使用了TransE作為翻譯功能。為了數值穩定性,所有時間相關參數均初始化為1,其他參數通常初始化為0均值和0.01标準差。

5.2 整體表現

表3顯示了所有基線和我們的Chorus模型在使用BPR和GMF計算排名分數時的表現,分别表示為 C h o r u s B P R , C h o r u s G M F Chorus_{BPR},Chorus_{GMF} ChorusBPR​,ChorusGMF​。

首先,不同類型的基線顯示出明顯的性能差距。對于協同過濾方法(例如BPR和GMF),它們作為基準,因為它們擁有的唯一資訊是使用者-項目互動。張量法通過考慮時間動力學而優于基本的CF方法。順序推薦方法(如GRU4Rec和NARM)進一步獲得了更好的性能,這說明了最近消費的物品傳遞的動态使用者需求的重要性。CFKG得到了公平的結果,在某些名額上成為了最佳基線,這表明項目關系确實有助于推薦。對于SLRC’,由于其對消費序列的互相激勵特性的顯式模組化,一般在基線中得到最好的結果。

其次,我們的Chorus模型在所有資料集中都比其他基線表現得更好,這得益于處理項目關系和它們的時間動态。這表明所提出的模型能夠更好地捕捉使用者的動态需求和不同語境下物品的含義。與CFKG相比,合唱不僅考慮了物品之間的關系,還內建了物品之間的時間動态。與SLRC相比,合唱能夠模拟每個關系的語義和類别特定的時間效應。在SLRC中,Hawkes的基本形式可能更關注關系項目的影響,是以,在沒有先前關系的情況下,通常會影響性能消費(更多讨論見章節5.4)。與之不同的是,Chorus将項目關系內建到知識感覺的動态項目表示中,這更加有效和靈活。

另一方面,請注意,在Home資料集中,改進相對較小。可能的原因是關系資訊過于稀疏且不那麼可靠。我們使用CFKG的相似關系圖嵌入方法,但該方法在該資料集上的表現也很差。盡管TransE在其他資料集中工作得很好,但是Home資料集中的關系可能是如此複雜,以至于TransE不足以精确模組化。更多的證據在5.3節的相關讨論中提供。

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

5.3 消融實驗

為了驗證我們模型中關系模組化和時間動态處理的效果,我們将合唱與兩種變體進行了比較:

•合唱\ R。該模型為每個關系配置設定單獨的項目嵌入,并通過優化Lr ec估計所有參數。圖嵌入的結果不用于初始化基本表示和推導關系表示。

•合唱\ T。該模型沒有考慮時間動态關系,假設所有時間核函數(即:∆t)均為常數,值為1。

圖4顯示了 c h o r u s B P R chorus_BPR chorusB​PR的[email protected]及其變體,以及SLRC’。可以得出結論,關系模組化和時間動力學都是非常重要的。合唱子產品的缺失導緻了表演的損失。此外,我們有以下看法:

首先,項目關系确實很有幫助。在Grocery和phones資料集中,Chorus\R帶來的性能損失最大,這表明了關系結構資訊模組化的重要性,以及我們基于平移的方法,通過圖嵌入來派生關系表示。

其次,建立不同關系的時間動态模型是很重要的。在沒有時間資訊的情況下,合唱\T在前兩個資料集中導緻性能的适度損失。這并不意味着我們模型中處理的時間動态是不重要的。從字面上看,商品之間的關系對使用者做出消費決定的影響更大。是以,模組化項目關系比模組化時間動态帶來更大的改進是合理的。另一方面,與Chorus\T相比,合唱取得了一緻的改進,特别是在Home中,這顯示了向前移動的有用性,将項目關系的時間動态考慮進去。

第三,關系圖嵌入在Home資料集中效果不佳,其中Chorus\T的性能損失最大,而Chorus\R的性能損失較小。這是關系模型不足的另一個證據。雖然TransE是翻譯函數的自然選擇,而且通常在其他兩個資料集上工作得很好,但我們發現它在Home資料集的場景下可能不夠,在Home資料集中CFKG使用TransE作為其圖嵌入方法的表現也很糟糕。圖4 ©顯示,沒有關系模組化,性能不會下降太多(Chorus\R)。但如果有關系模組化而沒有時序核函數(Chorus\T),則項目和關系的不恰當嵌入會影響性能。這也表明,在我們的模型中處理的時間動态可以幫助自适應地避免混亂的關系的可能的壞影響,這表明考慮時間動态的有用性和必要性。

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

5.4 不同場景性能

除了整體性能的提升,我們還想弄清楚這些提升來自哪裡。這裡我們研究了模型在不同場景下的表現。具體來說,我們根據曆史序列中是否存在相應的關系消費來構造測試資料集的三個子集。正常意味着以前沒有關系項。補語是指目标項是曆史序列中某些項的補語。類似地,替代品是指先前的消費作為替代品的情況。當之前有兩種關系項時,測試用例可能同時在補碼組和替換組中。圖5顯示了手機資料集三個子集中不同模型(行)的[email protected]和案例數(條)。我們可以看到,雖然補體和替代組的情況更少,但模型往往在這些情況下表現得更好。他們可能會從本質上證明一些模式,這樣所有的模型都能獲得比正常情況下更好的性能,即使對于沒有明确考慮項目關系的BPR也是如此。

此外,合唱能夠結合各種方法的優點,進而取得平均最好的成績。注意,對于SLRC和CFKG,它們都有各自的優勢和劣勢。盡管SLRC在關系案例中表現良好,特别是在Substitute組中,但它在正常案例中甚至比BPR更糟糕。這表明SLRC '容易過度拟合關系情況,而這反過來又會損害正常情況的性能。另一方面,盡管CFKG在正常組中表現良好,但在關系案例中,它不如SLRC '強大,因為SLRC '明确地模拟了每個關系的時間特征。至于合唱,它捕獲了項目關系和它們的類别特定的時間動态。值得注意的是,在正常情況下,Chorus與CFKG類似;在補充情況下,合唱比SLRC好一點,這兩個都是每個場景中的最佳基線。雖然在替代組合唱不如SLRC’強,但與CFKG相比有明顯改善。結果,Chorus獲得了明顯更好的平均結果,這表明內建項目關系和細粒度的時間動态的重要性。

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

5.5 參數可解釋性

在這裡,我們希望在設計時間核函數時驗證與時間相關的參數是否具有可解釋的意義。注意,這些參數是按項類别索引的,這表示以前的關系消費對這個類别的影響如何随時間變化。雖然某一特定關系的整體趨勢因其功能形式而趨同,但它們的具體形式卻揭示了範疇的特征。圖6顯示了在手機資料集中學習到的一些有代表性的類别的時态核函數。

Chorus翻譯引言1. 摘要1.介紹2.相關工作3 預賽4 合唱模型5.實驗6 結論與未來工作

左圖對應的是耳機和替換零件方面的互補關系。如圖所示,耳機上的效果衰減比替換零件快得多。一方面,購買手機後,向使用者推薦耳機作為補充是合理的。但如果使用者不使用推薦的耳機,他/她可能會使用已經有一個耳機或從其他地方購買了一個。是以,補語的積極作用預計會很快消退,否則持續推薦耳機可能會給使用者帶來麻煩。另一方面,對于備用電池等替換部件來說,補充消費的積極作用将持續一段時間。因為使用者通常會在原裝置電池耗盡一段時間後購買備用電池。

盡管一般形式都由兩個相反的正态分布組成,但基本情況下的時間核函數與其他兩種情況有很大的不同,其中抑制效應的分量幾乎是平坦的。這說明使用者在購買手機殼的時候,不會産生強烈的負面影響,因為我們經常因為各種原因更換手機殼,比如邊緣壞了,或者隻是想嘗試新的款式。對于國際充電器和手機,它們的時域核函數都表現出明顯的負效應和正峰。這是合理的,因為如果我們剛買了一個充電器或手機,一般不需要另一個充電器或手機。有趣的是,這兩種物品的峰值對應的時間間隔是相似的,這反映了手機的變化往往會導緻比對充電器的變化。此外,與充電器相比,手機的曲線更平滑。原因可能是,我們可以因為各種原因更換手機,但如果充電器能用,就很少更換。是以,新手機可以在很長一段時間間隔後使用。

綜上所述,我們的Chorus模型中的時間相關參數具有較高的可解釋性,很好地反映了不同類别項目的特點。這些參數可以幫助推薦系統對推薦結果進行解釋。例如,使用者之前購買了iPhone,這時恰好到了手機的時間核心函數的峰值時,推薦一個新的手機可以解釋為“你的手機已經使用了很長一段時間,看一看一些新産品如何?”

6 結論與未來工作

在這項工作中,我們提出了一種新的方法合唱知識和時間感覺項目模組化。據我們所知,我們是第一個明确模組化不同關系的影響随時間的演變,并将這些資訊納入項目嵌入。我們使用圖嵌入從項目關系圖中學習結構資訊,然後為每個項目派生不同的關系表示。利用特定的時間核函數控制關系的時間動态,并根據曆史序列中目标項和關系項之間的時間間隔動态組合關系表示,得到知識感覺的動态項表示。另外,時序核函數的設計可以看作是對模型的一種人為幹預,可以用來滿足不同的推薦結果要求。由于Chorus的靈活性,它可以很容易地利用各種基于嵌入的算法來計算排名分數和提出推薦。大量的實驗結果表明,合唱優于最先進的基線,這表明項目關系和它們的時間進化效應是非常重要的。此外,合唱中的時間相關參數具有較高的可解釋性,有助于提高推薦的可解釋性。

該模型仍有一些局限性,如預定義的時間函數和兩階段學習過程。此外,雖然基于翻譯的方法總體上效果不錯,但在某些情況下,我們發現其不足之處,需要進一步研究。未來,我們将研究如何自适應估計不同關系的時間演化效應,并嘗試設計更适合的方法,将項目關系模組化和推薦緊密結合起來。

繼續閱讀