| 作者:Shoujin Wang
| 機關:麥考瑞大學博後
| 研究方向:資料挖掘,機器學習以及推薦系統
一. 論文簡介
本文給大家介紹一篇剛被ACM旗艦期刊 ACM Computing Surveys (CSUR) 接收的基于會話推薦系統 (Session-based Recommender Systems (SBRS)) 的綜述長文。ACM Computing Surveys 是計算機學科最具影響力的期刊之一,其最新影響因子為7.99,為CORE Rank A* 期刊,主要發表計算機科學領域較有代表性的綜述論文。
文章題為A Survey on Session-based Recommender Systems。這篇文章是基于會話的推薦系統方向的一篇較為系統全面的綜述文章。全文共39頁,包含11個sections,4幅插圖,11張表格和163篇該領域内有代表性的參考文獻。該文基于作者長期的積累和思考,對基于會話推薦系統這一推薦系統子領域進行了全面而深入的梳理和總結。該文對目前文獻中存在的各種各樣的對問題的定義進行了統一的形式化,系統地定義了基于會話推薦系統的場景,任務和基本問題以及基本方法。
作者從資料特征的角度出發,系統分析了session資料所特有的基本特征,以及他們給推薦任務帶來的挑戰。然後系統而全面地對這一領域目前的進展進行了歸納總結,包括對方法的分類和比較,對每類方法基本思想和特征的闡述。梳理和總結了基于會話推薦系統的主要應用場景,代表性算法和公開的資料集,并提供了開源連結。最後分享了本領域的未來可能的研究方向。該文由淺入深,語言力求通俗易懂,舉例豐富,既有深入的理論分析,又有應用,算法和資料集,既适合科研工作者閱讀,也适合工程人員閱讀。作者希望該文能給相關的研究人員提供一個對該領域研究的主要問題以及涉及的各個方面,主要挑戰和進展一個全面而綜合的了解,同時給未來的研究提供一些啟發。
論文預印版連結:
https://www.researchgate.net/profile/Shoujin-Wang/research
https://arxiv.org/abs/1902.04864
相關綜述文章:
[1] Shoujin Wang, Liang Hu, Yan Wang, Xiangnan He, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao, Francesco Ricci, Philip S. Yu. Graph Learning based Recommender Systems: A Review. In Proceedings of the 30th International Joint Conference on Artificial Intelligence (IJCAI 2021 Survey Track), 1-9, 2021. Preprint version: https://www.researchgate.net/profile/Shoujin-Wang
[2] Shoujin Wang, Liang Hu, Yan Wang, Longbing Cao, Quan Z. Sheng, Mehmet A. Orgun. Sequential Recommender Systems: Challenges, Progress and Prospects. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019 Survey Track), 6332-6338, 2019. Preprint version: https://www.researchgate.net/profile/Shoujin-Wang
[3] Honglei Zhang et al. Must-read Papers on Recommender System.
https://github.com/hongleizhang/RSPapers
公衆号背景回複【綜述】擷取28篇推薦系統綜述合集
二. 論文簡要介紹
0. 摘要
在當今的資訊過載和數字經濟時代,推薦系統在消費,服務和決策制定等方面正發揮着日益重要的作用。近些年來,基于會話的推薦系統(session-based recommender systems (SBRSs)) ,作為推薦系統的一種新的範式,正在興起。不同于其他傳統的推薦系統,如基于内容的推薦系統和協同過濾推薦系統,通常模組化使用者的長期和靜态的偏好,基于會話的推薦系統旨在捕獲使用者短期和動态的偏好來給使用者提供更實時和精準的推薦服務。這些推薦服務能對使用者不斷發展和變化的會話上下文場景具有較好的敏感性。
盡管基于會話的推薦系統已經被廣泛研究,目前既沒有對基于會話的推薦系統的一個統一的問題定義和陳述,也沒有對基于會話的推薦系統的特征和挑戰的一個深入闡述。通常,人們并不太清楚基于會話的推薦系統的挑戰被解決到什麼程度了,以及這一領域的總體研究概況是什麼樣的。這篇全面綜述通過深入探索和讨論基于會話的推薦系統所涉及的主體(比如會話), 行為(比如使用者對物品的點選), 以及他們的特性(比如會話的長度)來解決上述問題。我們提出了一個通用的基于會話的推薦系統的問題陳述,概括和總結了這一領域多樣化的資料特征和挑戰,并且定義了一個分類方法來對該領域内代表性的研究進行分類。我們讨論了基于會話的推薦系統在現實場景中的主要應用領域,整理了典型的算法和常用的資料集。最後我們讨論了在這個充滿活力的研究領域内的新的研究機會。
1. 引言
推薦系統已經發展成為人們進行快速有效選擇和決策的一個基本工具。它已經滲透到我們日常生活的方方面面,包括生活,工作,學習,娛樂,社交和商業營運。推薦系統的作用在數字經濟中和資訊日益過載的時代顯得尤為重要,因為使用者通常需要從大量的和快速增長的内容、産品和服務(統稱為物品 (item))中選擇他們所需要的。是以,各種各樣的推薦系統研究領域興起了并取得了成功,比如基于内容的推薦系統,協同過濾推薦系統和混合型推薦系統。
然而,這些推薦系統傾向于利用所有的使用者與物品之間的互動資訊來學習每個使用者對物品的長期和靜态的偏好。這種做法通常是建立在一個隐含的假設之上的,那就是一個使用者的所有的曆史互動行為對他目前的偏好是同等重要的。這可能與現實不相符合,主要原因有兩點:首先,一個使用者對物品的選擇不僅依賴于他長期以來形成的偏好,而且依賴于他短期的最近的偏好和跟時間相關的上下文場景(比如他最近浏覽或者購買過的物品)。這種短期偏好通常隐含在使用者的最近發生的與物品的互動行為之中,而這類最近的互動行為通常僅占使用者所有互動行為的很小一部分。其次,一個使用者對物品的偏好通常是動态變化而非靜止的,它會随着時間的推移而演變。
近些年來,為了彌補上述不足,基于會話的推薦系統(session-based recommender systems (SBRSs))悄然興起,并引起了越來越多的關注。不同于上述推薦系統,基于會話的推薦系統從使用者在交易過程中産生的會話(session)資料來挖掘和學習使用者的偏好。每一個會話包含在一段連續的時間段内發生的多個“使用者--物品互動行為”,比如某使用者在一次交易會話 (比如從登入電商平台的賬号到退出賬号這段時間)中購買了一籃子物品。通過将每一個會話作為最基本的輸入資料單元,一個基于會話的推薦系統能夠從一個使用者的最近産生的會話中捕獲他的短期偏好,以及從一個會話到另一個會話之間的偏好的變化,進而進行更精準和實時的推薦。在本文中,我們用基于會話的推薦系統來指代那些所有以session資料為中心來推薦目前會話裡的下一個物品,接下來的所有物品以及下一個會話裡的所有物品的推薦系統。這個定義包括了有些文獻中的一些狹義的基于會話的推薦系統,它們隻推薦目前會話裡的下一個物品。
對于基于會話的推薦系統,文獻中存在各種各樣不同的工作。這些工作通常用不同的詞語來描述,建立在不同的場景設定和假設之上,針對不同的應用領域。比如,Hidasi et al. 在匿名會話資料上建立了一個基于會話的推薦系統。他們通過假設會話内部的互動行為之間存在嚴格的先後順序來預測使用者接下來想要點選的物品或者想看的電影。Hu et al. 則在非匿名會話資料上建立了另一個基于會話的推薦系統來推薦使用者下一個可能想購買的物品,他們沒有假設會話内部存在嚴格的順序。Jing et al. 則基于非匿名會話資料設計了一個基于會話的推薦系統來推薦使用者想要聽的下一首歌或者想看的下一部電影,他們假設會話内部存在順序。
雖然基于會話的推薦系統廣泛存在于各個領域并且很多相關的研究都已經開展了,但是在這個領域還存在很多的由不同的描述,假設,場景設定和應用領域導緻的不一緻性。而且,沒有一個統一的架構可以對現有的工作進行分類,對于基于會話的推薦系統也還沒有統一的問題陳述。更重要的是,沒有人對基于會話的推薦系統的特征(包括問題和資料方面的), 挑戰和研究進展進行系統的讨論,也沒有人對代表性的和最先進的方法進行系統的分類。這些缺陷限制了基于會話的推薦系統的理論發展和實際應用。為了彌補上面提到的不同方面的缺陷,本文對基于會話的推薦系統提供了一個綜合而系統性的概覽和綜述。
本文的主要貢獻如下:
• 我們提供了一個統一的架構來對基于會話的推薦系統的相關工作進行分類,進而有效的緩解了這一領域内的不一緻性。
• 我們首次為基于會話的推薦系統提出了一個統一的問題陳述,在該陳述中,一個基于會話的推薦系統是建立在以下幾個正式的概念之上的:使用者,物品,動作,互動和會話。
• 我們對會話資料的基本特征以及它給基于會話的推薦系統帶來的挑戰提供了一個綜合的概覽。據我們所知,這是該領域内的第一次這樣的描述。
• 我們對基于會話的推薦系統的各類方法進行了系統的分類和比較,進而可以看出該領域的各個挑戰被解決到什麼程度了,以及該領域目前的進展如何。
• 我們對每一類方法簡單介紹了主要的技術細節,進而給讀者對基于會話的推薦系統的目前進展提供一個深入的了解。
• 我們分析和讨論了基于會話的推薦系統的主要的實際應用領域和場景, 收集和整理了典型算法的開源代碼和常用的公開資料集。
• 最後,我們讨論了和分享了基于會話的推薦系統的一些開放的研究問題和可能的研究方向。
2. 相關工作
文獻中存在各種不同的既關于基于會話的推薦系統,也關于序列推薦系統的研究。序列推薦系統是與基于會話的推薦系統緊密相關但不同的領域。即使在基于會話的推薦系統中也存在很多不同的子領域,比如下一個物品推薦,下一個購物籃推薦等。是以,很多用不同詞語描述的不同的工作混雜在一塊,導緻整個領域内沒有一個統一和一緻的描述,很容易讓人混淆。在這一節,我們首先澄清基于會話的推薦系統和序列推薦系統的概念以及他們之間的差異,然後提出一個整體架構來統一組織基于會話的推薦系統内的各種不同研究,最後我們闡述這篇綜述跟已有的相關綜述之間的差異。
2.1 基于會話的推薦系統vs. 序列推薦系統

2.2 統一組織基于會話的推薦系統相關工作的架構
根據推薦任務的不同,基于會話的推薦系統可以劃分為對目前會話内下一個互動行為(通常是下一個物品)的推薦,對目前會話内剩餘所有互動行為的推薦和對下一個會話的推薦。

2.3 相關的綜述(詳見原文)
3. 基于會話的推薦系統問題陳述
一個推薦系統可以看作一個系統,它包含多個基本主體:使用者,物品,他們間的互動行為。這些基本的主體和行為構成會話的基本組成部分,而會話是基于會話的推薦系統的核心主體。是以我們首先介紹這些主體和行為的定義及屬性,然後在他們基礎之上定義基于會話的推薦系統的研究問題。這些定義和屬性将進一步用來對基于會話的推薦系統進行刻畫和分類。
3.1 使用者以及使用者的屬性
3.2 物品以及物品的屬性
3.3 行為以及行為的屬性
3.4 會話以及會話的屬性
3.5 基于會話的推薦系統的研究問題陳述
4. 特征和挑戰
基于會話的推薦系統建立在會話資料之上,不同類型的會話資料通常具有不同的特征,這些特征本質上給基于會話的推薦系統帶來了不同的挑戰。本節我們首先描述根據會話(session)的屬性所劃分的不同類型的會話資料,然後讨論每一類會話資料的特征和挑戰。
4.1 與會話長度相關的特征和挑戰
4.2 與會話内部順序相關的特征和挑戰
4.3 與行為類型相關的特征和挑戰
4.4 與使用者資訊相關的特征和挑戰
4.5 與會話資料結構相關的特征和挑戰
5. 基于會話推薦系統方法的分類和比較
5.1 基于會話推薦系統方法的分類
根據采用的技術,基于會話推薦系統方法可以分為3大類:傳統方法,基于嵌入表征學習的方法,和基于神經網絡的方法。這3大類又可以進一步分為8類。
5.2 不同類方法之間的比較
6. 傳統的基于會話推薦系統方法
傳統方法采用傳統的資料挖掘或者機器學習技術來挖掘會話資料内部的相關性,進而進行會話推薦。傳統方法主要包含4類:
6.1 基于模式/規則挖掘的方法
6.2 基于最近鄰模型的方法
6.3 基于馬爾科夫鍊的方法
6.4 基于生成式機率模型的方法
6.5 傳統方法之間的比較
7. 基于嵌入表征學習 (latent representation) 的方法
7.1 基于潛在因子 (latent factor) 模型的方法
7.2 基于分布式表征 (distributed representation) 的方法
7.3 基于嵌入表征學習的方法間的比較
8. 基于深度神經網絡的方法
8.1 基于基本的深度神經的方法
8.1.1 基于RNN的方法
8.1.2 基于MLP的方法
8.1.3 基于CNN的方法
8.1.4 基于GNN的方法
8.2 基于進階模型的方法
8.2.1 基于注意力模型的方法
8.2.2 基于記憶網絡的方法
8.2.3 基于混合專家模型的方法
8.2.4 基于生成模型的方法
8.2.5 基于強化學習的方法
8.3 基于深度神經網絡的方法間的比較
9. 基于會話推薦系統的應用,算法和資料集
9.1 基于會話推薦系統的應用
基于會話推薦系統已經被廣泛應用于現實世界的各個領域和場景當中,來使客戶和企業獲利。下表總結了這些傳統的和新興的應用領域。
9.2 開源算法和公開資料集
9.2.1 開源算法整理
9.2.2 公開資料集整理
10. 展望和未來的研究方向
10.1 考慮一般使用者偏好的基于會話推薦系統
10.2 考慮更多場景及上下文影響因素的基于會話推薦系統
10.3 考慮跨域資訊的基于會話推薦系統
10.4 考慮更多使用者行為模式的基于會話推薦系統
10.5 考慮限制條件的基于會話推薦系統
10.6 互動式的基于會話推薦系統
10.7 線上或者流式的基于會話推薦系統
11. 結論
在本文中,我們對目前的基于會話的推薦系統的最具代表性的工作進行了系統而廣泛的調研。我們提出了一個統一的架構來把這個領域内各種各樣的工作歸結為3大類,同時我們提出了一個統一的問題陳述來消除該領域記憶體在的各種不一緻性,以減少讀者的疑惑。我們透徹地分析了會話資料的獨有特征以及他們給基于會話的推薦系統所帶來的挑戰。我們提出了一個分類機制來對現有的基于會話的推薦系統的方法進行分類,闡述了每一類方法的核心思想和一些關鍵的技術細節。此外我們讨論了基于會話的推薦系統的實際應用領域和場景,收集和整理了一些典型的算法和資料集。最後我們讨論了該領域一些可能的研究方向。關于基于會話的推薦系統的研究正方興未艾,大量的新技術和新方法正在不斷湧現出來。我們希望這篇綜述能給讀者在關于這個領域的主要問題,關鍵挑戰,最新進展以及主要方法和應用等方面帶來一個綜合而全面的了解。
部分參考文獻
- Shoujin Wang, Longbing Cao, Yan Wang, Quan Z. Sheng, Mehmet A. Orgun, Defu Lian. A Survey on Session-based Recommender Systems. ACM Computing Surveys (CSUR 2021), 1-39, (accepted).
- Shoujin Wang, Liang Hu, Yan Wang, Xiangnan He, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao, Francesco Ricci, Philip S. Yu. Graph Learning based Recommender Systems: A Review. In Proceedings of the 30th International Joint Conference on Artificial Intelligence (IJCAI 2021 Survey Track), 1-9, 2021.
- Shoujin Wang, Liang Hu, Yan Wang, Longbing Cao, Quan Z. Sheng, Mehmet A. Orgun. Sequential Recommender Systems: Challenges, Progress and Prospects. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019 Survey Track), 6332-6338, 2019.
- Shoujin Wang, Liang Hu, Yan Wang, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao. Modeling Multi-Purpose Sessions for Next-Item Recommendations via Mixture-Channel Purpose Routing Networks. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019), 6332-6338, 2019.
- Shoujin Wang, Liang Hu, Longbing Cao, Xiaoshui Huang, Defu Lian, Wei Liu. Attention-based Transactional Context Embedding for Next-item Recommendation. In Proceedings of the 32nd AAAI Conference on Artificial Intelligence (AAAI 2018), 2532-2539, 2018.
- Shoujin Wang, Liang Hu, Longbing Cao. Perceiving the Next Choice with Comprehensive Transaction Embeddings for Online Recommendation. In Proceedings of the 28th Joint European Conference on Machine Learning and Knowledge Discovery in Databases (ECML-PKDD 2017), 285-302, 2017.
- Shoujin Wang, Liang Hu, Yan Wang, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao. Intention Nets: Psychology-inspired User Choice Behavior Modeling for Next-basket Prediction. In Proceedings of the 34th AAAI Conference on Artificial Intelligence (AAAI 2020).
- Liang Hu, Longbing Cao, Shoujin Wang, et al. Diversifying Personalized Recommendation with User-session Context. In Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI 2017), 1858-1864, 2017.
更多論文歡迎star論文倉庫:
https://github.com/hongleizhang/RSPapers