天天看點

《推薦系統:技術、評估及高效算法》一1.6 推薦系統與人機互動

本節書摘來自華章出版社《推薦系統:技術、評估及高效算法》一書中的第1章,第1.6節,作者 [ 美]弗朗西斯科·裡奇(francesco ricci)利奧·羅卡奇(lior rokach)布拉哈·夏皮拉(bracha shapira)保羅 b.坎特(paul b.kantor),更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

正如前面闡明的那樣,研究人員主要關注一系列技術解決方案的設計,以及利用各種知識庫更好地預測目标使用者喜歡什麼和喜歡的程度。這種研究活動背後的基本假設是僅能展示正确的推薦(也就是最好的選項)就足夠了。換句話說,系統給使用者推薦,如果是正确的,使用者應該明确地接受推薦。很明顯,這極度簡化了推薦問題,其實把推薦結果傳遞給使用者并不簡單。

實際上,因為使用者沒有足夠的知識庫做明确的決定,是以才需要推薦。讓使用者評價系統提供推薦并不是件容易的事情。是以,很多研究人員試圖了解讓指定使用者接受推薦結果的因素[105,30,24,97,33]。

其中[105]第一個指出推薦系統的有效性依賴于很多因素,而不僅僅是預

測算法的品質。實際上,推薦系統必須說服使用者去嘗試(或聽、購買、閱讀、看)所推薦的物品。當然,這取決于被選擇物品的個體特征,也取決于推薦算法。當物品被推薦、比較、解釋(解釋為什麼被推薦)的時候,該過程也取決于系統支援的特定的人機互動。[105]發現,從使用者角度來看,一個有效的推薦系統必須能激發使用者對系統的信任;它必須有一個顯而易見的系統邏輯(個人了解為系統不能有邏輯錯誤);它必須指引使用者面向新的、使用者不熟悉的物品;它必須提供推薦物品的詳細資訊,包括圖檔和社群評分;最終,[105]提供改進推薦的方法。

[105]和其他相似方向的研究者并沒有忽略推薦算法的重要性,但是他們聲稱推薦算法的有效性不能僅根據預測結果的準确性(即用标準且流行的ir名額,如mae、準确度或ndcg)來衡量(見8.5節,第9章)。他們認為涉及使用者接受推薦系統以及其推薦結果的其他角度也應該被測量。這些想法在

[33]中也被明确地提出并讨論。在這項工作中,作者提出評價推薦系統要以使用者為中心,包括推薦清單的相似度,推薦系統有意外新發現的能力,以及推薦系統中使用者需求和期望的重要性。

讨論過[105]提出的觀點之後,我們介紹由人機互動研究引出的幾個重要觀點,我們将在本書中進一步研究人機互動。

首先讨論信任。本書讨論了關于信任的兩種不同概念:對推薦系統其他使用者的信任和對推薦系統本身的信任。

第20章集中讨論了第一種觀念,并分析了一類叫作“社會化推薦系統”的推薦系統。這些系統試圖從使用者資料和使用者關系中推導出更有用的推薦,這些資料和關系在目前幾乎随處可見,如在facebook、linkedln和myspace等社交網站中。由于基于信任的推薦系統主要利用它們在社交網站發現的信任關系來構造新的推薦算法(如[34]),是以它們在核心評分預測問題上隻能使用信任關系。這類系統的主要優勢是使用者可以知道推薦系統的本質是什麼,如這些推薦結果是如何确定的,這樣使用者便會更加信任這些推薦結果。換句話說,我們可以利用使用者之間的互相信任來提高使用者對推薦系統的信任度。

對推薦系統産生的推薦結果的信任在第15章讨論。該章主要介紹了解釋推薦的作用,還介紹了信任是推薦解釋在推薦系統扮演的七大作用之一。這七大作用是:透明度,即說明系統是如何工作的;可回報性,即允許使用者告訴系統有錯誤[50];信任,即增加使用者對系統的信心;有效性,即幫助使用者做出好的決定;說服力,即說服使用者去嘗試或購買;高效性,即幫助使用者快速抉擇;滿意度,即增加使用者舒适度或樂趣。

該章也闡述了一系列構造解釋的方法。如協同過濾方法,其解釋的形式是“跟你相似的使用者喜歡這個物品”。在基于内容的風格解釋中,系統會根據最能代表物品的特征屬性把物品推薦給使用者。例如,電影推薦系統中,一種推薦形式有可能是“這部電影被推薦是因為你可能喜歡bruce wills這個明星”,或者“物品x被推薦是因為你對物品y和z評價很高,而y、z和x有共同的屬性a和b”。用基于案例的解釋,系統會引用與推薦物品相似的物品,例如,“這個物品被推薦是因為你說自己擁有物品x”或者“這些物品的推薦是基于你最近浏覽的物品”。最後,用基于知識庫的風格解釋,系統會解釋推薦物品和另一個物品的差異,并且會說推薦物品是如何符合使用者目标的:“這個房間面朝大海,并且比之前推薦的房間大,這将更加浪漫,如你所願。”

回到信任的話題上來,我們把它視為實作推薦系統主要目标,即說服使用者接受推薦結果并且嘗試推薦的物品。這個問題最終與整個推薦系統的說服力有關,即推薦系統的各個因素,包括推薦什麼,如何推薦,在人機互動過程中實際是如何運作的。這個話題将在第14章有所讨論。在這裡,作者強調說推薦系統應該值得信賴并且經常被人們想到。當人們想到使用推薦系統時,不僅僅是因為他們知道它能産生推薦結果,而且是把它當作一個建議給予者。實際上,關于說服力的文獻資料表明人們容易接受來自可靠消息的推薦,是以我們得到結論:推薦系統的可靠性對于增加使用者接受推薦結果的可能性是至關重要的。是以,作者讨論了推薦系統的可信度是如何提高的,并且提供了有關信任度研究的概要。

推薦系統算法的另一個嚴格限制是這些算法被設計為一次性收集輸入資料,而且一旦傳回推薦結果便結束整個過程。在很多情況下,這種模型會失效,因為使用者還不能完全意識到自己的喜好,除非他們與系統進行一定程度互動并且大緻了解選擇的範圍。或者在确信一些可能适合自己的推薦之前會浏覽更多的可選擇的選項。這也可能意味着系統一開始的推薦就是錯誤的,但使用者可能願意提供額外的資訊用于修複這些問題,最終得到一些好的推薦。

這些問題已經得到了緻力于“會話式推薦系統”[27,110,67,60]的研究人員的重視并解決。會話式推薦系統為預測評分或排序使用了各種技術。然而,這些技術都在試圖提供互動過程,該過程中,使用者和系統能彼此查詢或提供資訊。最具決定性的問題是如何設計這個會話(也就是會話政策),以及如何設計使用者和系統在互動的各個階段必須執行的動作。提供的會話必須有效,即當使用者終止會話時應該得到解決方案(如預訂機票),而且速度要快(會話步驟較少)。在本手冊中,有兩章處理這一重要話題。

第13章提供了基于評價的推薦系統的研究綜述。給定一個關于使用者偏好資訊的初始集(例如,一些物品特征的優選值),基于評價的界面或者會話模型能夠展示給使用者推薦的物品以及支援使用者表述“評價”,例如,“給我展示更多像a的物品,但是比a更便宜”。

基于評價的系統已經在一些領域中得到了很大的關注,在這些領域中,我們需要一個更加複雜且具有互動性的決策/推薦支援系統,如旅遊領域[88,32,100]或者計算機系統領域[82,83]。基于評價的系統最初的設計是用于有效地解決使用者偏好提取問題的,但是現在已經對其他目的或應用變得非常重要,例如,小組推薦、初始混合推薦、使用者自适應互動接口、解釋推薦、移動推薦。

另一種與會話系統有關的方法是基于偏好的[67]。基于偏好和基于互動的方法相似,因為他們都是在之前就給使用者一些推薦,這些推薦也許不會是最好的,但是總有一部分的物品能引起使用者的興趣。這種額外的資訊能幫助提高系統表現使用者偏好(使用者模型)的能力,進而能使系統産生新的且更好的推薦。

第16章闡述了這些新穎的方法和系統,集中講了這種基于偏好推薦系統的使用者,即系統互動的三個方面:初始偏好提取;偏好修正;推出推薦結果。本章的内容可以作為來源于一些系統的可用性指南的集合,這些指南可被廣泛和大規模應用。而且,為了選擇指導準則,作者不僅關注準确性這一個名額,還考慮到這樣的一個事實:人類的認知資源有限,是以如果需要我們付出過多的努力,将不大可能會得到高準确度的結果。他們選擇的方法能産生準确度很高的推薦結果,同時要求的努力程度是我們願意接受的。

之前提到的方法(基于互動的和基于偏好的)已經主要應用于基于案例的推理系統[22],這類系統的檢索部分是依賴相似性度量的。在這種情況下,由于在一定程度上,産品總是跟一個可探測(查詢)結果類似,是以一條查詢可以檢索出目錄下的所有産品,并對這些産品進行排序。如果查詢語言支援其他限制條件(例如,等同限制或排序限制),查詢傳回的結果可能不會令人滿意[47,71,31]。針對這種情況,研究人員提出了許多技術,這些技術通過放寬限制的最小數量來修複這種查詢問題,其目的是使傳回的查詢結果令人滿意。這個課題也在專講基于限制(第6章)的推薦系統中有所讨論。

目前,我們重點強調了人機互動問題,而這些問題已經在推薦系統的研究中得以解決,本手冊也對此進行了讨論。總之,我們認為系統如何展示并且可視化計算得到的推薦結果是影響使用者接受推薦結果和該推薦系統的關鍵因素。

推送(将推薦推到使用者那裡)和解釋技術是不可分的:一個好的推送技術也要有解釋推薦的能力,也要誘導使用者提出進一步請求,包括對解釋推薦的請求。目前已有的這些技術有一個共同點,就是推薦結果按照物品清單的方式顯示。推薦清單長度是可變的,但是核心推薦算法的輸出通常是個排序清單,該清單在最終展示推薦結果時會用到。

本書單設一章闡明一種有别于傳統模式的推送方法。在第17章,作者注意到在排序清單這種可視化方法中丢失了大部分資訊。這裡的原因是:對于兩個産品,即使它們都與使用者請求或者使用者模型相比對,但如果是基于完全不同的産品特征集,也是有差別的。如果用一個二維的基于圖的可視化推薦,還可能保留部分資訊。在圖中,我們可以在一個受限的範圍内為各個相似推薦安排位置。該章提出了建立二維圖推薦的兩種方法,并且讨論了各自的優缺點。

繼續閱讀