天天看點

《中國人工智能學會通訊》——9.27 針對垂直搜尋結果的點選模型

随着 Web2.0 時代的快速發展,搜尋引擎頁面正在變得越來越異質化,大量包含富文本資訊的搜尋結果被引入搜尋頁面。這些搜尋結果來自于搜尋引擎的多個具有特定搜尋目标的子引擎,通常稱為垂直搜尋引擎。這些來自垂直搜尋引擎的垂直搜尋結果(例如圖檔搜尋引擎得到的圖檔結果)往往與傳統的結果具有不同展現形式,是以現今搜尋頁面上的搜尋結果正在變得非常異質化,這也使得使用者浏覽行為習慣和偏好可能産生比較大的變化。

Wang et al [11] 對一家中文商業搜尋引擎的大規模搜尋日志進行了分析(詳細分析結果請見下一小節),發現目前中文搜尋環境下超過 80% 的搜尋結果頁面包含有垂直結果,并且不同展現形式的垂直結果對使用者的行為産生了很大影響,包括對于垂直結果本身(局部影響)和對整個搜尋頁面(全局影響)。是以,對于現今的搜尋引擎來說,考慮不同垂直結果是非常重要的因素。

他們根據中文搜尋引擎常見的搜尋結果(如圖5 所示),結果根據展現形式進行了下述分類。

(1)普通結果:非垂直結果,最常見的搜尋結果展現形式,由一條超連結标題和一段文本摘要組成。

(2)文本類垂直結果:由一段文本摘要和多條超連結标題組成,例如新聞類或者百科類搜尋結果。

(3)多媒體類垂直結果:主要由一組多媒體元件(通常為一組圖檔)組成,例如視訊、圖檔類搜尋結果。

(4)應用類垂直結果:由嵌入搜尋頁面的一組元件組成,使用者可以通過與元件互動直接得到搜尋結果,例如計算匯率兌換的電腦。

《中國人工智能學會通訊》——9.27 針對垂直搜尋結果的點選模型

FCM 模型

Chen et al [16] 最早提出了針對垂直結果的點選模型,他們分析了部分垂直結果對使用者點選的影響,提出了 Federated Click Model (FCM) 模型,該模型假設使用者的檢驗機率可能會受到最近的上一個垂直結果的影響(吸引假設):

P(A = 1) = hpos rvert

P(E i = 1 | A = 0) =ϕ i

P(E i = 1 | A = 1) =ϕ i +(1-ϕ i )β dist

式中 A 表示使用者是否被垂直結果所吸引,如果使用者被垂直結果吸引 A = 1,那麼該使用者的檢驗其他普通結果的機率會收到一定的影響。

VCM 模型

Wang et al [11] 利用眼動追蹤裝置對使用者的搜尋浏覽行為進行了深入分析,他們發現不同展現類型的垂直結果對使用者的視線注視行為有很大影響。如圖 6 所示,左側為不含垂直結果的頁面,右側為包含多媒體垂直結果的頁面,熱度圖越暖色表示使用者的視覺注視越多。可以看到,當多媒體垂直結果加入頁面後,使用者的視線被很大程度吸引,進而不再像左圖一樣的自上而下的遞減分布。

《中國人工智能學會通訊》——9.27 針對垂直搜尋結果的點選模型

Wang et al [11] 針對使用者的浏覽行為變化進行了深入的分析,最終總結了 4 個使用者行為偏執假設。

(1)吸引力偏執假設:如果有一個垂直結果在搜尋結果頁面中出現,那麼使用者有一定的機率首先檢驗該垂直結果。

(2)全局影響偏執假設:如果有一個垂直結果在搜尋結果頁面中出現,并且使用者首先檢驗了該垂直結果,那麼使用者會對整個頁面有一個全局印象,該印象會使使用者對普通搜尋結果的檢驗和點選偏好産生影響。

(3)首位偏執影響假設:如果有一個垂直結果在搜尋結果頁面中出現,并且該垂直結果被排在了第 1 位,那麼使用者就可能會更多地點選該垂直結果而較少點選其他結果。

(4)浏覽順序偏執影響假設:如果有一個垂直結果在搜尋結果頁面中出現,并且使用者首先檢驗了該垂直結果,那麼使用者會在接下來回看垂直結果之前的搜尋結果,回看的路徑或者為回到頂端自上而下浏覽,或者為沿着自下而上的順序反序浏覽。相應的點選模型描述為

P(C i =1|E i =0)=0

P(C i =1|E i =1)=P(A i =1|E i =1)

P(F=1)=ϕ t v ,l vP(E i =1|F=0,C 1:i-1 )=γ i,i-l i

P(E i =1|F=1,C 1:i-1 )=γ i,i-l i +θ q,iP(A i =1|E i =1,F=0)=α q,i

P(A i =1|E i =1,F=1)=α q,i +β q,i

P(B=1|F=0)=0

P(B=1|F=1)=σ t v ,l v

其描述的使用者浏覽行為決策過程可以用圖 7 表示。使用者在開始浏覽時,他會有一定的幾率決定是否首先去檢驗垂直結果,如果檢驗了垂直結果,那麼使用者會繼續約定是否回到頁面頂端自上而下浏覽,亦或是自下而上反序浏覽。

《中國人工智能學會通訊》——9.27 針對垂直搜尋結果的點選模型

繼續閱讀