
作者|王衛(泓冰)
出品|阿裡巴巴新零售淘系技術部
01、淘寶社交關系推薦的背景
1、網際網路下半場到來:網際網路的下半場,人口紅利消失,各大平台需要對使用者做精細化營運,使用者的增長和留存是每一個平台需要深耕的方向;
2、社交電商的興起和趨勢:社交電商的有效性和價值,已經在拼多多、小紅書、雲集和環球捕手等諸多平台有了成功已經驗證;
3、社交的裂變效應:做社交關系可以帶來裂變效應,有效的促進使用者的留存和互動,增加使用者對 app 的粘性;
4、關系積累是使用者互動基礎,社交關系和互動的重點是使用者關系量的積累,也是目前我們的核心目标
02、淘寶社交關系增長面臨的挑戰
為什麼淘寶很難做社交,主要有以下幾個原因:
1、首先是外部環境的限制:因為某些原因,手淘在微信互通上不那麼順暢,使用者習慣在社交平台上溝通,并且保持真實關系在社交平台上,沒有遷移社交關系到淘内的動力。
2、 使用者購物的隐私性 :淘寶原生的電商購物環境,使用者在這個平台的心智就是逛和買,在萬能的淘寶上消費自己的喜好。獨自購物的心态、購物的隐私屬性等,使得使用者難以與他人分享,是以使用者很難與他人在購物期間達成關系;
3、 淘寶賬号的隐匿性 :淘寶的賬号雖然可以有個性的昵稱和頭像,但是由于對真實姓名和真實社交關系的脫離,使用者在淘寶上很難識别出自己真實的好友,尤其是願意分享和互動的好友;
4、 淘寶平台産品設計 :淘寶為電商建構的平台,但是用阿裡建構平台的思維打造的使用者社交關系相關産品的入口比較深,使用者在淘寶關系的感覺和體驗上沒有很強的心智;
03、為什麼要做淘寶社交關系推薦
3.1、淘寶使用者關系的目标
淘寶使用者關系的目标是使用者關系達成與互動,使用者關系量是建構互動和社交電商的基礎,根據 AARRR 模型,使用者的擷取成本高的,激活成本低,是以我們首先選擇使用者關系量積累做為重點。
3.2、電商使用者關系的資料模型
淘寶使用者之間的關系是隐性的,首先在淘寶的社群關系中,使用者之間有匿名的屏障,面對多元的購物社交關系,使用者在大量的關系目标使用者中無法找到好友對象,是以必須依賴資料和算法為使用者高效的推送目标使用者,本質上跟内容的推薦一樣,是解決使用者資訊過載和目标缺失的問題。
3.3、淘寶關系的增量來源
在淘寶使用者關系的實踐中,有三種方式可以有效的達成好友關系:
第一種是 親情關系 ,通過春節的親情号活動有效的拉動親情關系的達成;
第二種是 購物和互動場景 下(分享、幫買、代付、代充、遊戲)的場景化的使用者關系達成的情境;
第三種是 關系推薦 ,基于現有的關系達成管道場,通過精準的使用者畫像分析,準确的推薦目标使用者,讓線下關系線上上更快速有效的達成。
對從關系品質和達成效率比三種關系增長方式:
通過上述對比可以得知,做關系推薦拉動的關系使用者增長較快,增長空間較大,投入産出比更高。
04、關系推薦的初期嘗試
在業務團隊成立初期,對基礎的淘友關系鍊路的服務和體驗做了統一,提升接入效能和産品體驗。淘友接入的業務方快速增長,覆寫了手淘、貓客、淘小鋪多個用戶端。
但是新的業務接入方帶來的關系增長并沒有那麼多,業務管道的擴充到達一定瓶頸之後,各個接入管道的推薦好友點效果亟待提高,主要從推薦頁面的點曝比和管道達成量來衡量收益。
4.1、離線關系推薦-通訊錄可能認識的人改造
手淘通訊錄子產品,有基于離線推薦的可能認識的人子產品,通過觸發小紅點引導使用者進入手淘通訊錄。
在産品初期是通過離線任務灌入 tair 的方式,通過使用者通路命中緩存,每天向所有使用者推送離線計算的推薦人清單,此方式資料量和計算量龐大,而且效率不高。
後期經過改造,首先建構了一套真實的線下關系的非好友的資料,算法聚合了通訊錄、代付、幫買、代充、親情、同僚、 LBS 等次元的淘寶使用者資料,其次通過 OneService 、 IGraph 封裝為實時服務,通過 T+1 跟 T+2 的資料做差量計算,推送動态差量計算的人觸發小紅點, T+1 的推薦清單資料做為實時服務的輸出,支撐每天登入手淘使用者的過億 UV 的通路量,通訊錄小紅點的架構圖如下:
由于手淘首頁的調用是直接透穿消息盒子的,調用到小紅點差量計算日常 5W 的 qps ,每天每人一次的差量計算需要選擇淩晨的全量流量最低的時刻,使得每天資料差量計算的峰值保持在 5Kqps 以下。
4.2、實時關系推薦-分享、代付、幫買
在離線關系的嘗試之後,我們發現可能認識的人這種沒有場景的好友推薦入口,使用者添加的動力不是很強。即使讓使用者看到更多的推薦資料,使用者的添加好友的意願不是很強烈,可能認識的人點曝比極低。
使用者添加好友希望是即時的,并且是基于某個場景的,是以我們将分享、分享回流、代付、幫買等場景的實時消息,轉化為實時推薦的好友推薦,即時觸達使用者好友添加入口,希望通過捕捉特定場景下的實時行為,為使用者發起好友邀請增加信心,于是實時推薦的可擴充性架構設計如下:
通過實時的推薦,将互動的使用者直接觸達好友邀請清單,如下圖:
實時推薦上線之後,關系達成率明顯高于大盤的達成率,但是挖掘了分享、分享回流、代付、幫買、通訊錄變更等場景之後,可挖掘的實時推薦場景就沒有多少了。
05、金币莊園推薦算法的優化與推薦系統的建構
在實時推薦場景減少之後,我們抓住社交關系增量占比最大的金币莊園管道,做進一步的場景推薦算法優化,在金币莊園管道的一系列優化實踐中,我們總結出一套淘寶社交關系推薦服務!
▐ 金币莊園推薦的算法調優
金币莊園的好友推薦資料,是我們基于真實線下關系計算而來的資料,為了避免隐私侵犯,對推薦理由做了一些隐藏和弱化,但是好友邀請清單點曝比一直在 3% 以下。
5.1、社交關系的三元閉包理論優化
關于社交關系的推薦政策,首先要提的是三元閉包理論,三元閉包定義:在一個社交圈内,如果兩使用者有一個共同好友,那麼這兩個使用者在未來成為好友的可能性就會提高。
淘寶好友關系的三元閉包路徑,來自于之前積累的 CC 淘友關系,從中找到擁有的共同好友的推薦使用者,将共同好友的使用者通過權重排序置頂,在優化之後,金币莊園的日關系添加量增加 20% 。
5.2、金币莊園互動行為增強
推薦系統設計的協同過濾算法,都講究按照共同偏好計算。在共同好友的推薦理由增強之後,我們對莊園使用者的互動行為資料進行了挖掘,并且跟我們的基礎推薦資料融合,再做權重排序,對有玩金币莊園的偏好的、有金币莊園互動的人進行置頂。上線之後 AB 測試可以看到金币莊園日關系添加量提升 23% ,點曝比相比之前提升 60% 以上
5.3、推薦理由強化
為了增強推薦理由的信任感,在互動視覺上會增加強化,輸出多個推薦理由。推薦理由強化之後,獲得的關系添加量隻提升了 5% ,關系增量漲幅不是很明顯。究其原因是雖然推薦理由很豐富,但是内容過多也會帶來使用者輸入資訊負載重,導緻使用者焦點迷失,是以标簽化的推薦理由要注意“簡即美”的設計。
5.4、權重訓練回報到推薦算法中
在推薦政策應用之後,從關系邀請和關系達成的樣本資料中,通過樣本的正回報中統計可以計算推薦标簽的權重。
參考這個權重,将權重的參數置到線上,讓正向回報得到最大化。上線之後,可以這個權重調整帶來的關系日增量才提升了 5% ,說明在算法的召回率和準确率都很高的時候,關系的推薦可以參考算法訓練的資料,但是還需要人工評估算法的合理性,畢竟對推薦的人的邀請率,是跟使用者直接的信任度最相關的。
經過推薦理由強化和訓練權重回報的兩類的視覺和算法優化,此時推薦清單的使用者點曝比又提升了 41% 。
**
5.5、增加邀請之後的滑動特效**
在推薦清單以卡片的形式展示在有限的空間裡面,使用者一次觸達的使用者隻有 3 個推薦好友,為了讓使用者感覺到多張卡片的存在,我們在好友添加的動作裡面,增加了左滑的特效。在互動調整上線之後,點曝比從提升了 43% ,再一次讓我們感受到前台UI的設計優化帶來的收益。
5.6、建立負回報收集功能
在推薦政策應用中,算法是要求同時搜集正向回報的資料和負向回報的資料。在負回報設計中,很容易想到曝光過濾。
在曝光過濾實踐的初期,我們點曝比很低的推薦清單中,會收集大量的曝光資料。曝光資料加入到負回報資料集中,然後通過過濾的方式作用到推薦資料中,發現優選的 TopN 資料大量被過濾掉,點曝比開始下降。
曝光過濾本質是要做負回報過濾,當曝光資料過多的時候,此時的負回報資料會形成噪聲,過濾掉了較多優質推薦使用者,影響到了推薦使用者的品質,是以必須建立精準的負回報的搜集方式。是以我們在推薦人的卡片中增加負回報的功能,比如在推薦人的卡片中增加删除功能,而删除的人在幾個月内不會被推薦給好友。
另外準确的負回報資料,還可以作為訓練負回報資料的樣本,預測負回報的資料,或者做推薦降級。
在金币莊園的多次推薦算法疊代之後,該管道每日邀請量提升 567% ,點曝比提升了 150% 。通過對推薦算法優化的實踐過,我們也抽象出一套淘寶社交關系推薦系統的方法論,為後續淘寶社交關系推薦系統的建構打下基礎
5.7、經驗總結
在推薦算法疊代中,我們有幾條比較可靠的經驗可以總結出來:
1、首先在算法推薦中,我們不能高估算法的作用,因為從影響推薦效果的因素上排序,産品UI的設計>推薦資料品質>推薦算法,而且推薦算法會有時效性,需要不斷疊代;
2、基于偏好的推薦是有效的,對于特定場景要挖掘該場景下的互動資料,作為共同偏好理由推薦;
3、準确率和召回率是通過離線評測來的,使用者的回報樣本資料,會産生噪聲,讓推薦算法變的混沌,是以必須進行必要的人工評測,設計合理的推薦算法;
06、淘寶社交關系推薦系統的設計與建構
在金币莊園的推薦算法優化過程中,我們進行了特定場景下淘寶使用者關系如何推薦的最佳實踐,将這種模式快速的推廣到第二人生等其他新場景中。
▐ 淘寶社交關系推薦業務接入背景建設
在算法疊代的時候,多種有效的調優方法,可以在多個場景中複用。
- 新業務場景的使用者行為資料是建構偏好聚類的基礎,需要能夠快速合并到推薦資料,針對業務場景透出
- 快速的ABTest能看到調優之後的結果,做算法的快速調整,是以資料名額的快速回流是我們背景建設的重點
- 對于推薦算法增加可視化營運的能力,能夠進行線上的預覽和快速的上線
是以我們針對将上述的需求搭建了推薦系統的業務接入背景,背景功能包括管道接入、管道接受率名額、推薦資料 mock 和推薦清單查詢、推薦權重重置和應用效果預覽、推送小流量和全量的 ABTest 功能、檢視昨日 ABTest 結果、檢視當日 ABTest 結果,在業務接入之後,可以通過一站式的管理的方式,提升推薦服務的效能。
在快速 ABTest 的設計中,我們采用服務端TT日志打點回流的方式,可以在當日内完成一輪 ABTest 驗證。
07、未來展望
關系達成的推薦,是關系積累的初期要持久投入的事情,但是對于使用者在淘内互動,也需要依靠關系推薦系統輸出目标使用者。是以對社交關系達成之前和達成之後,都需要我們對關系使用者做深度的刻畫,是以我們搭建了關系畫像平台做關系畫像的分析,未來關系推薦系統将服務于 關系達成 和 關系應用 兩類場景,我們在手淘電商環境的社交關系推薦上,還會不斷的探索和實踐。
未來一年内推薦系統的架構設計
▼
參考文獻
1、 《推薦系統實踐》筆記
2、社交關系的三元閉包理論
更多技術幹貨,關注「淘系技術」微信公衆号~