天天看點

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

内容要點

本文主要以電商行業為例,從服務搭建流程、推薦測試流程、最佳實踐分享适配的智能推薦快速搭建方式和實踐政策。

服務搭建流程

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

智能推薦作為一款大資料應用産品,資料是第一生産力,如果在沒有任何資料的情況下,想做千人千面的推薦,是不太可能的。資料對于整個模型而言,都是非常重要的。智能推薦所需要的資料,分為三類,user,即推薦面向的終端使用者的資訊;item,即要推薦的内容,例如在電商行業就是商品;behavior,即行為,指發生在user和item之間的互動動作,在平台上,消費者的消費偏好,商品的使用者喜好畫像,都可通過behavior來表征。

對于智能推薦的模型來說,一方面依賴海量的行為,進行模型計算,另一方面也會根據商品、使用者的靜态屬性做分析推薦。無論是上報的全量資料表,還是後期的行為資料、使用者資料、商品資料,經過全量和增量資料的合并,代表了AIRec底層的資料倉庫,最終會提供推薦經過精排之後的結果集。從資料層到智能推薦的結果集,中間經曆了模型的訓練。

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

在開通智能推薦之前,需要做資料準備,包括user、item、behavior,之後進行執行個體的開通和配置。因為不同的行業具備不同的屬性,優化的目标和所需的資料類型都有差别,是以智能推薦會按照行業模闆來區分。

第二步,需要選擇推薦服務類型,表示智能推薦的結果,有猜你喜歡、相關推薦,不同的類型應用的場景是不同的,需根據業務場景進行選擇。

配置資料源,現有3種配置方式。之後進行模拟測試,後期也需要把實時變化的資料同步到智能推薦。通過SDK擷取推薦結果。

資料準備階段,所面向的user都是平台上的消費者,item就是商品,behavior就是使用者和商品之間發生的關關聯作。使用者需要按照産品官網上的資料規範,結合每個字段的資訊進行上報。

使用者表

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

使用者表是實作千人千面的前提,因為希望實作給每個消費者都提供不同的商品集,需確定通路的每一位使用者都有自己唯一的身份辨別,可通過user_id或者手機裝置号确定。如使用者是遊客狀态,則需通過其他方式确定使用者身份,否則将隻能獲得熱品的推薦。另外還需要提供使用者特征的字段,包括性别、年齡及其他标簽,将有利于基于畫像特征分析的推薦。

物品表

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

代表商品的資訊表。每一件商品也需要具備唯一性。智能推薦通過item_id和item_type來标記指定唯一的商品。Status表示了目前商品狀态是否可被推薦,0表示不可推薦,1表示可推薦,可實施遇到商品上下架時的幹預。Title表示對商品的标題描述,智能推薦會結合商品的描述進行語義分析。Scene_id表示物品可被投放的子場景ID,通過這個字段進行區分和效果觀察,可根據推薦展現形态進行設計。Weight指item的權重值,當産品品質較好,或考慮到業務方、廣告主的要求,可進行權重,初次接入時,建議不要權重,權重可能會導緻模型結果受到人為的幹擾,對效果産生負影響。pub_time代表内容釋出時的時間戳(秒級),用于判斷内容是否為新品,expire_time表示内容失效時間戳,失效後,商品将不會再被推薦,兩者用于控制item時效性。category_level表示類目層級數,category_path表示類目路徑。Tags表示标簽,可加具體的類目含義,例如品牌資訊、屬性、适用人群,會被用于模型的訓練,利于效果提升。

場景具體使用

比如淘寶首頁猜你喜歡,有全部,表示所有商品都可出現,便宜好貨則有價格門檻,隻有低價産品會在這個tag頁出現,以上兩個就是完全不同的推薦場景。如果APP上有類似的形态,需要在商品選擇、部署上進行場景區分。另外,包括購物車的猜你喜歡和首頁的猜你喜歡也是不同的,投放端的不同,會帶來使用者心智、行為不同等,建議區分不同投放端進行效果觀察。

行為表

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

行為表征了平台上使用者的特征資訊、傾向。每一條行為也需要定位到唯一的使用者和商品。bhv_type表示行為類型,例如曝光、停留、點選、收藏、下載下傳、購買、加購、評價等。trace_id表示請求追蹤/埋點ID,用于在AB實驗時區分,效果對比。trace_info表示請求埋點資訊。bhv_time表示行為發生的時間戳。bhv_value表示行為詳情,例如點選次數,停留時長,購買件數、購買金額等。曝光資料是必不可少的,如曝光之後,有停留、點選、收藏、下載下傳等行為資訊,可将曝光資料在模型中作為負例資料。

執行個體建立

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

智能推薦目前支援内容型、商品型、新聞型模闆,如視訊類型需要在内容型進行建立。

資料對接方式

以下情況,可啟用第一種資料對接流程

  • 如行為資料沒有埋點或需要進行埋點更新,可用定制版SDK進行埋點。
  • 如資料本身就用了友盟SDK采集,需要結合資料規範稍作修改就可完成資料上報。

A 資料對接流程

通過友盟SDK采集到的行為資料,需要在控制台進行配置即可自動同步,無需手動上報。

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

以下情況,可啟用第二種資料對接流程

  • 如資料存在MaxCompute,需按照标準配置進行執行個體建立,後續同步SDK即可。

B 資料對接流程

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

以下情況,可啟用第三種資料對接流程

  • 如資料沒有存在MaxCompute或需要快速啟動服務,可以使用服務端的SDK快速對接資料。

C 資料對接流程

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

結果擷取

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

需指定場景、唯一使用者、請求數量(一次最多請求50條結果),将傳回唯一商品、位置資訊、traceinfo,之後将進行行為資料的回傳,行為類型、發生時間、場景、traceinfo,将這些行為資訊回傳給智能推薦後,就形成了流轉的過程,促進結果的實時更新。

推薦測試流程

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

使用者分為兩種,一是老使用者,存在行為;二是新使用者,不存在行為,需根據兩種不同的使用者分層進行測試。推薦測試包括結果測試、功能測試、效果基礎測試和效果進階測試。在測試之後,将會正式接入線上流量,進行結果的持續觀察和效果提升。

最佳實踐政策

首頁推薦可以結合長短期興趣、使用者畫像分析進行集中展示。

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

資料圈選

1、提前過濾違規、品質差的商品

2、按照場景訴求進行選品分類,類似便宜好貨,保證價格門檻

3、及時更新商品生命周期

特征豐富

1、具備商品的标題資訊

2、上傳商品的類目、品牌、風格、性别等資訊

3、豐富曝光、點選、購買行為上報

電商行業經常遇到的問題

為應對使用者疲勞,可進行打散和混排。

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐
【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

加入社群

點選訂閱

《阿裡雲搜尋與推薦技術交流期刊》

掃碼入群,了解更多資訊,擷取課程資料

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐