特邀嘉賓:
項昭貴(項公)-阿裡巴巴進階技術專家
視訊位址:
https://summit.aliyun.com/2021/session/689AI Online Serving工程體系
阿裡自研的整套搜尋工程體系-AI Online Serving體系,目前支撐起海内外阿裡電商全部的搜尋、推薦、廣告業務,時刻置身大資料主戰場,引導成交占據集團電商大盤主體;此外,作為中台技術中堅,AI·OS已是包括電商、阿裡雲、優酷、菜鳥、盒馬、釘釘等等在内全集團的基礎設施,更為重要的是,AI·OS體系的雲産品(開放搜尋和智能推薦)矩陣通過阿裡雲服務于全球開發者,在穩定性和工程效率上都是行業領先水準。

統一召回引擎
統一引擎架構及演化過程
左圖是搜尋引擎HA3和推薦引擎BE的不同執行流程,我們将各引擎功能抽象成算子,把基礎功能形成公共算子庫,使用者可以直接複用和根據業務需求開發,形成右圖的Suez架構。
統一召回引擎的特點
1.查詢流程DAG化
- 與深度學習執行引擎統一
- 搜尋功能抽象成算子
- 統一算子庫,支援算子粒度的複用和開發
2.多種查詢表達方式
- SQL
- TuringSDK
等.....
可以靈活定制執行流程,加速業務疊代速度
統一召回引擎的應用實踐
召回引擎面臨的挑戰
既要,又要,還要
- 資料膨脹:文檔資料,算法資料
- 深度學習的應用:召回,粗排,精排
- 穩定高效:高可用,時效性,低延遲
傳統解決方案及問題
資料規模膨脹展現在資料次元越來越多。例如電商搜尋領域以前隻考慮商家、商品兩個次元,現在還需要考慮物流、位置等次元。傳統引擎處理把這些資料在離線處理join成一張大寬表推給線上做索引建構和查詢服務,這會有個問題,很可能出現一個輔表資料更新導緻大量的主表資料更新,進而出現寫資料擴大的問題,對線上服務的時效性有很大的挑戰,在一些場景上很難得到滿足,尤其大促場景很難滿足要求低延遲高時效的需求。
傳統解決方案:
将資料按一定次元拆分通過多個引擎執行個體去提供服務,由業務方來将一次查詢拆分成多個請求通路多個引擎,實作搜尋結果。
存在的問題:
- 出現大量資料的序列化;
- 資料可能會有截斷,導緻效果受損;
例如外賣平台搜尋,發現想搜尋的店鋪因為配送時間或距離原因沒有match上,導緻意圖搜尋菜單沒有展現,使用者體驗不佳;
資料規模膨脹另一個展現是資料量變大,資料量變大導緻單個搜尋加載提供查詢的時間變多。
一個是将索引進行擴裂,可能帶來請求的拆分和結果的合并,随着個數越來越多,耗時越來越大,逐漸成為技術瓶頸。另一個是當搜尋個數多時,整個叢集的穩定性和可用性受到損害,對使用者而言存在查詢結果不穩定情況。

統一召回引擎解決方案
- 引擎支援多張表
- 通過一個引擎裡面線上同時加載多張表,每張表的索引建構、更新、切換、加載都是獨立的;
- 查詢時通過線上多表join方式,可以在一次查詢時拿到全局的資訊,包括店鋪資訊,商品資訊都能得到充分運用,比對最符合使用者需求的召回結果;
- 采用SQL表達查詢流程
- 開發者使用簡單
- 複用SQL生态基礎功能

3.并行查詢,降低延遲的利器
把索引資料按一定次元切分,在處理使用者的查詢請求時可以根據不同的切分并行的查詢,進而降低整個查詢的延遲,也避免了通過擴裂的方式帶來的問題。

4.向量召回,深度學習在召回階段應用
在資訊豐富的今天,我們的查詢引擎光靠文本查詢很難滿足業務的需求
- 采用達摩院自研的向量檢索核心-Proxima,具有超大規模資料向量索引的建構,提供高性能的線上向量檢索能力;
- 在原來文本召回基礎上,增加向量召回,可以實作對文檔召回率和準确率的兼顧,同時可以在每一路排序裡面進行較好的靈活配置,取得好的搜尋效果

統一召回引擎在推薦場景的應用
打造個性化推薦效果的召回引擎

統一召回引擎的雲上實踐

阿裡雲開放搜尋
開放搜尋(OpenSearch)是基于阿裡巴巴自主研發的大規模分布式搜尋引擎搭建的一站式智能搜尋業務開發平台,通過内置各行業的查詢語義了解、機器學習排序算法等能力,提供充分開放的引擎能力,助力開發者快速搭建更高性能、更高搜尋基線效果的智能搜尋服務。
開放搜尋在電商行業應用
- 電商行業搜尋産品化落地,使用者無需各方向技術探索,隻需按模闆接入即可擁有更優搜尋服務;
- 内置更高品質算法模型,免去大量的資料标注與模型訓練工作,直接内置淘系搜尋算法能力;
- 支援個性化搜尋與服務能力,通過引擎側的多路召回能力,實作搜尋結果、下拉提示、底紋詞等重要服務;
- 支援使用者自行訓練的NLP模型導入開放搜尋,靈活滿足業務開發者需求;
- 阿裡巴巴自研引擎系統,處理海量資料、高并發、海量使用者請求,性能優于開源方案;
- 根據電商行變化,不斷疊代更新原有能力,提供更高時效性的服務保障;

開放搜尋在教育搜題場景應用
- 支援文本索引、圖檔向量索引、公式索引多路召回結果,降低文本搜題、拍照搜題場景的無結果;
- 教育查詢分析全套能力,解決準确率較低問題,可定制排序腳本,深度優化召回結果排序效果;
- 使用者靈活配置的向量+文本召回,快速提升搜尋系統效果;
- 排序插件開發-Cava語言 ,更強的定制能力,更易于維護,輕松實作業務排序需求;
- 按量付費,即時生效,保障高峰期搜尋穩定同時,不需要提前購買大量資源,無成本負擔;
- 支援千億體量資料搜尋的毫秒級響應,實時資料更新秒級可見;

如果您對搜尋與推薦相關技術感興趣,歡迎加入釘釘群内交流