活動報名: https://www.huodongxing.com/event/6587471316600 如今,社會生産資料正以指數增長的速度從白紙印刷向萬物互聯的網絡中遷徙,人們面臨着更高的資料處理需求:語音、圖檔、視訊,語言文字、行為……資料本身是沒有生命力的,唯有發現與用才賦予它們生機。在 AI 的賦能下,這些形态各異的非結構化資料得以通過向量化的形式被直接檢索,向量檢索技術成為愈加重要的一環。

3月20日,阿裡雲開發者社群聯合阿裡雲計算平台事業部、達摩院共同舉辦的 BIGDATA + AI Meetup · 北京站向量檢索專場即将重磅開啟!來自阿裡雲、淘寶、愛奇藝、Zilliz、搜狐、Jina.AI以及 AI 四小龍之一某公司資料研究院技術總監等九位重量級講師将在現場分享關最前沿的向量檢索技術思考與實踐,解讀向量檢索與人臉識别、推薦系統、圖檔搜尋、視訊指紋、自然語音處理、檔案搜尋等各類應用場景交織融合的技術邏輯;更有阿裡雲達摩院自主研發,并廣泛應用于阿裡集團各個業務場景的 Proxima 向量檢索引擎的對外首次揭秘!無論你是熱衷于鑽研開源技術的開發者,還是“大資料+AI”的資深愛好者,都能這些前沿的案例從中獲得全新的靈感。
本次 Meetup 将采取線上線下雙線關聯的方式,除線下參與外,還将進行同步直播,您可實時觀看活動精彩分享。此外,現場還準備了精美社群禮物以及免費茶歇甜點。到場名額有限,不容錯過!快快報名吧!
▼ 會議亮點 ▼
- 阿裡雲達摩院自主研發的向量檢索引擎 Proxima 首次對外揭秘——賦能阿裡集團拍立淘、搜尋個性化、優酷視訊指紋、猜你喜歡、圖搜雲等多業務場;內建在 Ads、Hologres、Elasticsearch 等雲上業務……阿裡雲達摩院 Proxima 技術負責人将現場帶來硬核詳解。
- 阿裡巴巴進階算法專家為你展示淘系推薦團隊 MIND 召回算法的系統架構設計及應用;阿裡雲團隊基于 PAI 可以幫助客戶快速搭建個性化推薦解決方案。
- 國内開源向量搜尋引擎——Milvus 所屬公司 Zilliz 合夥人現身解析應用于各大企業的經典案例。
- “AI四小龍”之一——某公司資料研究院技術總監分享十年沉澱開發經驗,帶你領略大規模人臉比對技術,共話向量計算的未來。
- 還有開源神經搜尋公司 Jina AI 創始人兼 CTO 親自展示 Jina 的設計理念及使用其搭建搭建神經搜尋系統的原理;愛奇藝在廣告、搜尋、視訊推薦等業務的向量檢索技術最佳實踐;搜狐應用 Mlivus 基于語義向量的内容召回和短文本分類的文本标注實戰……
嘉賓及議題詳情
《向量檢索的過去,現在,和未來》
議題簡介:
淺談向量檢索的技術背景和應用,揭秘向量檢索的核心挑戰和未來發展趨勢。
出品人簡介:
王紹翾(大沙),達摩院機器智能實驗室,資深技術專家。畢業于北京大學,在加州大學獲得計算機工程博士學位。畢業後曾在 Facebook 開發分布式圖關系資料庫 TAO。2015 年加入阿裡巴巴集團,先後就職于搜尋事業部,計算平台事業部,目前是達摩院機器智能系統AI實驗室的負責人,主要負責達摩院的 AI Engineering 的體系建設,包括高性能訓練,推理,向量檢索等等核心引擎的研發,以及視覺,NLP,決策等算法能力的開放平台建設和商業化落地。在搜尋和計算平台事業部,王紹翾主要負責阿裡新一代實時計算平台 Blink/Flink 的研發工作,他是國内最早期的 Apache Flink 的 committer 和 PMC。
《 MIND - 基于動态路由的使用者多向量召回》
手淘首頁的推薦面臨着兩個極具挑戰性的問題. 一是業務資料量巨大, 包括十億級的使用者和商品; 二是首頁開屏即現, 對算法的響應時間有嚴格要求. 在實際實踐中, 我們将推薦系統拆分為召回與排序兩個子系統. 其中, 召回系統從海量的候選商品中挑選出與使用者興趣相關的商品集合, 排序系統對該商品集合中的每一個商品依據業務目标進行打分, 打分較高的商品作為推薦結果展示給使用者. 推薦算法的效果同時受到兩個子系統的影響, 召回作為算法的前置環節, 更是決定了整個系統的效果上限. 本次分享中, 我們将分享 MIND 召回算法及其系統架構設計
講師簡介:
睿德, 淘系技術部, 進階算法專家。從事推薦技術召回, 排序算法的開發。
《達摩院 Proxima 向量檢索技術揭秘》
淘寶搜尋推薦、視訊搜尋支付背後的檢索技術,達摩院向量檢索引擎 Proxima 揭秘。Proxima 是阿裡巴巴達摩院系統 AI 實驗室自研的向量檢索核心,廣泛應用于阿裡巴巴和螞蟻集團内,為淘寶搜尋和推薦、螞蟻人臉支付、優酷視訊搜尋、阿裡廣告檢索等核心業務提供核心檢索能力。并深度內建在阿裡雲 Hologres、搜尋引擎 Elastic Search 和 ZSearch、離線引擎 MaxCompute (ODPS) 等大資料和資料庫産品中。
肖允鋒(鶴沖),達摩院資深技術專家。畢業于中山大學實體系。曾就職于電信研究院和騰訊科技,從事大資料搜尋技術相關研究和應用十餘載,是阿裡巴巴達摩院 Proxima AI 檢索引擎的總設計者和技術帶頭人。目前,Proxima 相關技術廣泛應用于阿裡巴巴和螞蟻金服各大業務,算法和工程在業内具有一定的領先性。
《愛奇藝在推薦領域的向量檢索技術實踐》
在推薦算法領域,召回-粗排-精排是成熟穩定的系統方案。而傳統過濾/模式比對的召回算法在個性化、實時、智能推薦的需求上力不從心,對快速增加的各種非數值類特性和海量資料的處理無能為力,同時線上的推理過程對性能又提出了嚴苛的要求。我們結合一種 DNN 等多種向量召回模型與重排序的需求,探索了數種向量檢索的服務的技術與産品,結合這些技術 和 Tensorflow Serving,完成廣告、搜尋、視訊推薦等業務在愛奇藝的召回基礎服務。
張吉,愛奇藝深度學習雲研發工程師。
《Jina :雲原生開源神經搜尋架構》
随着資訊規模的爆炸式增長和資料類型的日益豐富,基于符号的傳統搜尋逐漸無法滿足使用者的需求。得益于深度學習技術的發展,神經搜尋系統應運而生。但是,在搭建和維護神經搜尋系統的過程中,工程團隊不僅需要具備分布式架構的經驗,更需要熟悉多個軟體架構和了解不同 AI 算法。針對這個痛點,Jina 提供覆寫搜尋全鍊路的一站式雲原生開源解決方案。在本次報告中,我們将分享 Jina 的設計思想和主要特點,并展示如何使用 Jina 搭建神經搜尋系統。
王楠,博士,Jina AI 聯合創始人兼 CTO。專注于機器學習和深度學習算法在 NLP 和搜尋領域的實際應用。作為開源神經搜尋架構 jina 的核心貢獻者,熱衷于開源軟體和雲原生技術。
《高性能高維向量計算》
在深度學習流行的當下,向量計算已經成為 AI 工程的基石,無論是人臉比對、圖像搜尋、推薦、智能問答都涉及到海量高維向量的計算。檢索和聚類是其中兩個典型的計算場景,面向海量向量的檢索通常采用 ANN 一簇算法解決,無監督聚類算法也正在蓬勃發展;除開算法,工程架構上的挑戰也是巨大的,比如怎樣适配端側裝置、國産晶片等異構計算環境。本次演講,我們會分享在大規模人臉比對領域上的實踐心得,探讨向量計算未來的發展方向。
楊傑,AI四小龍之一某公司資料研究院技術總監。主要負責 KaaS 平台(向量計算、知識圖譜、搜尋等技術方向)研發,在 AI 工程化方面有深厚的積累。網際網路行業曆練技術十餘年,有豐富的搜尋、推薦系統研發經驗。
《Milvus ——開源向量搜尋引擎》
随着深度學習技術的成熟,人們嘗試利用 AI 技術挖掘非結構化資料(圖檔,視訊,自然語言文本等)中潛藏的價值。由此,人們對特征向量資料的分析處理需求大幅增長。然而通過現有的資料庫元件和大資料技術來支撐這樣的新型應用場景,卻面臨開發困難、運作成本高昂的挑戰。為了幫助克服現有技術的局限性,我們發起了 Milvus 開源向量資料庫項目。作為一個開源AI基礎元件,Milvus 加快了企業開發 AI 應用的速度、大幅降了 AI 應用的部署成本。
顧鈞,Zilliz 進階架構師&合夥人。北大畢業 16 年以來始終專注于資料庫、大資料技術,尤其對 OLTP 平台與場景有着豐富的經驗。顧鈞現後任職于工商銀行,IBM,摩根士丹利等企業。加入 Zilliz 以後,顧鈞的工作重心在于開源社群的建構與推廣。同時,顧鈞代表 Zilliz 出席 LF AI & Data 基金會中的技術咨詢委員會。
《雲上個性化推薦——基于 PAI 和 Hologres 的個性化推薦最佳實踐》
常見的個性化推薦系統包括日志收集,資料加工,召回,排序,離線上效果評估等諸多環節,對于中小客戶存在技術門檻高,搭建周期長等問題。計算平台基于 PAI,Hologres,MaxCompute,DataWorks 平台産品,可以幫助客戶快速搭建個性化推薦解決方案。本次分享,主要從計算平台的推薦系統整體解決方案出發,重點介紹基于 PAI 的向量召回算法和 Hologres 向量檢索的整體架構,以及該架構在米連科技的落地案例和效果分享。
天邑,阿裡雲計算平台進階算法工程師。主要從事基于 PAI 平台的召回和排序算法研發,及基于雲産品的推薦系統解決方案研發,賦能客戶個性化推薦解決方案落地。
《基于語義向量的内容召回和短文本分類的文本标注——搜狐的 Mlivus 實戰》
得益于 Mlivus 向量搜尋工具的高效部署,在處理海量資料時準确快速,本次演講中,我們将分享利用 Milvus 向量搜尋工具解決語義向量召回時的向量搜尋問題和短新聞文本分類時文本的标注問題。
王婷婷,搜狐自然語言處理工程師。在搜狐主要從事基于内容的語義向量召回,文本分類,文本摘要,新聞聚類,新聞關鍵詞提取等相關工作。
如何報名?
點選「
我要報名」即可報名參與,了解更多向量搜尋前沿技術,與大佬零距離交流,3 月 20 日,我們在北京等你!
報名連結:
活動議程
活動地點
- 活動時間:2021年3月20日 10:00 - 17:30
- 活動地點:北京市朝陽區酒仙橋路2号北京 798 藝術區 D 區 798 西街 1F 主會場
直播觀看
👉 更多技術問題可掃描下方二維碼,加入大資料+AI技術群~
👉 合作夥伴