天天看點

對話愛莫科技楊恒:15年資料仿真研發遇上大模型浪潮

作者:雷峰網

作者:孫溥茜

編輯:陳彩娴

受訪人:楊恒

現任深圳愛莫科技有限公司創始人&CEO

劍橋⼤學博⼠後、倫敦⼤學博士、國防科大學碩

複旦大學、西電、深圳大學兼職教授、校外碩士生/博士生導師

深圳市海外高層次人次(孔雀人才)、深圳市南山區第六屆政協委員、深圳市十佳創業英才、深圳人工智能産業協會行業專家、深圳軟體行業協會 AI 領域專家

曾作為負責人深度參與多項 AI 領域的國家863 / 國際重點項目研發

在 AI 頂級會議期刊(例如CVPR/ICCV/NeurIPS/ICML/IEEE Trans等)發表論文 30 餘篇,已獲授權發明專利 40 餘項

“資料稀缺”、“研究源告急”、“大模型耗盡宇宙文本”......這段時間關于大模型缺少訓練資料的話題層出不窮。相應地,“ AI 訓練 AI” ,“合成資料”,所謂用魔法打敗魔法的聲量也此起彼伏。

Open AI 的 CEO Sam Altman 今年上半年在一個訪談裡提到“未來所有資料都将變成合成資料”, AI 科技評論也在和不同的訪談者交流中發現, AI 訓練 AI 的方式已經在大模型落地部署的過程中悄然流行。

業界對于合成資料觀點不一。Transformer 的作者之一 Aidan Gomez 認為:合成資料可能加速通往“超級智能”AI 系統的道路。但也有人持反面意見:認為“合成資料存在偏差”,“使用合成資料訓練,會讓模型出現不可逆轉的缺陷。”更甚有網友調侃,合成資料聽起來就好像 AI 在近親繁殖。

不過,網絡上的讨論聲音距離應用落地的第一線還是差了十萬八千裡。

成立于 2018 年的愛莫科技( 英文名稱:AiMall )是一家利用人工智能技術為線下消費零售提供數字化解決方案的公司。創始人楊恒博士在資料仿真、計算機視覺領域已經有超過十五年的研究經驗,他大學碩士期間攻讀的是“模式識别與智能系統”專業,為了能深入人工智能研究,楊恒又前往英國倫敦大學攻讀博士學位,聚焦人臉識别的研究方向,而後繼續到劍橋大學做博士後研究。訪談中,他為我們介紹了屬于愛莫科技的資料仿真式訓練模型方法,以及如何實作應用落地的。

以下是 AI 科技評論與愛莫科技創始人楊恒的對話:

當大模型遇上資料仿真

AI 科技評論:我們了解到愛莫科技今年4月釋出了大零售模型,貴司一直以計算機視覺為所長,進入大模型領域作何考慮?

楊恒:這是個很好的問題。我個人之前有過十多年的學術研究經曆,對于學術界來說,需要在一條技術路徑深耕下去。但産業界恰好相反,企業思考的模式更多要從客戶需求出發,愛莫科技過去四、五年主要聚焦在視覺 AI 的産業化落地,但服務要對客戶需求量體裁衣。客戶不會關心你具體用什麼技術幹了這件事,他們隻關心自己的問題有沒有解決。在這個過程中我們發現,解決客戶的問題光靠計算機視覺不夠,也需要今天家喻戶曉的大模型,本質上企業對這些解決方法都有需求。

我們在計算機視覺方向研究時間比較久,但其實在大模型這個概念爆火之前,2020 年我們已經開始了類似的研發,2021 年推出了第一個類似産品,叫“一問即得”。

“一問即得”不是一個純視覺的産品,它也有語言模型,語言與視覺的結合可以豐富 AI 産品對環境的感覺。客戶可以通過對話的方式快速得到自己想要的答案,這個産品和 ChatGPT 的邏輯非常相似。

對話愛莫科技楊恒:15年資料仿真研發遇上大模型浪潮

愛莫科技2020-2022年間基于大模型的系列産品

以線下消費零售為例,企業需要處理大量的圖檔、視訊、文本、服務 C 端的消費者資料。如果一個模型隻有單一模态能力,就沒有辦法把客戶的需求系統化解決。現在有了大模型這個工具,愛莫科技将識别能力、語言了解能力,以及對業務内部流程了解能力綜合起來打造的模型,才是在垂直場景有價值的大模型。是以現在我們更好的定位是,以垂直場景具有多模态能力的大模型為驅動,持續滿足客戶需求。

AI 科技評論:有句形容 AI 與大模型弊病的話,“有門檻、沒壁壘”,您怎麼看?您覺得愛莫科技這次入局大模型的優勢在哪裡?

楊恒:對 AI 公司來說,技術是一個基本門檻,如果沒有技術能力,就無法進入這個行業。但确實作在支援調用各種大模型接口,或者開源大模型,都在将 AI 科技創業的門檻慢慢降低。其實無論是大模型還是所謂的小模型,亦或傳統的機器學習也好,模型本身并沒有價值,有了對業務的了解,模型才可以再去賦能。

我認為我們入局最大的優勢在兩方面:有對業務的了解,以及有行業的資料。

過去幾年,我們與很多客戶建立長久合作,針對場景 know-how 打造業務高價值産品,在目前落地的細分賽道都建立了标杆應用。

從資料優勢來看,我們聚焦線下消費零售數字化應用的研發,但線下的資料非常稀缺。所有的大模型訓練都需要資料,像 OpenAI 這類公司主要通過爬取網際網路資料的方式,但對于垂直場景仍然不夠。比如線下每一家門店的經營表現情況、成立情況等細粒度資料,是無法像線上上一樣通過爬蟲擷取的。過去五年,愛莫科技積累了大量的線下消費零售資料,形成了自己的零售資料平台,這是支撐我們打造垂類零售場景大模型的關鍵燃料。

AI 科技評論:您剛剛提到資料對模型訓練的重要性,愛莫科技是如何應對這一資料難題的?

楊恒:剛剛也提到無論大模型還是小模型,對于産業有價值的都是基于監督學習的方法,而監督學習最基礎的邏輯就是要對資料進行很好的人工标注,然後再進行訓練,最後形成一個可使用的模型,這基本上是所有的 pipeline。

但人工标注有兩大問題。第一是成本較高,無論是采集資料或者找人工标注,都需要成本;但這不是主要瓶頸,我認為最大的問題在于:人有标注能力的上限,而人的标注能力上限就決定了模型的上限,如果人學不了,機器也就學不到了。

這就是我們公司一直在打造基于仿真系統的知識驅動人工智能(Knowledge-driven Intelligence based on Simulation System,以下簡稱“K.I.S.S”)的原因所在。仿真系統的核心要解決的就是兩個問題:如何降低标注成本?如何突破人工的标注極限?

對話愛莫科技楊恒:15年資料仿真研發遇上大模型浪潮

愛莫科技的 K.I.S.S

這裡可以舉兩個例子。

第一個是關于“人”的識别。以大家較為熟悉的人臉為例,人臉識别一直都是 AI 公司競争非常激烈的一個場景,但我們公司在 2019 年仍然能以非常高的價格将人臉識别算法授權給大公司,這就得益于我們這套基于仿真系統的人臉識别算法訓練方式。通常情況下,大家都采用正臉資料進行模型訓練,正臉光照好、人工容易标注,很多公司都能做得非常好。但一些角度非常大、特别模糊、光照特别不好、人看不清的畫面就超過了人的标注極限,這種時候人類沒辦法準确标注,也可能導緻這個模型根本沒有學到此類場景。

這時候我們用自己的 K.I.S.S 仿真系統,隻需要客戶提供一張正臉圖檔,就可以根據 2D 圖檔生成 3D 人臉模型,仿真出很多複雜場景的人臉資料樣本去訓練模型,提高識别準确率,是以哪怕在愛莫科技的最早期,也能夠與市面所有大公司正面 PK。

第二個例子是關于“物”的識别。我們在做的線下消費零售場景,對商品陳列的精準識别是占比很大的需求,而精準就需要模型做到非常細顆粒度的識别,比如客戶想要識别冰櫃裡的冰淇淋,品牌是夢龍還是和路雪,口味是巧克力還是香草,陳列露出占比又是多少。但實際應用中,商品規格多且相似度高,擺放淩亂遮擋嚴重,依賴人工很難做到快速又細緻準确地标注和統計。

對話愛莫科技楊恒:15年資料仿真研發遇上大模型浪潮

愛莫科技基于 K.I.S.S 的冰淇淋陳列 3D 仿真資料

對于這種零售商品的識别模型訓練,我們也用仿真方式産生大量自帶标注的資料樣本,模型的精度、成熟度、穩定性得到了市場應用驗證,從訓練成本到精度都具備明顯優勢,這是我們技術路線底層的核心邏輯。

AI 科技評論:您如何看待資料仿真這條技術路線未來對大模型訓練的應用價值?

楊恒:最近我看了 OpenAI 的 CEO Sam 的采訪,今年上半年他就說,如果 OpenAI 現在的大模型想繼續提升能力,當下唯一的解決方案就是更好地去合成資料,其實就是我們說的資料仿真的方式。

通過仿真技術,我們可以模拟不同的業務場景,生成大量的資料來訓練模型,比如不同的光照、角度、表情、各種遮擋,這樣才更符合攝像頭可能拍到的實際情況。但仿真技術的意義不止是數量的增加,更大的價值在于讓資料分布更多元。模型在訓練時見過各種場景資料,它的實際應用效果才會更好。這樣一來,我們可以不斷根據需求更準确地模拟實際場景資料,以此提高模型精度和性能。同時,仿真資料自帶标注,不再需要大量人工,成本、效果都得到提高。

每個公司都有自己的技術路徑,拿業務場景來說,我們和其他技術提供商是在同一市場,但每家公司都有自己認可的技術路線,這也是 AI 公司之間最本質的一個差別。

我們選擇基于仿真系統的方式,可能主要跟我自身背景有關,我從大學開始就一直研究計算機仿真,我認為這件事情是有價值的,是以從公司成立到現在以及未來,愛莫科技都會堅定這條路線。

現在:量體裁衣式 AI,賦能線下零售

AI 科技評論:愛莫科技從創立起就聚焦線下零售的 AI 應用,原因是什麼?目前主推的人工智能解決方案有哪些?

楊恒:愛莫科技 2018 年成立,那個時間也算得上是人工智能的又一次低谷期,但也正是這樣,讓大家可以回歸商業本質思考如何實作産業落地。我自己也在思考有哪些大的線下場景适合 AI 落地,經過市場調研,再結合團隊優勢,我們最終決定将 AI 落到零售這個市場足夠大、最接近消費大衆的場景,“愛莫”就是 AI 觸達末端的含義。

我們的應用是從線下場景的剛需切入,打造的第一個主推産品叫「一拍即核」,主要是幫助品牌實作面向線下營銷活動的高效開展及效果評估,用 AI 提高品牌的管道力。以前,因為店鋪數量多又分散,品牌面向線下零售小店的營銷活動執行與效果評估都很困難,「一拍即核」不僅能實作商品及物料的線下陳列營銷智能核查,即拍即核,實時回報,還能為品牌的營銷活動提供更豐富多樣的玩法,現在已經應用在酒水飲料、奶制品、食品、藥品等細分行業,像聯合利華、東鵬飲料都是我們的客戶。

愛莫科技賦能實體零售的還有另一主打産品「虛拟店長」,主要通過識别和分析門店客流、消費氛圍、員工作業、安全衛生情況等一些場景資料,幫助店主實時把握營運情況,不僅可以實時調整門店氛圍,還能精準提升服務品質,比如,消費者落座一分鐘之内,就有服務員熱情地接待,消費者離席兩分鐘之内,清潔工會及時清理餐具,給消費者帶去更好的體驗感受,也為店家節省人工成本,實作門店全場景數字化精細管理。

對話愛莫科技楊恒:15年資料仿真研發遇上大模型浪潮

愛莫科技「虛拟店長」核心功能

AI 科技評論: AI 公司一般都很難盈利,愛莫科技這幾年實作持續盈利是如何做到的?

楊恒:很多方面的原因吧。從企業經營政策上來說,如果用一句話概括就是:一定要做真正屬于 AI 公司自己的業務。

大部分 AI 公司虧損比較嚴重,原因在于還沒有找到真正需要 AI 的商業場景時,為了許多僞需求場景投入過多研發,最後無法産生客戶價值,或者産生了很多營收但并不屬于真正 AI 業務,比如做了安裝內建的項目,看起來收入高了,但隻是在用高成本做一件低毛利的事,是以是不可能盈利的。

我們思考的就是 Product-market fit(PMF),也就是産品 - 市場比對,這非常重要。愛莫科技與标杆客戶深度合作,在零售、餐飲、物流等領域從實際場景挖掘業務的 AI 需求,幫助客戶解決實際問題,為客戶創造或者提升商業價值,進而展現我們的價值。創業五年疫情三年,我們能一直處于小盈利的狀态,就是在産品和市場比對上抓的比較好。當然成功的道路不止一條,隻是這條路比較符合愛莫科技。

對話愛莫科技楊恒:15年資料仿真研發遇上大模型浪潮

其次,團隊協作也很重要。我們的聯合創始團隊能力非常互補,有人擅長算法,有人擅長架構。比如我的一位聯合創始人有在世界 500 強消費零售公司十多年的工作經驗,她對消費場景的了解非常深入。而我做技術出身,如果沒有她,我會花很多時間去調研零售行業 Know-how,比如為什麼會有品牌商,為什麼會有零售商,不太了解如何運作品牌方,不了解市場,但通過她十多年的行業經驗,整個團隊就可以根據對場景的了解,思考如何更快更好地打造産品。

未來:WPA,智能力+知識力+執行力

AI 科技評論: 未來愛莫科技的發展規劃如何?看你們提出了一個叫 WPA 的概念,和 RPA 有什麼差別,和你們的發展有什麼關聯?

楊恒:AI 是一個非常大的行業,我們把 AI 細分看,比如提到 RPA,深入大家腦海的是 UiPath,提到 CRM,首先會想到 Salesforce,現在提到 ChatGPT,大家第一個會想到 OpenAI。是以我們對未來的規劃是:做作業流程自動化(Workflow Process Automation,WPA)。WPA 這個概念是我們首先提出來的,沒有太多競争對手,希望未來提到 WPA,行業就會想到愛莫科技的名字。

再說回如何解釋 WPA,其實用 AI 為企業數字化賦能,本質來說就是在實作企業作業流程的自動化。比如現在給 ChatGPT 一個目标,讓它為我寫一個文檔、一段代碼,發出指令後它馬上幫我自動化完成,無論這個東西是否叫 AI,最終實作這個目标的産品本質就是作業流程的自動化。

但現在還有很多作業流程,例如營銷方案的設計、營銷效果的稽核判定等,不是簡單的規則性工作,需要更高階的「智能」作為基礎能力才能推動作業流的自動化執行。更高階的「智能」不僅包括跟人類一樣的 intelligence,還需要有對具體工作的 knowledge,然後實時執行決策、優化和調整,才能實作真正的作業流程自動化,即 WPA,這就是愛莫科技未來要做的。

對話愛莫科技楊恒:15年資料仿真研發遇上大模型浪潮

MPA、RPA、WPA 的進化過程

AI 科技評論: 面對行業白熱化的競争,您會采取什麼政策來保持愛莫科技的競争優勢?

楊恒:在泛 AI 行業裡我們确實有非常多的競争對手,但就像剛才我提到的,每家公司的技術路線不同,在資料仿真這條路上我們已經走了 5 年,已經有了大量的行業客戶背書,競争一直存在,每一個次元都有競争,但如果從整體次元看,我依然非常看好愛莫科技未來的發展。

AI 科技評論:作為十多年人工智能從業者,您個人如何看待 AI 的未來?

楊恒:我認為現在的人工智能行業充滿了機遇和挑戰。機遇在于各種創新技術不斷湧現,吸引了更多的人才和資金進入。但同時也面臨着過度炒作和不理性發展的風險,是以需要行業内的從業者們保持冷靜和理性,確定人工智能的健康發展。

比如過度承諾誇大宣傳,可能讓需求方對人工智能的預期過高,導緻實際應用效果與預期不符。另一方面,過度承諾也可能吸引一些不太理性的人才進入行業,可能會誤導行業的發展方向。

包括關于 AI 是否會淘汰人類也一直是個争議很大的話題。前段時間 StabilityAI 的 CEO 在采訪時也談到五年内人類程式員會失業,但其實反過來思考,人類可以借助 AI 工具完成很多事情了,人工智能生産力的極大提升會讓生産關系發生變化,過往完全由人類控制的 AI 機器會逐漸過渡到能與人協作,人與 AI 能達到共榮共生的狀态,愛莫科技也正在朝這個方向前進着。

歡迎添加作者微信Sunpx33,交個朋友~

雷峰網雷峰網

繼續閱讀