天天看點

量産AI Agent?釘釘建議大家務實

作者:钛媒體APP
量産AI Agent?釘釘建議大家務實

圖檔來源:unsplash

還記得最早的AI Agent麼?

2023年4月,剛釋出不到一個月的Auto-GPT,在GitHub上收獲了10萬Star,OpenAI 科學家 Andrej Karpathy稱其為“ prompt 工程的下一個前沿”。它最新的Star數量是16萬,但絕大部分都來自于ChatGPT釋出到更新之前。

原因是多樣的,首先是底模型能力的更新,當OpenAI更新更新了GPT的Browsing、Code Interpreter和Plugins功能,Auto-GPT看起來像一個“傻瓜”。

同時Auto-GPT作為AI Agent的價值太淺,簡單邏輯就是讓大模型反複決定要做什麼,同時将其思考的結果回報回提示,根本滿足不了個人和企業的需求。

還有後來更多AI Agent開發平台出現,有頭有臉的巨頭和新興創業公司,都踏入了同一條賽道,業内普遍認可AI Agent的重要性,AI Agent進入到了百家争鳴的早期階段。

近日吳恩達提到,“所有從事人工智能的人都應該關注AI Agent”,在他看來,通過Agent,人工智能能夠勝任的任務種類将會大幅擴充,即便用參數更低但響應更快的大模型,通過更多輪次的疊代,也能比更大參數的模型效果好。

吳恩達團隊讓大模型寫一些代碼并運作,最終對比不同模型和工作流程得出結果的性能,僅用GPT-3.5 模型準确率為48%,僅用GPT-4 模型準确率為67%,GPT-3.5 + Agent效果高于 GPT-4 模型的表現,GPT-4 + Agent的效果則遠高于 GPT-4 模型。

從市場規模來看,MarketsandMarkets認為,2023年全球自主人工智能和自主智能體(Autonomous Agent)市場的收入規模超過48億美元,到2028年有望達到285億美元左右,預計2023-2028年的年複合增長率為43.0%。

所有趨勢似乎昭示着,一個遍地是AI Agent的時代即将到來。但行業更關心的是,AI Agent要從想象力轉化為生産力,需要做哪些準備,結合什麼樣的工程化能力,以及最重要的是,如何避免Auto-GPT式的窘境。

“場景,場景,還是場景”

如果找到一個好的大模型是目标,誰來定義什麼是好的大模型?場景,越來越成為公認的答案。

尤其對于企業而言,在一個至關重要場景下的大模型,能夠有穩定且突出的效果,比多個場景下差不多的效果更有價值。

大模型時代,AI Agent是解決需求的載體,這個載體的起點就是場景。不同的場景,會有不同的需求,使用者作為需求的源頭,在同一個場景下,因為使用者不同,需求也會千差萬别。

場景、使用者、需求是産品的三要素,也是AI Agent産品化要解決的核心問題。拆開來看,對AI Agent有需求的使用者有很多,他們從頭開發AI Agent相當費時費力,大部分技術提供商想要開發AI Agent,也很難滿足某個客戶具體而微的場景需求。

這是目前橫亘在客戶和技術服務商的裂谷,願意為大模型和AI Agent買單的客戶都有非常明确的場景,但他們并不想從頭去“教育”大模型廠商,雙方正在互相趨近,前提是客戶希望另一方跨出一大步。

量産AI Agent?釘釘建議大家務實

圖檔來源:unsplash

在與衆多客戶和廠商的交流過程中,钛媒體App發現,純粹的大模型效果已經不是第一考量因素,綜合AI Agent的打造過程,客戶希望廠商懂得行業know-how,有足夠的資料積累,最好還能低門檻絲滑創造AI Agent。

釘釘AI産品負責人子推表示,從平台建構智能體平台本身來看,整體的基礎能力是差異性不大的,未來的差異化首先要看,Agent跟平台本身特性能不能很好地結合,能把平台的差異化能力貼合到Agent本身的開發鍊路裡。

比如知識庫,絕大部分的AI Agent開發平台,知識庫以使用者上傳的本地檔案為主,它是個靜态的知識庫,而釘釘的知識庫可以關聯釘釘的線上文檔,相當于AI助理源源不斷地更新知識。釘釘的資料能力,協同能力,時間感覺能力和場景內建能力非常豐富的加持着AI本身。

如同那句耳熟能詳的“地段,地段,還是地段”,不論是釘釘AI助理大賽上的參賽者,還是釘釘自身的智能化改造,以及釘釘上線AI助理産品和市場,給行業帶來的啟示是,AI Agent的關鍵——“場景,場景,還是場景”。

一個讓AI Agent先跑出來的機會

想象中的AI Agent和現實中的AI Agent還有些距離,想象中,AI Agent具備感覺、記憶、規劃和行動能力,以及跨應用程式的任務執行能力,但目前大部分AI Agent還未能滿足實際需求,這也是釘釘AI助理大賽舉辦的初衷,讓一批AI Agent先跑出來。

這些AI助理都有一個共性,找到的切口足夠小,在具體場景下能夠實作不錯的效果。以金牌櫥櫃的AI助理——智習生1.0為例,金牌櫥櫃CIO陳志永剛接觸大模型時,還隻是用來查資料并快速輸出一些内容,他并不認為大模型會和自己的業務有什麼實質交集。

直到陳志永開始聽說AI Agent,大模型似乎能實作一些企業場景裡的需求。“我們也想基于我們的訴求做一下嘗試,沒想到嘗試後發現真的可以實作。”

金牌櫥櫃在全國有四千多家線下門店和經銷商,包括店主、導購、招商經理、營運人員等在内的各種角色,經常要把消費者提出的問題傳遞給總部,這些問題關于傳遞保障、産品報價、訂單流轉、營銷政策、三方營運、線上營運、招商見面、學習教育訓練等場景,繁雜卻又剛需。

對于總部來說,金牌櫥櫃先要安排客服對接,然後内部對應派出大量人力解決不同的咨詢,有時一個傳遞保障的問題,可能需要ABC多個角色,客戶體驗不佳,金牌櫥櫃的員工們很累,解決問題的時效和水準也不确定。

2023年9月份,金牌櫥櫃正式立項了AI助理項目。在此之前,金牌櫥櫃有數套垂直的系統,答案分散在不同的系統中,但AI助理提供了一個新思路。“我們現在隻需要告訴‘小金’(AI助理)什麼需求,小金就能輸出結果,釘釘 AI PaaS 前期已經實作系統打通,包括ERP、WMS等資料,AI助理的思考能力和行動力也就更強大。”陳志永說。

量産AI Agent?釘釘建議大家務實

2024釘釘AI助理大賽

和金牌櫥櫃相似的使用者并不少,今年3月,釘釘舉辦了一場AI助理大賽,面向全社會的企業、ISV和個人參賽者,征集基于釘釘的AI助理作品。截至3月底,總共收到了超過700份參賽作品,三個賽道共30件作品進入前十名,并于4月23日在深圳舉辦了決賽路演和現場頒獎。

量産AI Agent?釘釘建議大家務實

最終,杭州市警察局的“公安政務助手”和立業雲(北京)智慧科技有限公司的“企業選址 AI 助手”脫穎而出,分别獲得企業賽道和辦公賽道的一等獎。高校生活賽道則由“賽博财神”摘得桂冠,這一結果由現場觀衆在展區試用之後投票産生。

于釘釘平台視角,也在尋找讓AI助理商業模式得以成立的路徑。子推表示,“釘釘追求有價值的規模,核心是不能為了規模而做AI助理,AI産品和其他網際網路産品是差別的,大多數網際網路産品是随着使用者基數放大,平台效應放大,成本越來越低。但目前來說,AI 助理使用者數變大,成本會越來越高。”

他補充道,AI助理的特殊性讓釘釘去思考,怎麼能把商業循環起來,平台價值逐漸深化,創作者能夠獲得收益,使用者願意為此買單,且平台能夠持續把成本降低甚至實作收益。

最好的故事,需要最多的要素

大模型是一個好故事,但隻有少數企業有資格講,就像移動網際網路時代的作業系統,AI Agent是一個更好的故事,類比蘋果應用商店,當所有人都想講同一個故事,AI Agent那些顯性和隐性的要求,也都浮現出來。

“釘釘本身是個平台級的應用公司,未來底模型能力越強,對釘釘的加持會越好,創作的可能性越高,在工程上投入越少。但是釘釘平台的獨有場景、資料和行動等能力也好,這是模型廠商不具備的要素。”子推表示。

目前不少使用者已經率先用上了釘釘AI助理,并且從玩具階段過渡到工具階段。钛媒體了解到,一是大企業CIO的團隊,基于對AI的了解和比較明确的使用者需求,AI助理和業務場景內建得比較深。

二是資料分析和業務洞察相關場景,大量企業在做類似的實踐,基于權限設計和業務系統打通,AI助理就能實作過去非常複雜且費時的操作。

還有偏高校類的創作者,可能在場景深度上有所缺乏,但往往有獨特的洞察視角,并且願意動手實踐,例如兒童觀察 AI 助理就獲得了本次大賽二等獎。

這也是外力驅使下,釘釘劇烈變化的一年,釘釘要做好平台,先要改造自身。“我們服務的行業越多,覆寫的客戶越多,我們就會發現光靠我們無法服務好每個場景。比如制造業,流程制造、精益制造、光伏制造等涉及到多個領域。是以釘釘逐漸智能化,做有差異化的AI平台,把平台能力和差異化的場景開放出來,希望有更多的創作者去建構屬于他們場景的助理。”子推說。

過去一年,釘釘AI産品經曆了從“+AI”到“AI+”的過程,接入通義大模型,把釘釘自身場景進行智能改造,文檔、音視訊、日程等全面接入AI,利用AI特性進行更新。

随後釘釘意識到,僅僅滿足釘釘原生場景是不夠的,釘釘上有大量垂直領域的客戶和産品,除了AI、協同能力的加持之外,還存在很多業務場景的需求,基于釘釘底座開放能力基礎延展的AI PaaS誕生。

緊接着釘釘于今年1月推出 AI 助理産品,并在4月18日正式上線 AI 助理市場(AI Agent Store),企業和個人使用者可以在市場裡找到自己需要的AI Agent,也可以動手開發專屬于自己的AI Agent,釘釘AI助理進入到了量産階段。

“隻有客戶才知道什麼樣的智能化加持對自己的業務最好,在成本、收益、人員,包括組織形态的配合上等方面綜合考量。比如能力比較強、數字化意識比較好的客戶,酷應用加AI Agent更具創造力;在低成本改造的特定場景,并且有很多老舊的系統,AI inside加RPA同樣是很好的解決方案。”子推表示。

未來不同的使用者可以選擇不同的解決方案,但是都能夠得到AI本身能力的加持,這是平台所樂見的一種狀态,如果想用大模型把所有系統再做一遍,這可能是未來十年甚至二十年周期的事。

在AI Agent的目前周期,樂觀主義者和悲觀主義者皆有,釘釘希望做AI Agent的實用主義者,從具體場景開始,讓AI Agent開始進入千行百業。

(本文首發钛媒體App)

繼續閱讀