天天看點

OpenAI翁麗蓮的Agent公式,一定是正确的嗎?

作者:量子位

衡宇 發自 凹非寺

量子位 | 公衆号 QbitAI

2024年了,被寄予厚望的AI Agent,到底是誰在用啊?!

它被視作通向AGI最有可能的路徑之一,國内外公司都研究得火熱,雖然似乎一切隻是“押注”,但據我們所知,有不少toB領域已經喜提Agent了。

OpenAI翁麗蓮的Agent公式,一定是正确的嗎?

為什麼是toB領域先用上?量子位詢問了一位創業者,他所創立的AI Agent公司正在為toB領域的許多場景提供服務。

AI Agent可以被視作管理者跟基礎員工、專家跟基礎員工,員工與員工之間的連接配接器,能夠填充企業想做數字化轉型時,所面臨的人和系統之間的空間。

同時他也提到,受目前技術所限,AI Agent不僅需要和一些傳統技術,比如搜尋規則引擎、知識圖譜等進行組合。

更重要的是,Agent必須要知道自己在什麼樣的環境、什麼樣的場景下能夠起作用。

恰巧,這位創業者——瀾碼科技創始人兼CEO周健,剛剛在上海正式釋出了團隊自主研發的AI Agent平台AskXBOT。

我們決定以這個平台為一個案例,來個順藤摸瓜,好好探一探Agent現在的進展。

Agent平台AskXBOT

瀾碼AskXBOT的自我定義,是一個AI Agent平台。

再詳細展開一點,AskXBOT是基于大語言模型的Agent與工作流設計、開發、使用、管理、知識沉澱的一站式平台。

從整體結構來看,AskXBOT的設計并不繁瑣,它主要由四個部分組成,分别是設計器、使用器、管理平台以及知識中心,為企業提供文檔檢索、AI調用、資料查詢、智能程式設計等基礎能力。

OpenAI翁麗蓮的Agent公式,一定是正确的嗎?

設計器用于建立和管理AI Agent。在這裡,使用者可以通過拖、拉、拽的無代碼方式,設計和配置所需的AI Agent的模版,即使是沒有技術背景,不會寫代碼的使用者,也能輕松建立符合要求的Agent。

使用器則是提供使用者和Agent互動的界面,在這裡,使用者可以和Agent對話,讓Agent擷取資訊,進而進一步執行任務。

顧名思義,管理平台的主要功能是提供監管工具,包括權限控制、性能監控、日志分析等,用這些功能確定Agent的運作安全、穩定,并在使用者回報的基礎上持續優化。

而用來沉澱群組織知識資産的知識中心,被瀾碼科技視為核心差異化子產品。專家可以把知識和經驗輸入知識中心,被Agent學習後使用,以提供更準确的服務和響應。

OpenAI翁麗蓮的Agent公式,一定是正确的嗎?

實際工作中,專家使用者的資料分析流程步驟和分析都非常豐富,理論上而言,專家可以把分析過程資料儲存下來,做一個SOP(标準作業程式)。

那麼,其他所有的中級或初級的業務人員,在不用對專家核心知識死記硬背的時候,就能把相應的标準操作分析過程重複一遍。

“任何一個專家,一天也隻能提供24小時的智力和勞動力,不可能無限擴張。”周健舉了個非常容易了解的例子,那就是現在用大模型能力,利用Agent,隻要加算力,專家的經驗知識就能夠被複制。

這麼來算的話,如果有30塊顯示卡,一個專家的能力就能提供720小時不間斷的服務。

于是就能了解周健堅信的,“如果沒有專家把知識數字化下來, 那麼AI Agent的落地會有很大的困難”。

而為了讓Agent更好地落地,絲滑運用到各行各業,瀾碼團隊提出了三步走的AI Agent建構法則:

第一步,專家知識數字化;

第二步,基于CUI(對話式使用者互動界面)的柔性互動;

第三步,領域知識的循環沉澱。

OpenAI翁麗蓮的Agent公式,一定是正确的嗎?

2023年被普遍認為是大模型元年,而剛剛開始的2024年,則期望能大幅度拉開Agent發展的序幕。

周健表示,實際上瀾碼現在的設計思路,就是希望能夠實作把Agent本身當成是一種生産力。

目前,AskXBOT已經有教育、人力資源、銀行、國央企等許多合作客戶。

拿人力獵頭行業為例,北京人力華明科技公司、CGL等都是瀾碼AskXBOT的使用者。

在與CGL的合作中,瀾碼在其原有的獵頭顧問系統中做了一個Copilot,讓顧問不但能夠高效地篩選、聯系候選人,還能做一些原本不能完成的事情。

CGL進階副總裁郭雁冰表示,在實操中,專家作用遠遠超過資料,是以必須在專家知識上下功夫,做出能夠模拟專家行為的Agent。

周健也希望能在下一個版本,讓Agent擁有初步擁有對人才進行選、育、用、留的功能。

“Agent的落地速度比想象中更慢”

“讓Agent有選、育、用、留功能,我們離可用技術實作這個階段還有多遠?”

“兩年時間吧。”

打破砂鍋問到底,我們終于知道了“2年”這個數是怎麼被估算出來的。

周健的判斷标準首先來自OpenAI。OpenAI在GPT-4問世時曾經提過,如果兩年内有企業做AGI能做得比它強,它就會投降,并把知道的所有的方法告訴赢家。

憧憬一下,如果OpenAI突然祭出GPT-5,那時候在它基礎上搭建一個AI Agent,是多麼爽的一件事(doge)。

OpenAI翁麗蓮的Agent公式,一定是正确的嗎?

言歸正傳,現在離OpenAI的兩年之約已經過去了一年,而周健自己判斷2024年不管國内還是矽谷,都是AI大模型落地的元年,再往後一年的2025年,因為有落地案例,看到友商或者其他賽道有人已經落地,并且通過AI競争大大增收,是以其他廠商肯定會跟進。

“這樣的環境,再疊加GPT-5,是以我認為2025年肯定爆發,可能能真的用起來了。”周健笑道。

聽起來,周健對未來預期的一切頗有底氣,但是當話鋒從未來兩年轉回過去一年時,他的态度是這樣的——

現在年底往前看,大家落地的程度是比我年初想象中的判斷要慢。

2023年3月,差不多是周健剛剛創業的時間,OpenAI釋出ChatGPT Plugin,愁得他一宿沒睡,滿腦子都是“vocal,我要做的事情GPT做了怎麼辦?”

但是時間來到11月份,GPTs亮相的時候,周健自稱這時候心态是了然于胸的、不慌不忙的。

原因隻有一個,就是拜讀3月轟動一時的論文《Sparks of Arti cial General Intelligence: Early experiments with GPT-4》後,周健當時的判斷是GPT-4能夠通用寫50行到100行代碼,“這其實是很可怕的,因為一個程式員一天大概也就寫100行代碼,那麼GPT-4就能夠代替一個程式員一天的工作量。”

基于這個設定,當時的周健很激進地認為,各個軟體應該能夠立刻馬上原地被AI賦能,2023年年内就會開啟淘汰賽,自己和團隊的機會在比賽剛開始時就被大模型橫掃了。

OpenAI翁麗蓮的Agent公式,一定是正确的嗎?

然而,後期團隊與辦公軟體的合作過程,越做越讓周健發現了一些不對勁:

通用寫50行到100行代碼這個預估,一下子把我忽悠瘸了。後面再認真仔細看GPT-4的論文,其實它大概也隻能寫2-3行代碼,差距有十倍。

如果能力最強的GPT-4能寫50-100行代碼,那人類可能不剩下啥機會了。

但如果它隻能寫3、5行代碼,你還基于它去做計劃,那能做的任務決策的複雜度是十分受限的。

在正确看到真人程式員和GPT-4的差距,并且對算力有正确的認知後,瀾碼提供的私有化部署服務,就逐漸轉變為小模型、大模型協同,加上作為入口的Root,把任務拆解出來,用不同的算力、調用不同的模型來解決這個問題。

翁麗蓮的Agent公式是正确的嗎?

所有關注Agent的人,幾乎都見過OpenAI華人科學家翁麗蓮給出的Agent配方:

Agent=大模型+記憶+主動規劃+工具使用

OpenAI翁麗蓮的Agent公式,一定是正确的嗎?

曾幾何時,周健也把這個Agent配方奉為圭臬,但随着瀾碼在AI Agent領域的實踐增加,他有了略帶不同的思考。

“現在大家一直在講的具身智能、AI Agent、未來AGI,都是有能力和實際環境進行互動的。”周健向我們闡述了他的新觀點新看法,他越來越覺得,Agent最重要的能力是和環境的互動能力。

當然了,工具使用可能還好,主動規劃和常識記憶仍然是核心點,但最具有差異的點,可能是在于Agent能否與環境互動(interaction with environment),在于AI有沒有探索環境的能力。

周健表達自己的觀點,“如果它對環境沒有感覺,我覺得就不能叫Agent”。反過來說,能意識到環境是什麼樣,有哪些可被調用的工具,能去發現、去探索,這個能力很重要。

從這個角度來看,翁麗蓮給出的配方,在周健心中更像是“現階段妥協于技術限制的Agent”。

在周健這位AI Agent踐行者眼中,是需要有一個Master Agent進行任務分發——當然,前提一定是對環境有感覺,才能進行接下來的探索。

如果要到人機融身、人機融合或者說人機共生的地步,它(Agent)一定是需要自己能夠感覺環境的。

再視這個環境的大小,可以慢慢提升能力,最後回到Yann LeCun提到的世界模型。

當然了,比較遺憾的是,上述想法是周健和瀾碼團隊近期才逐漸琢磨出來的一個新的探究中心,在AskXBOT中并沒有相應的設定和展現。

不過2024就在面前,在Agent的當打之年,Agent本身除了團隊、數量節節攀升以外,或許能力也能湧現一波、突破一波?

— 完 —

量子位 QbitAI · 頭條号簽約

關注我們,第一時間獲知前沿科技動态

繼續閱讀