天天看點

對話AI探索者 | 大模型如軍備競賽般的“狂飙”,完全無法停下來

對話AI探索者 | 大模型如軍備競賽般的“狂飙”,完全無法停下來

AI未來指北

2024-04-26 09:40釋出于河北騰訊科技AI未來指北官方賬号

對話AI探索者 | 大模型如軍備競賽般的“狂飙”,完全無法停下來

騰訊科技AI未來指北-AI探索者系列,對談AI産業的躬身入局者,關注AI大模型落地第一程的關鍵問題。本期聯合騰訊研究院,對談瀾碼科技創始人周健,關注大模型落地B端的關鍵思考。

文/騰訊科技 郭曉靜

大模型的競争進入下一程,關注焦點轉移到如何找到真正的場景、如何落地應用。

對行業來說,至今這還是一個迷局,所有人都在思考、都在積極讨論,但是現在全世界都沒有拿出比較完美的答案。

在這個難解的問題面前,我們試圖向前尋找,上一波CV(Computer Vision)的爆發到産業的發展,能給今天的大模型發展,帶來什麼經驗。

我們也試圖從現實中找答案,大模型技術将如何收斂,具有通用技能的大模型究竟能給每個人帶來哪些收益。

在這個背景下,騰訊科技對話了瀾碼科技創始人周健。他是一位連續創業者,作為依圖10号員工,幾乎完整經曆了CV産業的發展,擔任過弘玑RPA(Robotic Process Automation,即機器人流程自動化)公司CTO。

2023年再次創業,在行業的大部分資源都投入到基礎模型的時候,這位創業經驗豐富的“老炮”直接選擇做應用,“大模型這場戰争,我目前看不到任何即将結束的迹象,也看不出何時能夠結束。畢竟做企業的本質是要盈利的,不是要燒錢的,對吧?

是以從戰略的角度來講,雖然做模型看起來很風光,估值可以很高、可以被很多“錢”關注,但是實際上狂飙停不下來。”

行業的狂飙,帶來了“百模大戰”,這就意味着,應用層其實面臨很多選擇。當大模型從火爆吸睛的性感概念開始走入需要賺錢落地的商業場景,“混搭模型”成為了很多企業的選擇,針對不同的場景選擇不同模型,混搭出一套成本效益和效率最高的“模型解決”方案。

周健定位,瀾碼是“模型中立”的廠商。大模型廠商可以推出基于自己品牌的各種模型産品。而“模型中立”的選擇權更多,不僅可以選擇多種模型,也可以選擇多種品牌,但情況也會更複雜。

這是一個機遇,但是同時也面臨很多現實挑戰:“模型廠商在釋出模型的時候,僅定義參數,未對模型的具體特性參數(Feature List)進行定義。”

這就意味着,在比對真實場景的時候,“模型中立”的廠商可能面臨盲人摸象的困境。需要基于經驗不斷進行比對和調試。這對于過往的行業經驗就尤為重要,比如領域知識庫,還比如,在産品角色的層面,設定兩層關鍵團隊,一層為業務專家,拆解業務場景和工作流;一層為産品專家,将場景比對到真正的模型落地中。

從CV這樣的窄向型技術到大語言模型這樣的通用型技術,在TOB的商業化路徑上其實有變也有不變。TOB業務甲方話語權高,産業鍊條長,個性化程度高、傳遞重,即使是新技術爆發,這些行業痛點也依然存在。但是大語言模型的通用性,确實讓“模型中立”的廠商有了不錯的機遇,且和模型廠商不同,不燒錢,可以壓力比較小地試錯。

在大模型公司還未形成清晰的行業标準及産品定義的标準時,“模型中立”廠商的試錯經驗也是行業急需。但是,大模型應用層的公司,也一直都在面臨一個問題,号稱不碰應用的模型公司,如果最終碰了應用,模型技術有通用性、模型公司有更大量的資料和更強的實力,那應用層是否還有足夠深的護城河?

帶着這些問題,我們和周健進行了深度對話,他的精彩觀點如下:

  • 1

    大模型軍備競賽般的“狂飙”還沒有結束的迹象,創業選擇中間層,戰略位置可能更好。

  • 2

    CV(Computer Vision)其實是一個窄向型的技術,有些行業和場景不能覆寫;大模型是通用性技術,能力夠強之後,可以适用于所有場景。

  • 3

    現在很多企業的需求是模型混搭,這對于模型中立的廠商是一個機遇,讓多個模型能力內建在原有的工作流或代碼體系中是核心能力。

  • 4

    大模型科研場景和商業場景不一樣,商業落地肯定是先要對大模型的能力邊界和品類進行定義;現在模型廠商對釋出的産品都沒有詳細的Feature list(特性清單)。

  • 5

    我不擔心AI統治人類的事情,而更擔心因為人類的粗心,或指令的錯誤,帶來系統性的災難。

對話AI探索者 | 大模型如軍備競賽般的“狂飙”,完全無法停下來

以下為對話内容精編:

一、大模型的産業機會遠超CV

騰訊科技:去年創業,一上來就做應用的公司很少,畢竟基礎模型的能力還不成熟,你為什麼不做模型呢?

周健:OpenAI在2023年4月份拿到100億美金的融資之後,基本從戰略上來講,直接做大模型肯定是不成立了。因為是連續創業者是以其實對競争格局的整個延展線還是有判斷的。當時比較容易能想到,普通創業公司做到GPT-4,基本就會放棄競争。大廠肯定還會繼續競争,繼續在GPT-4.5水準往上競争。

就像德州撲克,創業公司面前的籌碼肯定是少的。而且當你獲得一筆大的融資之後,在某些程度上是被資本“裹挾”的。很多時候需要按照投資人的要求、當時的市場,去做一些規定的動作。

另外,資本不會押注一方,當有了第一名,肯定也會捧出第二名、第三名,在這樣激烈競争的賽道上,你很難有時間視窗去進行組織能力建設。大模型這場戰争,我目前看不到任何即将結束的迹象,也看不出何時能夠結束。畢竟做企業的本質是要盈利的,不是要燒錢的,對吧?

是以從戰略的角度來講,雖然做大語言模型看起來很風光,估值可以很高、可以被很多“錢”關注,做很多事情,但是實際上“狂飙”停不下來。

我們現在選的定位,也有很大的挑戰,比如可能資本不關注。但是從生态定位的角度來講,大模型廠商在競争越來越激烈之後,使得它必須去開源部分模型,在商業上是有可能被我們中間層的公司利用到。從生意的角度來講,我覺得我們的位置可能更好。

騰訊科技:模型公司也都在向上探索應用,不擔心主營業務落在模型公司的延展線上,被模型公司“吃掉”嗎?

周健:你是指C端嗎?

騰訊科技:模型公司其實B端、C端都在做。

周健:我覺得不會,赢者通吃的super APP(超級應用)我覺得短時間内是不會出現的。首先是B端,曆史上都沒有過。B端主要是成本因素,你不能整個企業都雇“愛因斯坦”。

C端是大廠的機會,移動網際網路這一波,包括一些打車平台,其實都被大廠裹挾着打了一場資本的戰鬥。也許大模型廠商未來能做出來,但是如果做應用層,C端很容易被“吃掉”,因為大廠的資源是你的數百倍。

另外,我們回憶移動網際網路2008年興起,而iPhone4差不多到2012年才出現,位元組跳動是2012年才成立。移動端最初有個遊戲是切水果,是因為觸摸屏讓互動方式發生了改變,最直覺的就是切水果。現在大家很少玩切水果了,因為後來更多創新要素的組合,讓體驗更好。

現在大模型也是一樣,太早期,當基礎設施成本沒有降下來、互動設計還在摸索的時候,super APP還不太可能成立。

另外就是,現在的創業公司,還有過去的路徑依賴,可能未來兩三年之後創辦的公司更有希望做出super APP。

騰訊科技:你也是完整經曆了AI領域上一波CV(Computer Vision)的創業潮的,這兩波浪潮有什麼不同?

周健:CV其實是一個窄向型的技術,在各個行業中是點狀的。随着技術的演進,你可以解鎖新場景,比如一開始隻能做身份證比對,到後來可以做人臉閘機。一個技術領先的公司,在商業競争中,就有可能用高毛利來換銷售網絡。但是它的問題是,場景在安防行業有,但是在金融中就沒有。

對話AI探索者 | 大模型如軍備競賽般的“狂飙”,完全無法停下來

但是大語言模型是一個通用性的技術,它跟某個細分行業的關聯性沒那麼強,但是通過自然語言,把技術門檻降到很低。比如過去我們處理履歷,你要看他的離職時間、過往經曆等等,成本極高,因為履歷是五花八門的。但是用了大語言模型的技術,可能就隻是一個禮拜工作量的提示詞工程,就可以搞定了。

技術在各行各業都能通用,這就打開了想象空間。之前像RPA(Robotic Process Automation,機器人流程自動化)技術,很快就達到了“天花闆”,沒有辦法讓它更高、更快、更強;CV是有一個發展周期,三、五年持續進化的時間。

騰訊科技:CV那一波走出的“四小龍”,其實作在的增長也面臨瓶頸。他們在這一波還有競争優勢嗎?

周健:完全不同的技術。如果他們的認知範式不改變的話,就會很被動。

騰訊科技:我們看到他們中也有公司在積極布局模型。

周健:确實是在做。但是對于一家企業來講,當它已經長到現在的規模,一年的收入三十億左右。當面臨一個巨大的技術變革的時候,又需要保持增長,要不然很難向股東交待。另外技術變革需要巨大的投入,目前的收入規模又不能支援拿出幾個億去做新技術的轉型,是以還是十分困難的。

做新的技術也意味着新的風險,以前已經走到了PMF(Product Market Fit)的階段,今天突然一個新的技術,怎麼能不把自己已經有的優勢颠覆掉。就算谷歌,也一樣面臨這樣的問題。這也是我們常說的創新者的窘境,變革挺難的。

創業公司的優勢就在于,你的可能性很多,如果賭對了,就可以迅速往前走。

二、“模型中立”的機遇

騰訊科技:如果僅做應用層,推理的算力成本有計算嗎?

周健:确實訓練的算力基本完全省掉了,基本上是在做微調。邏輯是,先用GPT去驗證客戶場景的可行性,然後再做私有化部署,再用開源的小模型13B,最多用到70B,去确認在私有化部署中是否能用。

但是基于目前的現狀來看,降本還是不太現實,可能今天應該優先做的還是增收或合規,可能效率會更高。

以瀾碼的一個保險客戶為例,以前保險代理隻能通過盲打電話推銷新的保險産品,成功率非常低。現在這家公司的保險代理可以根據體檢情況生成的個性化保險産品推薦,去推薦給對應的體檢客戶,并且推薦的産品也符合他的健康情況,進而可以大大提高銷售轉化率。

騰訊科技:ToB業務在國内鍊條長、個性化高、服務重,你們通過大模型技術,搭建AI Agent平台,是否能從根本上讓ToB的生意更輕、更好做?

周健:确實是大模型來了之後,因為它的通用性,使得個性化定制的成本大大降低了。我們隻需要把工作流中必備的知識定義好,在跟你對話的過程中動态生成表單、代碼,這可能是原來最需要個性化的部分。

過去很大程度是人适應機器,現在的大模型讓機器能夠适應人。機器在跟人互動的時候,其實是能夠越來越智能,那麼就會使得個性化定制成本越來越低。

騰訊科技:能舉例一下,具體怎麼做嗎?

周健:我們現在的定位是模型中立的廠商。企業落地AI應用,第一個核心的問題就是他需要去選擇模型。

很多企業的需求甚至是混搭模型,讓多個模型能力內建在原有的工作流或代碼體系中,我覺得這是我們目前最核心的能力。

其實從核心上講,我們自己定位的中間層,實際上未來應該是一套開發架構。形象一點說,就好像是在銀行保險櫃裡面,各個客戶都有自己的特殊需求,會基于我們的平台,基于我們已經沉澱的知識資料,更容易的去搭建應用。

騰訊科技:未來的核心競争力是各領域的知識庫積累嗎?

周健:我覺得現狀是我們有AI能力和客戶關系。拿下标杆案例之後,下一個壁壘肯定是領域資料。

我們現在做數字員工,其實是希望它能夠自主去決定下一個action是什麼。現在主要是缺資料,難點在于如何去定義action的種類。

騰訊科技:太個性化了?

周健:其實也還好,在企業中,某些職位如财務和人力資源(HR)可能并不需要像人們想象的那樣複雜的技能水準。以财務為例,财務員工能夠完成的任務種類實際上是有限制的。例如,财務共享中心的成立使得一位位于羅馬尼亞或大連的員工可以為一家全球500強公司處理财務事務,包括審批票據和進行面試。這表明,這些工作并沒有想象中那麼困難,已經可以實作自動化、變得像機器人一樣高效。

中國的管理标準化在過去可能做得不夠好,導緻在某些方面落後于國際标準。然而,國外在八、九十年代經曆了一場管理流程标準化的浪潮,這使得企業内部流程的标準化工作已經取得了顯著進展。

未來的關鍵在于建構起一個有效的世界模型,将所有可能的選項列舉出來,這樣就能簡化決策過程,使得原本看似複雜的問題變得不那麼困難。

對話AI探索者 | 大模型如軍備競賽般的“狂飙”,完全無法停下來

騰訊科技:“工具人”的競争力是不是會急劇下降?

周健:在遊戲行業中,制圖師和軟體外包公司的初級至中級軟體工程師的職位已經受到了自動化技術的沖擊。

目前,盡管還沒有完全實作,但已經出現了一種趨勢:當一個公司的分工非常細緻時,比如外包工程師或制圖師的崗位,如果該崗位有超過100名員工,你并不需要一個人在所有方面都做得最好。實際上,隻要某個員工在30%的方面能比他人做得更好,就足以取代其他30人的工作。

這種邏輯正在逐漸成為現實,盡管目前技術尚未完全成熟,使得這種變化還不是很明顯。然而,我對于GPT-5的釋出持有一種複雜的心情,既期待又有些敬畏,因為我認為它将帶來巨大的變化。

騰訊科技:你覺得今年GPT-5會釋出嗎?

周健:會啊,OpenAI釋出GPT-5的動力應該是大的,因為競争對手已經追上了。

騰訊科技:大模型如果作為Agent,其實是需要多任務處理的,但是比如以手機為場景,很難去打通各個APP,在toB領域也會面臨這樣的難點嗎?

周健:我覺得會,ToB市場,像釘釘、企業微信和飛書這樣的辦公協作平台都在激烈競争。然而,這些平台在獨立營運時,面臨着與手機廠商和應用開發商之間的相似問題。手機廠商希望像蘋果那樣實作全面控制,提供完全打通的使用者體驗。但與此同時,不同的應用可能并不願意完全融入手機廠商的生态系統中。

從曆史發展的角度來看,自2008年iPhone首次釋出以來,到了2013年或2014年,打車、團購大戰開始激烈,這場競争大約持續了五、六年。

以此類推,考慮到2022年年底ChatGPT釋出,我們可以預見到2026年可能會出現一些競争,而到了2027年,這些競争或沖突可能會變得更加明顯或常态化。

騰訊科技:未來的選擇權在平台還是使用者?

周健:實際上最終使用者還是會買硬體,就像你的筆記本電腦、手機、或者新的硬體都會有一個助手出現,隻是服務于跨裝置、跨APP的超級助手,或者說最有話語權的是誰,可能還沒辦法預測,我覺得大概2-3年開始有有實力的競争者出來。

三、誰來定義大模型的“産品特性”

騰訊科技:從現在的AI手機和AIPC中沒有看到什麼苗頭嗎?

周健:現在太早了,還是概念階段。

現在主要是硬體需要準備好了,比如最近蘋果說M4晶片是為AI做的。

騰訊科技:目前的硬體廠商已經說能支援7B、13B的模型在端側運作了,是以現在的阻礙是不是已經不在硬體了?

周健:現在的問題在于13B的手機端側模型,對于我們這樣的to B Agent的廠商也是一樣的,任何一個模型廠商釋出一個産品,隻有模型的參數,這讓我們怎麼用呢?

現在是模型産品定義的第一關還沒過,第一關就是模型小型化之後,它的feature list究竟是什麼?怎樣定義這個模型産品是符合手機端、符合PC端?它有什麼基本能力?

這關過了之後,後面才到了我們到底需要再什麼手機上配什麼算力、裝什麼模型。

騰訊科技:現在看到廠商在定義,我用這個模型可以做圖檔消除、檔案管理等等。

周健:這件事兒不應該是手機廠商去做。

手機廠商沒法定義,他們定義完,模型廠商做不到,這怎麼辦?或者說這确實是先有蛋還是先有雞的問題。先不談手機,先談部署在雲端的模型,13B、33B、130B,他們的邊界是什麼?什麼場景應該用什麼模型?這些都還沒有。

可能我們作為TOB的企業,已經突破了很多場景,但是這些場景拿出來之後,有沒有模型廠商可以給出一個特定的feature list?更不要說端側了,因為要把端到端的應用跑通就更難了。

TOB服務還可以說我用目前性能最強的服務先驗證一下。端側如何驗證呢?我覺得可能需要我們的這樣的廠商先和模型廠商對齊。

商業上其實和學術上很不一樣,商業上肯定是先要對大模型的能力邊界和品類進行定義,到底有哪些大的品類,每個品類的能力邊界是什麼,這些基本問題,模型廠商需要首先回答出來。

騰訊科技:大模型的品類指的是什麼?比如某種能力突出,長文本算嗎?

周健:一個feature的定義,是市場上大家一起去決定的。現在最小的模型算力可能隻需要一張4090消費級顯示卡,大一些的模型,從推理上來講,可能要100張A800顯示卡。算力差100倍的情況下,肯定要分成不同的品類。比如一件普通的T恤和一件奢侈品,價格就可以從幾十塊到幾萬塊,但是你可以給這個定價一個理由。

但是如果模型的商品定義體系不出現的話,其實商業化落地是沒有辦法疊代的。

騰訊科技:大模型技術文檔定義的參數,對你們來說是沒有太大價值嗎?

周健:關系不大,我們買的是衣服,不關心制作流程。

騰訊科技:這事兒未來要誰來做?

周健:肯定是大模型廠商。現在還是“亂哄哄”的,包括現在釋出出來的各個應用場景的落地的成本計算也沒有變成共識,如果慢慢變成共識了,整個生态就開始轉起來了。

騰訊科技:大模型落地應用這件事其實大家都還沒想清楚。

周健:應該在什麼場景落地大模型的應用,現在實際上大家是抓狂的。

我們自己的探索是,如剛剛提到的,大模型的個性化定制成本低、語言了解能力強,可以解鎖一些傳統做不了的新場景。比如之前中小企業的信貸稽核,靠AI是做不了的,或者原來做起品質很差;比如保險代理,過去也是做不到的。

我們其實是通過AI Agent加上知識庫,解放專家的時間,變成新的生産力。過去領域專家時間的供給是一個瓶頸,現在可以通過AI去突破這個瓶頸,原來不能做或者不能批量做的事情現在就能做了。

我覺得和大家了解的不一樣,大模型能帶來的收益首先不是降本增效,更多的是增收和合規。降本增效更容易一些,TOB的企業優先想做的肯定是增收和合規。

對話AI探索者 | 大模型如軍備競賽般的“狂飙”,完全無法停下來

騰訊科技:AI Agent能類比移動網際網路時代的APP嗎?

周健:Agent最重要的事情是它和環境之間的互動,其實就有兩條邊,一條邊是從環境中感覺,另外一條邊能産生Plan,然後做出行動去執行。

它不是APP,今天我們看到其實更多是在原有的APP上增加了AI能力,比如說今天任何一個應用,都可以通過自然語言的對話,來發出指令。這不是Agent。

Agent重要的是要和環境感覺互動,剛剛說的那種,隻是傳統軟體的AI化。

騰訊科技:創業公司巨大的機會是挖掘這些加AI的需求嗎?

周健:巨大的機會肯定不在這兒,傳統軟體加AI是傳統軟體可以去做的。巨大的機會在AI原生的應用。

在Agent的生态中,已有軟體都可以作為Agent感覺環境的一個元件。其實我們不是和傳統軟體競争,而是賦能傳統軟體,成為下一代的入口。

比如我們做數字員工,我們把員工的意圖識别成專業知識庫,拆到原有應用中。其實AI原生應用是全新的品類,它站的生态位置是人跟系統的中間又多了一層。它會代理人的意圖,拆解計劃并完成工作。這個工作可以是操作各種各樣的系統。

是以這個意義上來講,AI原生完全是全新的機會,跟傳統軟體、APP沒關系。這是一片新大陸,具體在哪裡,還得再探索。

騰訊科技:但是聽起來,未來的AI Agent還是很需要傳統軟體?

周健:需要的。我們的假設不是沒有資訊化,資訊化是數字化的前提,數字化是AI化的前提,我們的前提是前面已經數字化好了,如果是沒有數字化,比如說像獵頭行業、律所行業,因為他們沒有資訊化,沒有數字化,這個就很困難。

騰訊科技:過去其實企業數字化的推動就很難,這會成為TOB落地AI的阻礙嗎?

周健:其實很多大企業的決心挺大,基礎設施都準備好了,但是落地的場景沒有找到。這部分的需求還是挺大的。

騰訊科技:那對于你們公司的産品經理來說,是不是還需要了解每個特定行業的工作流?

周健:對,他自己也要是業務專家,沒有靠譜的業務專家是做不到的。但是會有兩層,一層是業務的産品經理,比如銀行、保險、券商、能源,他一定要了解行業。

另外一層是做平台的,不需要特别了解業務,但是需要通過定義好的能力文檔、資料流程來做産品。

騰訊科技:未來企業的工作流程會發生怎樣的改變?

周健:現在其實是人跟人之間的分工協作,會有很多資訊的斷點、資料的斷點、知識的斷點,這是人的帶寬所造成的。

比如從管理學上講,人的帶寬最多隻能關注到7-15個人。随着大模型的不斷演進,大模型的記憶能力會越來越好,其實這就會把流程上的斷點幫助填進去。

企業最重要的是放大競争優勢,而不是補上短闆。競争優勢一定是一線和背景的通力配合,“讓一線能夠聽見炮火的人呼喚炮火”,但是傳遞資訊的帶寬有限,可能背景專家收不到這個資訊。

但是如果每個員工都有一個Agent,既可以把一線情況不丢失地帶到後方;後方的決策又能直接傳到一線的各個地方。

騰訊科技:那實際上是幫助人提高帶寬,未來人的核心能力又變得更大了?

周健:人主要知道該做什麼,去下達任務。今天的AI實際上還有一個很大的瓶頸,沒有内部的世界模型,并不能自我學習。

現在人類做決策很大程度是靠直覺,就是我們能自動找到相關性,在我過去的經驗中,有哪些事情相關、當時我采取了什麼辦法來解決這問題。這是我短期之内看不到AI可以去替代的。

目前的Scaling law路線其實還是蠻力,未來全世界的能源都不夠AGI用的,是以我覺得這條路是有瓶頸的。從過去的規律來講,人不是被設計出來的,而是慢慢進化來的,進化才是最強的力量。

是以短期看不到AI對人類的替代,但是我們要學會怎麼去擁抱它,變成新的勞動者。知道它的能力邊界在哪裡,在未來的職場中占據一個好的位置。

騰訊科技:人類的基礎科學還是像煙囪一樣,沒有融合和打通?

周健:對,曆史上出現過做量化投資的公司,因為一個程式Bug導緻這個公司破産。我覺得現在倒是不用擔心AI統治人類的事情,而是因為人類的粗心,或指令的錯誤,帶來系統性的災難。這個可能是最值得擔心的事兒。

檢視原圖 430K

  • 對話AI探索者 | 大模型如軍備競賽般的“狂飙”,完全無法停下來
  • 對話AI探索者 | 大模型如軍備競賽般的“狂飙”,完全無法停下來
  • 對話AI探索者 | 大模型如軍備競賽般的“狂飙”,完全無法停下來
  • 對話AI探索者 | 大模型如軍備競賽般的“狂飙”,完全無法停下來
  • 對話AI探索者 | 大模型如軍備競賽般的“狂飙”,完全無法停下來

繼續閱讀