天天看點

李開複:中國大模型公司沒有美國大廠的GPU數量,要采取更務實的戰略

李開複:中國大模型公司沒有美國大廠的GPU數量,要采取更務實的戰略

AI未來指北

2024-05-13 14:38釋出于北京騰訊科技AI未來指北官方賬号

李開複:中國大模型公司沒有美國大廠的GPU數量,要采取更務實的戰略

文 / 騰訊科技 郭曉靜

進入2024年,大模型競争已經進入一個新的階段,行業已經從“模型能力秀肌肉”,到不僅關注模型能力的逐漸提升,而更強調商業生态、PMF及使用者的增長:從模型能力上看,GPT-4作為一個黃金名額,似乎已經成為模型公司可以探索後續應用的先決條件,如何有公信力地證明模型能力已經達到标準;另外,在未來的商業化道路上,究竟如何考慮開源和閉源?大模型提供的能力同質化,如何找到PMF和差異化競争優勢。這些問題都是擺在大模型公司面前最急需解決的問題。

5月13日,零一萬物在成立一周年,CEO李開複宣布了Yi-Large模型的釋出,并宣布将之前釋出的Yi-34B、Yi-9B/6B模型更新為Yi-1.5系列,每個版本均達到同尺寸中最佳性能。此外,零一萬物宣布了從應用到生态的産品線,包括2C生産力應用“萬知”和2B生态的“API開放平台”。李開複博士在釋出會上闡述了公司的雙軌大模型戰略,并提出了大模型賽道的發展方向。

李開複認為,大模型賽道的發展将取決于如何有效實作技術、産品、市場和成本的契合。大模型的訓練和服務成本高昂,算力緊缺是行業面臨的共同挑戰。他呼籲行業避免不理性的燒錢模式,以實作大模型的健康良性發展。

在這次釋出會上,李開複也首次深談了對未來AI商業生态發展的判斷,他認為在移動網際網路的鼎盛時期,PMF(Product-Market Fit,産品市場契合)曾是衆多初創企業追求的核心目标。然而,随着大語言模型成為新的創業焦點,僅僅追求産品與市場契合遠遠不夠。

兩個時代在創業基礎設施層面存在着決定性的差異——在移動網際網路時代,使用者規模增長所帶來的邊際成本很低,但是在大模型時代,模型訓練和推理成本構成了每一個創業公司必須要面臨的增長陷阱。使用者增長需要優質的應用,而優質應用離不開強大的基座模型,強大基座模型的背後往往是高昂的訓練成本,接着還需要考慮随使用者規模增長的推理成本。這一普惠點如何達成、何時到來變得越發難以捉摸。

李開複:中國大模型公司沒有美國大廠的GPU數量,要采取更務實的戰略

李開複認為,PMF 這一概念已經不能完整定義以大模型為基礎的 AI-First 創業,應當引入 Technology(技術)與 Cost(成本)組成四維概念——TC-PMF。“做 Technology-Cost Product-Market-Fit(TC-PMF),技術成本 X 産品市場契合度,尤其推理成本下降是個‘移動目标’,這比傳統 PMF 難上一百倍。”

随着高性能計算硬體的疊代和模型優化技術的普及,大模型推理成本的大幅度下降已經成為可預見的趨勢所在。在普惠點終将到來的前提下,能夠率先察覺、并達到 TC-PMF 這一普惠點的玩家無疑會占盡先機。要做到這一點,模型、AI Infra、應用這“三位一體” 的優異能力缺一不可。基于此,零一萬物提出了 “模基共建”、“模應一體”列為公司的頂層核心戰略。

一、模型公司依托AI Infra能力走出增長陷阱

在國内大模型賽道向前狂奔的第一年,模型結構成為行業焦點,鮮少有人注意到 AI Infra 的重要性。

一個不容忽視的事實在于,中國大模型公司沒有美國大廠的GPU數量,是以必須采取更務實的戰術和戰略。AI Infra(AI Infrastructure  人工智能基礎架構技術)主要涵蓋大模型訓練和部署提供各種底層技術設施,在李開複博士看來,自研 AI Infra 是模型公司必然要走過的路,零一萬物也自成立起便将 AI Infra 設立為重要方向。

“第一年大模型行業在卷算法,第二年大家在卷算法 + Infra。在國外一線大廠,最高效訓練模型的方式是算法與 Infra 共建,不僅僅關注模型架構,而是從優化底層訓練方法出發。”零一萬物模型訓練負責人黃文灏表示,“這對大模型人才的知識能力提出了全新要求。”

目前來看,模型研究人員隻關注算法而忽視 AI Infra 是國内大模型行業現狀。零一萬物選擇模型團隊和 AI Infra 團隊高度共建,人數比為1比1。“我們要求做模型研究的人一定要‘往下沉澱’,具備工程能力。這也對齊我們倡導的 TC-PMF 的方法論。”黃文灏說。

據李開複在釋出會上介紹,多方面優化後,零一萬物千億參數模型的訓練成本同比降幅達一倍之多。

二、AI2.0将不再支援共享單車式的燒錢大戰

國内大模型領域陷入混戰的 2023 年初,各式各樣的評測榜單鋪天蓋地,跻身各大榜單 TOP 的模型不在少數。大模型進入第二年,行業進入更為現實的商業落地階段,客戶/使用者都會按照應用側所展現的能力,用腳投票。如何基于基座模型能力,盡可能提升應用效果,是追趕 TC-PMF 的重要課題。

“AI-First 不等于 AI Only,”零一萬物生産力産品負責人曹大鵬表示,“模型、工程、算法、産品要基于場景深度結合,模型長闆比對剛需高價值場景,建構AI-First 工作流,追求極緻體驗、一站式解決使用者問題,而不是單純秀模型能力肌肉,拿錘子找釘子。”

在零一萬物 API 平台負責人藍雨川看來,已經在海外充分得到商業模式驗證的 API 會是更好的選擇。作為标準化産品的 API 複用性更強,商業模式也更趨近于雲服務。比起 AI 1.0 定制化重傳遞的模式,API 能夠更快穿透千行百業。

去年9月開始,零一萬物便聚焦生産力、社交賽道于海外應用展開探索,已有 4 款産品陸續上線。據李開複介紹:“目前零一萬物海外生産力應用總使用者接近千萬,營收今年預期過億人民币,産品 ROI 為1,初步擺脫燒錢獲客,驗證了 AI-First 産品的使用者訂閱制商業模式。”

由于海外市場與國内市場在付費意願、市場環境方面存在差異,目前萬知采取限時免費模式。但據曹大鵬介紹,後續萬知會結合産品發展和使用者回報推出收費模式。

李開複表示:“TC-PMF 所帶來的 AI 普惠點終将來臨,這一次市場競争将不再支援共享單車式的燒錢大戰,采用以資金“跑馬圈地”商業模式的企業必然會率先力竭,冷靜判斷行業發展程序,腳踏實地打磨TC-PMF 才是更符合長期主義的路線。這場較量将包含模型、AI Infra、産品應用等三位一體多個方面。

李開複博士表示,ofo 式的補貼邏輯不再适用于 AI 2.0,希望大模型賽道的競争聚焦于達成 TC-PMF。

李開複:中國大模型公司沒有美國大廠的GPU數量,要采取更務實的戰略

三、訪談實錄,李開複談營收構成、行業演變及未來選擇

作為在大模型賽道探索一年的AI-First創業企業,李開複和他的團隊對未來的商業落地也有一些一線的思考,在釋出會現場,接受了包括騰訊科技在内的媒體的訪談,以下為訪談實錄:

Q:請問您對國産推理晶片的發展怎麼看?然後現在美國有很多新興的推理晶片創業公司,國産晶片有哪些機會?未來是否會考慮國産推理晶片?

李開複:國産的訓練晶片和推理晶片我們都要全力支援。

但是兩個差别是比較大的,訓練晶片還是有一定的難度。推理晶片的好處,一是它本身就比較簡單,第二它不需要那麼難的制造過程,是以我們對國産的AI推理晶片是看好的,我們也會在合适的時候去采用,我們在創新工場也一直在關注這方面的投資的機會。

Q:零一萬物最關注的市場回報和資料名額有哪些?大模型初創公司還有哪些獨立發展機會?

李開複:我們本身就是AI初創公司,從獨角獸做到了超級獨角獸,不可否認融了比較多的錢,有了豐富的算力,用剛剛我的同僚文灏的話說就是先追求GPU、其次考慮應用。我們認為我們可以走出比較适合我們的路,模式更務實一點。

我們是務實的API的信仰者,是以我們一定要用最少的晶片最低的成本訓練出我們能訓練最好的模型,同時我們會不斷的去摸索找TC-PMF。

我覺得國内的初創公司相對矽谷公司的一個差異,我們能夠仰望星空,也同時能夠腳踏實地。去考慮非常複雜的題目就是一方面要預測技術可以多快進步,然後我們能力所及産生什麼樣的模型。第二怎麼把推理成本做到最低。

第三當然還有PMF,這些都是國内的特色。因為如果大家談大模型的時候,往往會覺得說美國這方面論文寫得最多,人才密度最高,但是同時你要考慮到做一個偉大的大中型公司,它不隻是底層,底層當然不能差,答案是要能夠在世界第一梯隊,應用更重要。

怎麼開發、怎麼找到複雜的晶片,懂模型也懂應用的人在一起寫作,這是我們在矽谷的公司一般沒有看到的。

我們也不會用純大力出奇迹的思維一味地追求AGI。OpenAI有資格嘗試這條路,但這不是我們要走的道路。未來真正的價值一定是誰能打造AI時代的抖音、微信、淘寶。

AGI是夢想,但是你用夢想去指點一個公司的執行,而你又沒有這種财力去做一個超級大力出奇迹的事情,就是徒勞無功的。

Q:您之前說2024是AI應用爆發的元年,但是朱嘯虎說是2025年,這兩個時間有差别嗎?我們一定會迎來應用的爆發,但是爆發的臨界點是什麼?

李開複:我覺得朱嘯虎說的有他的道理,剛才我也提到一年降低10倍的推理成本,兩年100倍,是以有100倍推理成本的下降,就好像GDP的獲得能力,隻要今天1/100的價錢來做推理成本,很多應用肯定是可以爆發的。

但是我認為今年是元年,是因為我覺得有些領域今年就會爆發,爆發不是同時到來的。我覺得今年在生産力工具肯定會發生的,如果你看Office Copilot,雖然他不見得是AI,也已經非常多使用者在使用了,是以我覺得今年開始,明年會更大的爆發。

Q:開複老師,請問您提到的萬知海外一個億的營收構成是什麼?預期未來增幅怎樣?另外,看到現在很多CEO都在帶貨,您作為萬知的首席體驗官,也會帶貨嗎?

李開複:我先回答最後一個問題,我最近确實是開了短視訊賬号,但是不會直播帶貨賣東西,會和大家分享萬知,它是一個免費的産品,希望幫助大家把它用好。

另外,大家都知道我在AI方面寫了三本書,我一直建議大家要了解AI的重要性,無論為了孩子的教育,自己的工作等,我也希望能夠用我的短視訊賬号來做一個非常實誠的分享,然後讓大家了解怎麼去把這個工具用好,别隻看到會不會取代我們的工作。

關于收入方面,我們的海外産品采用了一種在軟體領域内可被視為健康的商業模式,即會員訂閱制。這種模式類似于國内視訊網站的會員服務,使用者一旦訂閱,如果滿意,下個月将自動續訂,我們提供月度和年度的訂閱選項。這種商業模式優于傳統的充值式或純廣告模式,後者的收益與流量關系密切,如果沒有達到高流量,很難實作盈利。

我們發現,盡管使用者數量可能不多,但通過訂閱費也能支援公司的增長和成本,這對于初創公司來說是非常有利的。此外,我們還觀察到,盡管兩個月内使用者數達到上億,但AI産品的全球滲透率仍然很低。具體來說,我們的産品自去年九十月份推出以來,收入增長了10倍甚至20倍,這表明AI滲透正在快速增長,随着新模型或産品的釋出,我們的産品力和獲客效率也在不斷優化,這讓我們對公司的健康發展和高速增長充滿信心。

對于未來的收入預期,我們保持樂觀态度,預計随着下半年或明年更強大的模型的推出,我們的收入将進一步增長。

此外,盡管我們對今年能夠實作1到2億收入感到自豪,但與全球生産領域的巨頭如Microsoft Office相比,其Office 365每年有數十億美元的收入,說明生産經營産品的市場潛力巨大。

Q:AI行業的洗牌大概會發生在什麼時間?可能會淘汰多少創業公司?

李開複:我認為中國市場目前正處于一個充滿活力和快速成長的階段,在這一過程中,我們觀察到許多競争對手采取了不同的發展路徑。充分展現了中國公司在新環境中迅速而充滿活力地成長的過程。是以,現在就對市場進行定論可能還為時過早。

在美國,目前普遍的認知是,隻有少數幾家公司能夠訓練超大型模型,而這些訓練的成本非常高昂。與此同時,其他公司開始尋找解決方案,比如開發尺寸适中、更适合商業應用的人工智能模型,這既是我們的方向,也是一些美國公司正在探索的方向。此外,還有一些公司正在探索超小型模型或開源模型。

我對中國的超級模型持樂觀态度。我認為中國創業者的生命力超出了簡單的想象。雖然市場洗牌可能會導緻一些公司轉型或退出,但我們不應低估中國的創業創新能力。

Q:目前大模型的應用場景主要為娛樂和生産力提升,看到零一萬物目前主要聚焦生産力提升,未來會專注這個賽道,還是也會探索别的場景,如果有的話具體可能有哪些場景?

李開複:人類的需求幾千年來一直未變,但随着科技的洗禮,我們的工作方式、溝通方式、娛樂方式、交友方式以及購物方式都在不斷演變。我相信這些變化也必将在AI時代發生。在衆多的AI應用中,我們需要關注哪些會首先被點燃。我們特别看好生産力工具和娛樂社交應用,盡管這些應用目前還處于初期階段,應用場景有限。未來,我們需要通過TC-PMF(來觀察哪些領域可以借助強大的模型和使用者願意支付的費用來實作突破。

同時,也存在一些應用,使用者可能不會直接支付,但它們的使用量需要先做起來,因為它們具有很強的粘性和傳播力。然後,我們會探索其他的商業模式來實作盈利。這個過程與移動網際網路的發展過程相似,就像移動網際網路最終發展出了視訊訂閱模式一樣,AI領域也會出現類似的模式。在AI時代,我們也會看到類似于抖音、微信、滴滴、美團這樣的創新應用。

關鍵在于不斷探索哪些領域技術足夠好、推理足夠便宜,并且使用者需求足夠強。無論是通過直接付費還是通過其他商業模式,最終能夠最早推出并勝出的應用将是關鍵。關于這一點,我不能再透露更多資訊了。

檢視原圖 547K

  • 李開複:中國大模型公司沒有美國大廠的GPU數量,要采取更務實的戰略
  • 李開複:中國大模型公司沒有美國大廠的GPU數量,要采取更務實的戰略
  • 李開複:中國大模型公司沒有美國大廠的GPU數量,要采取更務實的戰略

繼續閱讀