天天看點

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

文|AGI創業新聲 王吉偉

大語言模型不再被視作通往AGI的橋梁,生成式AI未來的發展方向在哪裡?

已經燒掉5000億美元還要繼續耗費資源的大語言模型,後面的路還走得動嗎?

燒錢、耗費資源、難以盈利,被持續唱衰的大語言模型前路艱難但商業價值明顯

被砸重金的Transformer架構卻不是AGI的鑰匙,大語言模型的前路是否光明?

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

全球看衰大語言模型,“AI六小虎”傳聞疊起,生成式AI的價值空間已經觸頂?

國慶節過後,人工智能領域似乎多了幾分冷色調。不知道是因為大語言模型(Large Language Model,LLM)的幻覺,還是因為寒露時節的到來。

或許人工智能還無法感受到時下的寒意,即便是帶有氣象傳感器的具身智能和端側Agent。因為這份寒意更多來自于經濟圈層和精神層面,現實世界的複雜程度遠不是一個采用Transformer及其變體架構的大語言模型所能體會的。

技術上,這一輪人工智能的熱潮源自于Transformer架構。而這個讓OpenAI最新融資額度達到1570億美元估值的技術架構,在一些人看來卻并不咋地。

不看好并質疑Transformer架構的種種觀點,大體可以總結為:

Transformer缺點和優點一樣明顯;

大語言模型并不是通往AGI的橋梁;

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

連帶着,生成式AI(Generative AI,GenAI)也開始被批判。當然這些批判之聲并非隻因Transformer架構的技術缺陷,更在于生成式AI爆發以來出現的各種版權、安全等問題與目前經濟、社會乃至政治層面的各種沖突。

唱衰大語言模型的聲音,也得到了一些投資機構的支援。在國外,高盛就認為生成式AI投入很高而收益太少。Mighty Capital過去兩年沒有進行AI領域的投資,認為目前的創業項目都被高估了。Next Round Capital Partners的言論更加偏激,預測85%的AI初創公司将在三年内因資金耗盡或者被收購而倒閉。

最近甚至有聲音認為OpenAI或者Anthropic最終會以被收購收場,即便OpenAI有很大的可能性能夠實作主導上市。

國外關于AI泡沫的聲音,從去年開始就沒有間斷過。

在國内,曾主導滴滴與快的合并的傳奇投資人朱嘯虎也認為,五年以後可能不會再有獨立的大模型公司存在。言外之意明顯,大模型公司可能都會被收購,畢竟二、三線大模型創業項目已經在賣身了。

而最近的幾個似是而非的傳聞,似乎也透露了一些問題。傳聞中的國産大模型“六小虎”目前的情況好像都不是很好,在裁員、靜默、迷茫中惶惶度日。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

國外的大語言模型公司也沒有好多少。作為大語言模型領域的風向标,雖然OpenAI估值正在向2000億美元狂奔,卻難掩其骨幹離職、持續燒錢、難于赢利、越發向虛的尴尬境地,人們對OpenAI的關注度正在逐漸下降。而Anthropic也越發表現平平,何時赢利仍是個問題。

現在來看,從技術到資本再到商業,沒有彰顯出大語言模型應有的奮勇直上的姿态,反而是透露了一種難以為繼的疲态,要知道LLM的爆發至今僅有短短的2年。為什麼很多人都在說LLM不是通往AGI的橋梁?資本市場和應用市場如何看待生成式AI?如何看待“AI六小虎”傳聞?LLM真的不能長久嗎?

本文,王吉偉頻道結合近期的行業動向,跟大家聊聊這些。

LLM是不是通往AGI的橋梁?

2023年3月下旬,ChatGPT如日中天LLM Based AI Agent嶄露頭角之時,未來生命研究所(Future of Life Institute,FLI)釋出了一則公開信,呼籲所有人工智能實驗室立即暫停訓練比GPT-4更強大的人工智能系統至少6個月。

信中寫道,廣泛的研究表明,具有與人類智能競争的人工智能系統可能對社會和人類構成深遠的風險這封信得到了包括馬斯克等在内的1000多科技領袖和研究人員的簽名。

有意思的是,這封信發出後或許沒讓多少人重視AI的安全,反而堅定了更多人相信LLM能夠實作AGI的信心。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

但一些人也認為,LLM與AGI的距離就像人類在火星上定居一樣遙遠。甚至有人認為,OpenAI将AGI的進展倒退了5到10年。因為現在所有人都在做LLM,使得其他研究和出版越發緩慢。

Meta首席人工智能科學家楊立昆(Yann LeCun)認為,在某種程度上,AI 模型的“智能”程度取決于它所訓練的資料,像 ChatGPT、Google的Gemini或Meta的 Llama這樣的LLM永遠不會達到人類的智能水準。

在通往人類水準智能的道路上,LLM基本上是一種"off-ramp"(岔路)、"distraction"(幹擾)和"dead end"(死胡同)。這意味着LLM并不能有效推動我們實作人類水準的人工智能,反而可能會分散我們的注意力,讓我們誤入歧途。

甚至連OpenAI的CEO Sam Altman也曾表示,他不認為僅僅通過擴大LLM的規模就能實作AGI,對目前LLM在實作AGI方面的潛力持保留态度。是以也有觀點認為,未來GPT-5會不會繼續采用Transformer架構尚未可知。

目前主流的AI模型和産品,比如ChatGPT、Sora、Bard、Claude、Midjourney、ChatGLM、Baichuan、Kimi 等都基于Transformer架構。

在RWKV(Receptance Weighted Key Value,一種結合了遞歸神經網絡和Transformer模型優點的新型架構)論文作者彭博看來,現實世界不是基于Transformer邏輯去做推理來運轉的其運轉規律是基于類似RNN 結構的。這個世界的下一秒,不會跟你過去所有的時間、所有的資訊相關聯,隻會跟你的上一秒相關聯。但Transformer 要辨認所有的 token,這是不合理的。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

RWKV架構圖

之是以說基于Transformer架構的LLM不是通往AGI的橋梁,綜合各路大神的觀點與看法,主要原因歸結于LLM的技術局限性,表現為以下幾點:

局限一:預訓練不能實時學習

人類智能的核心在于持續的實時學習,這得益于大腦的可塑性和神經連接配接的動态形成。相比之下,LLM在訓練後被當機,以批處理方式進行學習,缺乏實時回報和動态适應的能力。

數學上,這種限制源于它們在固定向量空間中的映射關系,無法随着新資料的發展而調整。為實作實時學習,需要将Sobolev空間中的動态映射引入。

局限二:記憶缺乏動态整合能力

大腦的記憶系統是複雜而動态的,能夠根據上下文和情感不斷調整。然而,LLM的記憶是靜态的,僅以固定權重存儲知識,缺乏動态整合能力。

雖然有一些記憶體增強技術(如RAG和神經圖靈機)試圖引入外部記憶,但它們的計算成本高,且無法實作實時學習和适應性召回。這種離散的記憶機制,使得LLM無法實作真正的上下文感覺和聯想學習。

局限三:無法進行實時動态調整

盡管思維鍊(CoT)推理、上下文學習和元學習(如MAML)被認為是改善LLM性能的潛在解決方案,但它們仍未達到真正的通用智能(AGI)所需的流動智能。

這些方法提高了特定任務的表現,但模型依然依賴于固定的訓練模式,無法進行實時動态調整。大腦能夠通過每次體驗重構其突觸網絡,而LLM則需要繁瑣的微調過程。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

局限四:能源效率與可持續性差

人腦以極高的能源效率運作,能在僅20瓦的功耗下執行1 exaflop的計算。相比之下,LLM的訓練和推理過程能源密集,消耗數兆瓦的能量。

盡管有可能通過事件驅動架構和脈沖神經網絡(SNN)來提高能效,但目前的LLM仍未能達到大腦的能效水準。

局限五:缺乏可塑性與動态适應

大腦的可塑性使其能夠根據新資訊和環境變化重組神經連接配接,支援持續學習。相對而言,LLM的參數在訓練後固定,缺乏根據新資訊自我重組的能力。

這種可塑性的缺失限制了LLM在新挑戰下的适應能力,真正的AGI需要具備動态重新配置内部結構的能力,以降低營運成本并提高效率。

這些局限性,也就是不看好LLM者常說的:Transformer 效率不高,天花闆易窺見,計算成本高昂且占用記憶體,資源浪費嚴重。

并且LLM的這些局限性,很難或者無法從根本上改變,這也決定了LLM不會把人工智能帶向AGI。從局限性角度解讀LLM不能帶來AGI的文章,大家還可以參考下面幾篇:

Why LLMs Will Never Lead to AGI:https://medium.com/autonomous-agents/why-llms-will-never-lead-to-agi-aa7bcff9805d

Why Large Language Models are not the route to AGI:https://www.linkedin.com/pulse/why-large-language-models-route-agi-sandeep-reddy/

Why LLMs Will Never Be AGI:https://chrisfrewin.medium.com/why-llms-will-never-be-agi-70335d452bd7

鑒于Transformer的局限性,便出現了許多非Transformer架構,其中比較有影響力的包括中國的RWKV、Meta 的Mega、微軟亞研的Retnet和Mamba、DeepMind團隊的Hawk和Griffin等,這些架構都是在Transformer大模型火爆之後提出的。

可以看到,在這個名單裡除了RWKV架構是創業項目,其他架構都是科技巨頭推出的,其中似乎也映射了他們對Transformer無法實作AGI的看法。

需要說明的是,作為國産開源的首個非Transformer架構大語言模型,目前RWKV已經疊代至第六代RWKV-6。

有意思的是,跟OpenAI深度綁定的微軟已在Windows系統內建了RWKV,資料顯示在9月份win10+win11的裝機量已經達到15億,驗證了該架構的實用性。

出現問題,就要解決問題。為了克服LLM的限制性,研究者們也正在探索新的數學架構和AI架構,以模拟大腦的自适應、上下文感覺和節能特性。一些比較有發展潛力的(初步)方向,如下圖:

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

從各種研究方向以及LLM目前面臨的問題來看,未來AGI的實作定然不會隻依賴于一種模型,而是需要多種模型的組合和協作。LLM隻是諸多模型中率先實作突破并且卓有成效的,使得今天的技術、生态、商業乃至資本都在重度往這個領域傾斜。

Transformer已經形成壟斷地位,無論資源還是生态,非Transformer研究都差了很多。目前研究非Transformer新架構的團隊要麼在學術界,要麼是體量很小的創業團隊,很少有大公司投入一個大的團隊來研究新架構。

目前行業的整體方向,如同在一個不太正确的方向上壓重注,導緻更多的資源投放到Transformer技術的研究上而忽略其他方向,壓縮了非Transformer的生存空間,這也是一些人斥責LLM會把AGI的實作時間縮短5-10年的主要原因。

資本市場眼中的GenAI

除了技術領域頻頻吐槽基于Transformer的LLM,一些投資機構也對生成式AI頗有看法,乃至于非常看衰GenAI,認為這波炒作所帶來的AI泡沫即将破裂。

以OpenAI為例,在今年早些時間募資時,很多投資機構都認為其1000億美元的估值太高。其新一輪融資最終以1570億美元的估值,但蘋果放棄了這一輪融資,于2021年投資OpenAI的紅杉資本沒有跟投。

還有一些投資機構對投資AI非常慎重,比如風險投資機構Mighty Capital過去兩年都沒有進行AI領域投資,認為價格被高估了。專注AI領域的投資機構Thrive Capital在與一些LP、主權财富基金和大型機構投資者溝通中發現,一些機構面臨收入回報壓力,已拒絕讓VC投資風險高的項目。

高盛在《GEN AI: TOO MUCH SPEND, TOO LITTLE BENEFIT?》報告中對于AI的投資回報做出了質疑:盡管預計未來幾年科技巨頭和各類企業将在AI相關領域投入約1萬億美元,但截至目前這些投資似乎并未帶來顯著成果。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

在報告中,麻省理工學院教授Daron Acemoglu也對AI的前景持保留态度,預測未來十年内,隻有大約四分之一的AI任務能夠實作成本效益的自動化,AI可能隻會使美國的生産力增加0.5%,GDP增長累計增加0.9%

高盛政策師Ryan Hammond團隊報告稱,科技巨頭在AI領域的大量投資尚未産生相應的收入和利潤,可能導緻估值貶值。高盛全球股票研究主管Jim Covello更為謹慎,認為AI必須解決複雜問題才能實作合理回報。

當然,高盛内部目前對AI的看法并不一緻。一些分析師認為,即使AI技術的基本叙事最終無法在資本市場站住腳跟,AI泡沫也可能需要更長時間才會破裂。另一些分析師則持懷疑态度,認為AI自動化任務不到5%,且AI技術的成本高昂,且并非為解決複雜問題而生

紅杉資本合夥人認為,按照目前的投資成本,要保證50%的利潤,需要賺到6000億美元。這個數字是基于目前GPU和雲服務投資的預測。福布斯則認為紅杉的估算是樂觀的,實際回報可能更低,除非生成式AI出現殺手級應用。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

但越來越多的華爾街分析師對AI的熱情也在減退,認為AI技術尚未達到實用水準,投資過度可能導緻不良後果。

在國内市場,金沙江創投合夥人朱嘯虎在“創投十年”高峰論壇上的分享中,關于大模型創業提到了兩點:

一是如果到年底不能推出GPT-5,OpenAI和英偉達的股價可能都要狂跌;二是五年以後可能不會再有獨立的大模型公司存在,要麼隻有AI應用公司,要麼就是雲服務。

雖然他不看好大模型創業但看好生成式AI應用,這一點我們在後文還會提及。

應用市場這樣看GenAI

除了資本市場,在應用市場一些研究機構對GenAI的看法也不是很樂觀。

根據Gartner 7月釋出的最新炒作周期報告,用于采購的GenAI已經達到了“高估期望的峰值”。這個階段之後是“幻滅的低谷”,一個“由于實驗和實施未能實作”的興趣減弱的時期。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

2024 采購和尋源解決方案技術成熟度曲線,點選看大圖

雖然GenAI可能會從現在開始迅速成熟,在2到5年内達到“生産力平台”,但達到這一點的道路可能不會一帆風順。Gartner估計,到2025年底,至少有30%的GenAI項目将在概念驗證後被放棄。

參考連結:https://www.gartner.com/en/newsroom/press-releases/2024-07-29-gartner-predicts-30-percent-of-generative-ai-projects-will-be-abandoned-after-proof-of-concept-by-end-of-2025

市場研究開始證明這一點。軟體公司Asana對1200多名IT專業人士進行了調查,發現四分之一的受訪者後悔如此迅速地投資了AI。Boston Consulting Group發現,三分之二的高管對其組織在AI方面的進展持沖突态度或不滿意。

SaaS公司WalkMe 表示,自從開始使用這些技術以來,一半的美國辦公室從業人員的工作沒有得到改善。

參考連結:https://ir.walkme.com/news-releases/news-release-details/walkme-discovers-workplace-ai-sos-we-need-help-along-way

今年4月,麻省理工學院經濟學家Daron Acemoglu的一篇論文引起了轟動,該論文預測了AI“非平凡但适度”的經濟利益。與高盛和麥肯錫相反,阿西莫格魯預計未來10年的GDP增長不會超過1.16%,而生産率增長僅略高于半個百分點。

《經濟學人》7月份的一篇文章則更為犀利,指出“到現在為止這項技術幾乎沒有對經濟産生任何影響”。

Daron Acemoglu論文:https://economics.mit.edu/sites/default/files/2024-04/The%20Simple%20Macroeconomics%20of%20AI.pdf

在Daron Acemoglu看來,每個人都在瘋狂地沖刺,想用AI做一些事情,卻不知道自己在做什麼。這些技術還不夠成熟,将導緻大量中斷和不必要的自動化,并且可能會降低公司提供的産品和服務的有效性。

在具體應用層面,Gartner研究主管Pieter J. den Hamer表示,市場内部對GenAI的失望感正在加大。特别是對于在ChatGPT病毒式傳播後開始投資GenAI的公司來說,他們越發意識到GenAI并不是靈丹妙藥。GenAI是一項非常強大的技術,但像任何其他技術一樣,它需要仔細分析研究後才能有效使用。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

他指出,許多CIO投資于AI是為了提高生産力。當他們努力量化這些收益時,挑戰就會進一步出現。在Gartner 最近的一項調查中,近一半的IT上司者表示,他們在确定AI的商業價值時遇到了問題。

參考連結:https://www.gartner.com/en/newsroom/press-releases/2024-05-07-gartner-survey-finds-generative-ai-is-now-the-most-frequently-deployed-ai-solution-in-organizations

den Hamer表示其看到的目前最成功的應用是将AI 應用于客戶服務。以呼叫中心座席可以處理的電話數量來衡量,平均生産力大概提高10%,但前提是員工技能得到提升并能夠有效使用AI。在營銷領域也是一樣,需要适當教育訓練員工并讓他們适應新的工作方式,否則成效就會小很多。

事實上,Gartner調查發現,目前隻有9%的企業被歸類為“AI成熟”。他們與衆不同的是可擴充的AI營運模型、對AI工程的關注、對提高員工技能的投資以及更好的風險管理能力。

網絡安全咨詢公司SkySiege的首席工程師Andrew Southall認為,風險管理能力很關鍵。他與許多客戶合作,這些客戶對他們的GenAI投資感到後悔,不僅因為商業價值被誤解和高擁有成本,還因為“資料中毒”等安全問題。

從技術供應而言,目前像微軟這樣的生産力和商業軟體領域的領頭羊,也沒有真正找到願意為此付費的客戶。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

The Information 稱,微軟365套件的客戶對 AI 驅動的“Copilot”産品幾乎沒有太多興趣。在 4.4 億個使用者中,隻有 0.1% 到 1% 的使用者願意為這些 AI 功能付費。

一家測試了這些 AI 功能的公司表示,“大多數人目前并不認為它具有太大價值”,還有人說,“許多企業沒有看到在生産力和其他方面的顯著改進”,他們“不确定何時才能看到”。

要體驗這些功能,需要每人每月額外收取 30 美元。對于所謂的“Copilots for Sales”,則每月額外收取 50 美元。如果按年支付,這也将是一筆不小的費用,是以很多企業對此并不太感冒。

對于這種技術與市場脫節的情況, 公共關系公司EZPR首席執行官Edward Zitron在名為《The Subprime AI Crisis》的博文中寫道:

整個行業對生成式 AI 的大規模投入,結果卻隻是出現了四、五個幾乎相同的大語言模型、世界上最不盈利的初創企業,還有數千個價格昂貴且令人失望的內建産品。

他認為目前我們正在面對一種共同的幻覺:一種死胡同一樣的技術,它依賴版權盜竊、需要持續的資本注入,同時它所提供的服務在最好的情況下也是非必需的,它被包裝成一種尚未實作的自動化,耗費了數十億美元,而且可能會永遠如此。生成式AI不單單靠金錢在運作,還有信仰,問題是信仰是一種有限的資源。

參考連結:https://www.wheresyoured.at/subprimeai/

這麼犀利的筆鋒,透露了Edward對AI行業的極度擔心。

關于近期“AI六小虎”的傳聞

9月初,幾則關于大模型公司現狀的傳聞,似乎在印證資本市場及應用市場目前不太認可大語言模型的情況。

一則來自于橘子汽水鋪,整體提到了大模型創業公司的現狀。

一則來自于AI暴躁吐槽君,介紹了幾個創業公司的營運情況。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

經過一個多月的發酵,已經有更多人看到了這些傳聞。而在36氪最新的報道中,“AI六小虎”(智譜、零一萬物、MiniMax、百川智能、月之暗面、階躍星辰)中已經有兩家逐漸放棄預訓練模型,縮減了預訓練算法團隊人數,業務重心轉向AI應用。

參考連結:https://36kr.com/p/2985143610892032

在王吉偉頻道看來,重點發力AI應用也沒什麼不好,光守着大模型不能變現沒啥用,畢竟更好地活着才更有希望。

但這則報道,也讓之前的傳聞越發真實起來。

針對傳聞及報道中“某些公司放棄預訓練”的說法,李開複已經發朋友圈辟謠,稱零一萬物一直在做預訓練。

其實傳聞就是如此,你不管它别人也就是猜猜罷了。但若是認真,則有可能堅定别人的看法。

既然是傳聞,大多可能會是捕風捉影。但無風不起浪,真實情況可能不會像傳聞中說的那麼嚴重,但還是為國内AI圈披上了一層悲觀色彩。

即便沒有這些傳聞,還有朱嘯虎的預測。其“未來5年不會有獨立大模型公司”的說法,幾乎是預判了大模型創業公司的命運,比這些傳聞還要嚴重的多。

假設這些大模型創業項目的生命周期隻有五年,現在出現這樣的情況也就再正常不過了。

即使沒有朱嘯虎的預測,也還有最近蘭德公司(RAND Corporation)的研報。其所釋出的報告《The Root Causes of Failure for Artificial Intelligence Projects and How They Can Succeed Avoiding the Anti-Patterns of AI》超過80%的AI項目失敗了,是不涉及AI的資訊技術項目的失敗率的兩倍,浪費了數十億美元的資本和資源。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

報告指出了項目失敗的幾個原因:利益相關者之間目标不一緻、過度關注并應用AI而不考慮其價值、缺乏正确準備的資料集、基礎設施不足以及AI與手頭問題不相容。它還指出,這些問題不僅限于私營部門:即使是學術界也對 AI 項目存在問題,其中許多項目隻專注于釋出AI研究,而不是檢視現實世界的成果應用。

報告的觀點,與李彥宏之前的看法不謀而合。他也曾表示,中國有太多的大型語言模型,浪費了大量資源,因為這些模型通常幾乎沒有實際的實際應用。

這大概也是很多投資機構,不敢再貿然投資大模型項目的重要原因之一了。

其實不隻在中國,全球大模型項目面臨的情況都是一樣的。

雖然OpenAI估值已達1570億美元,但仍需應對高達數十億美元的年度虧損,以及未來幾年巨額的營運成本。根據公司的财務檔案預測,OpenAI在2026年将虧損140億美元,并且這一預計并不包含股票薪酬,這是OpenAI最大的支出之一。

OpenAI公司預測,未來幾年模型訓練的計算成本将大幅上升,到2026年将高達每年95億美元,其中不包括大模型研究的前期訓練成本。預計到2030年将花費超過2000億美元,其中60%至80%将用于訓練和運作模型。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

至于赢利,OpenAI預計,在2023年至2028年期間公司的總虧損将達到440億美元,直到2029年才能實作140億美元的利潤。

Anthropic首席執行官也表示,目前AI模型訓練成本是10億美元,未來三年這個數字可能會上升到100億美元甚至1000億美元。

這意味着,這兩個代表性大模型項目,在赢利之前都将繼續邊燒錢邊融資。而全球大模型創業項目,基本都在向這兩個項目看齊。

目前AI行業僅是訓練成本,就已經超過5000億美元,收入卻是寥寥。如果未來全球大模型項目都是這樣的投入和産出,大部分資本投入都不會轉化為收益。面對5年之後才有可能實作盈利的局面,又有多少公司和投資機構能夠堅持下來?

是以,才會有那麼多人擔憂AI會成為泡沫,并可能在被戳破之後導緻新的經濟危機。

LLM未來的方向在哪裡?

大語言模型不像微軟Windows這樣的系統,成為企業業務數字化運作的軟體必需,也不像iPhone一樣成為人們工作、學習、生活的硬體必需。它的推出并沒有以終端産品的形态讓大家随手可用,而是需要一定的學習門檻才能更好地使用。

同時技術提供的方式讓它跟其他技術供應商沒有什麼差別,服務各個企業與平台的方式給産業鍊上下遊帶來的好處,但也讓其利潤進一步攤薄。雖然創造了GPT Store這樣的商業模式,但想要打造出APP Store一樣的完善生态系統需要一定的時間,這足以出現更多的商業競争對手。

而想要進一步彌補大語言模型的技術局限與能力不足以高效應用于生産,又需要更多廠商和使用者投入更多資源與精力。想要能力更加出衆,就需要投入更多資源燒更多的錢。此外技術突進與安全管理的沖突,也一直是各個廠商的重頭戲。

大語言模型屬于大力出奇迹,但是大力的背後是持續燒錢。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

當然,并不是說大模型以後就沒有希望了。

OpenAI雖然燒錢嚴重,但其釋出的模型一直都是行業領先的,并且得到了一些大客戶的器重。保持足夠的優勢,拿到投資的可能性也就更大。如果兩年内能夠轉型成為盈利性企業并完成上市,屆時可以獲得更多投資。

當然OpenAI的營收能力也在不斷提高,2026年的虧損高峰後,2027年、2028年虧損幅度或将大幅收窄。

是以現在的OpenAI一切向錢看無可厚非之,畢竟活着才有更多可能。

對比OpenAI,國内一衆大模型項目如果能夠做到某垂直領域領先,能夠為某些使用者群體提供穩定、高效應用服務,在業務精進且逐漸盈利的情況下進一步獲得融資的可能性也會更大。

此外,在更加“省錢、省力”的非Transformer架構模型上做點文章,用小體量模型做一些大模型的事,也是一個值得考慮的方向。

今年以來,國内大模型項目基本都已拿到新一輪融資。相關資料統計,截至8月份,國内大模型公司融資金額在億元級别的有20起。“新AI六小龍”(零一萬物、MimiMax、百川智能、智譜AI、階躍星辰、月之暗面)中有五家公司今年已獲得億元級融資,另外一家也傳出正在融資的消息。

其中,月之暗面在8月完成新一輪騰訊投資的3億美元融資後估值已達33億美元,9月份智譜再次拿到繼中東财團之後的新一輪融資,實作兩年内完成6輪融資。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

王吉偉頻道認為,國有資本和大型科技公司的不斷注資,不但為這些大模型項目提供了源源不斷動力,也在助力這些項目更好的完善生态以及更多的行業資源。

在技術上國産大模型相對滞後一些,但這并不妨礙大模型在一些領域的落地與應用。隻要能夠推出适合國内企業的技術、産品與解決方案,這片土壤養活幾個大模型廠商綽綽有餘。

雖然基于Transformer架構的LLM不是連接配接AGI的最終橋梁,但它注定會在這個階段發光發熱,且它的發展空間遠未觸頂,在這個程序中将會創造足夠的商業及社會價值。

而那些大模型項目,不管最後是賣身還是獨立發展,它們的努力和創新都能為國産大模型的程序貢獻一份應有的力量。

高盛的報告在擔心AI投入過多收益太少的同時,也預測未來數年内将有約1萬億美元的投資用于生成式AI及相關基礎設施,隻是目前這些投資似乎并未帶來顯著成果。

摩根士丹利認為市場對微軟在AI貨币化方面的擔憂導緻其股價承壓,但對微軟AI業務的商業回報增長持信心。

朱嘯虎認為生成式AI可能是像PC網際網路和移動網際網路一樣以十年為機關的長周期的機會,并認為大模型疊代速度放緩應用創新的機會就會增多,今年開始在AIGC應用端可能會出現大量機會。

機構看衰專家批評項目艱難,大語言模型會不會成為即将破碎的AI泡沫?

最近跟一位年輕的朋友交流工作時,他說經常用Kimi搜尋和查找相關資料。而我周圍的幾個長輩,手機上竟也裝着豆包。

這,就是大模型應用不錯的開始。

繼續閱讀