天天看點

大模型“混戰”,雲端競争時代到來

作者:這是憤世嫉俗的

每經記者:石普甯 每經編輯:唐元

“國内現在是‘百模大戰’,這是通向通用人工智能最近的一條路。”在6月2日舉行的“未來城與智媒體”首屆成都東部新區·成渝地區雙城經濟圈城市媒體發展大會暨城市機會清單釋出活動上,北京師範大學新聞傳播學院院長張洪忠表示,大模型讓所有的網際網路公司都有一個新的機會重新開始。

如何了解“大模型”?或許可以從架構上出發。簡單來說,如今的IT技術棧分為四層,晶片層、架構層、模型層和應用層。

“今天的ChatGPT、文心一言等屬于模型層,AI時代的原生應用都會基于大模型來開發。”百度CEO李彥宏在第七屆世界智能大會上曾如此說道。

自開春以來,随着以大模型的應用為标志的AI2.0時代加速到來,人工智能概念大火。

在國内,以大廠領頭的各大企業紛紛宣布各自的大模型與産品,通用大模型也迎來一波創業潮,一時間市場上熱鬧紛呈,任何人都不願錯失良機。

縱觀各類大模型産品的“出生”,其中既有來自熟悉的大廠如百度、阿裡,也有來自專注人工智能領域的企業如商湯,更有創業者“另起爐竈”,典型如美團聯合創始人王慧文,稱要打造“中國的OpenAI”。

在“百模混戰”的背景下,如今各家的“戰況”如何,在大模型“一窩蜂”闖入視野的同時,我們正在迎接怎樣的科技變革?

各路産品業已上馬

“ChatGPT從去年11月份進入社會視野,有兩個最大的突破點:第一個是開放域的多輪對話,第二個是生成性的文本。”張洪忠表示,兩個技術的突破意味着人機交往的新時代到來,“這是一個巨大的革命性突破。”

視線投向國内網際網路巨頭,在大模型技術上積累較為深厚的百度和阿裡率先出手,分别于3月16日與4月7日推出“文心一言”以及“通義千問”。

大模型“混戰”,雲端競争時代到來

圖檔來源:“百度文心一言”公衆号

自内測以來,文心一言完成了4次技術版本更新:如今的推理成本降到了原來的十分之一,推理性能提升近10倍。

“當别人剛剛思考如何進行訓練的時候,我們已經在推理上沖出了很遠。”5月,李彥宏在百度内部大會上說。

此外,文心一言還将逐漸融入百度所有業務。

5月16日,百度釋出了第一季度未經審計的财務報告,李彥宏表示,“我們計劃逐漸将文心一言融入我們的所有業務,為我們的産品及服務賦能,吸引更廣泛的使用者及客戶。圍繞文心一言在新的時代中建立新生态。這也将助力我們實作長期、可持續的增長。”

無獨有偶,一個多月前,在阿裡雲峰會正式推出“通義千問”之際,阿裡巴巴集團董事會主席兼CEO、阿裡雲智能集團CEO張勇亦表示,阿裡巴巴所有産品未來将接入通義千問大模型并進行全面改造。“面向AI時代,所有産品都值得用大模型重新更新。”

6月1日,阿裡雲對外披露通義大模型最新進展,瞄向AI音視訊賽道推出“通義聽悟”,并且正式開啟公測。

據阿裡雲CTO周靖人介紹,通義聽悟作為一款工作學習AI助手,不僅“聽力好”,能夠高準确度生成會議記錄、區分不同發言人,而且“悟性極高”,可以一秒給音視訊劃分章節并形成摘要、總結全文及每個發言人觀點、整理關注重點和待辦事項。

大模型“混戰”,雲端競争時代到來

圖檔來源:“阿裡雲”公衆号

除了大廠動作頻頻之外,AI科技企業也對這塊“蛋糕”虎視眈眈。

4月,計算機視覺公司商湯科技于推出“日日新”(SenseNova),其中包括自然語言處理模型“商量”(SenseChat)、文生圖模型“秒畫”和數字人視訊生成平台“如影”(SenseAvatar)等。

同月,決策類AI公司第四範式首次向公衆展示 “式說3.0”,瞄準生成式AI對企業級軟體重構和改變的增長空間和市場機會。

值得一提的是,就大模型産品而言,騰訊則“低調”不少,并不打算“拼速度”。

在3月騰訊釋出2022年四季度财報後,騰訊總裁劉熾平透露了包括聊天機器人在内的即将釋出的衆多産品的計劃。他表示,騰訊不會匆忙推出産品,而将花費時間打造一個經過多次疊代後的長期發展機會。

此外,大廠如位元組跳動則選擇扮演類似微軟的角色,旗下的火山引擎推出大模型訓練雲平台,為大模型公司提供算力等技術服務。火山引擎總裁譚待表示,火山引擎不做大模型,将化身賦能者,為大模型客戶提供算力等AI基礎設施,幫助其做好大模型開發。

大模型“混戰”,雲端競争時代到來

圖檔來源:“火山引擎”公衆号

作業幫教育大模型正在内測

除了科技企業,記者從作業幫獲悉,目前作業幫正在内測基于中國市場的教育大模型,包含多學科解題、中英文作文批改、多語言對話方向等多個教育應用場景,涉及工具類App、智能硬體、圖書等業務。據内部人士透露,教育場景中綜合能力表現超出預期水準。

針對此事,财經網科技向作業幫方面進行求證,作業幫相關從業人員回複,作業幫教育大模型目前在内測階段,相關評估及備案等工作正在進行中。

一位接近作業幫人士表示,作業幫在今年年初就啟動了自研教育GPT項目,從各個業務子產品調集技術精英組成原始團隊。今年3月份,作業幫内部郵件宣布,再次加大投入,并進行組織架構調整。目前該項目由CTO羅亮牽頭進行底層研發支援及AIGC大方向建設,研發經費優先調撥。

該人士進一步表示,除了組織架構調整,作業幫産研團隊中近百人也已并入GPT相關項目,“從技術到産品側,分不同落地場景在‘跑’項目,估計有兩百人以上的團隊規模”。

另一位作業幫内部人士透露, “從過往技術能力積累來看,作業幫優勢明顯,不做這件事才奇怪。”該人士稱,經過半年的技術研發,作業幫内部對自研GPT比較有信心,已經優先“解鎖”解題能力、中英文作文批改、知識問答等産品級應用,進展比想象中順利,已經在一些教育場景中達到了行業top水準。

大模型“混戰”,雲端競争時代到來

圖檔來源:“作業幫”公衆号

雲端競争時代已經到來

“現在大語言模型出現以後,雲端就開始被開發出來,雲端的競争将成為下一場網際網路競争的窗戶。”張洪忠稱。

據Canalys資料顯示,去年中國雲計算市場同比增長10%,前四大雲計算廠商阿裡雲、華為雲、騰訊雲和百度智能雲,合計增長9%,占雲服務客戶支出總額的79%。

張洪忠認為,對于應用而言,“對話即平台”成為現實,對話可以解決多模态的問題。例如,把ChatGPT的API接上以後,大模型就可以畫圖、做平面設計、寫文案等等。

而要更深層次了解大模型,“湧現”是一個關鍵的概念。

簡單來說,湧現指的是當大模型的資料量達到一定量的時候,一種産生質變的能力。這種能力在小型模型中并不存在。主攻預訓練大模型的智譜AI創始人、CEO張鵬在接受媒體采訪時指出,業界普遍的共識在于,500-600億機器訓練參數是大模型智能湧現的門檻。

這也是ChatGPT“大力出奇迹”的基礎,早前“掀起蝴蝶翅膀”的GPT-3模型,就已經有1750億個參數。OpenAI沒有進一步公布GPT-4的參數數量。作為對比,谷歌新推出的PaLM2訓練參數已經達到3400億個。

“算力是競争的基礎,”張洪忠提到,目前很多想要從事相關研究的老師從大學轉到企業,就是因為大學無法承載如此龐大的算力需求以及巨額費用。

一個典型的例子是,作為算力基礎GPU的供應商英偉達,近日市值一度突破萬億美元,其A100晶片、H100晶片在全球具有絕對優勢。就國内的A100晶片而言,主要被百度、阿裡等大廠掌握在手中。

大模型“混戰”,雲端競争時代到來

英偉達CEO黃仁勳 圖檔來源:英偉達官網截圖

換句話說,大模型産品競争費用不菲,這也是一些國内大模型産品采用邀請測試或是不面向C端的主要考慮。

據國盛證券估算,GPT-3的單次訓練成本就高達140萬美元,對于一些更大的LLM(大型語言模型),訓練成本介于200萬美元至1200萬美元之間。

在這其中,大部分費用是電費,計算機專家吳軍曾提到,“大概可能是3000輛特斯拉的電動汽車,每輛跑到20萬英裡(約32.19萬公裡),把它跑‘死’,這麼大的耗電量,才夠ChatGPT訓練一次。”

在如此高昂成本之下,各網際網路大廠也争相入場,或許都是因為看重大模型産品背後掙到“真金白銀”的可能。

李彥宏就提道,初創企業“沒有必要再重新發明一遍輪子(基礎大模型)”,它們的機會是在應用層,将出現“全新的、十倍于現在微信和抖音的創業機遇”。當然,百度自己想要做“輪子”。

在張洪忠看來,網際網路經曆了三大時代:PC網際網路時代,2010年之後的移動網際網路時代,以及可能進入的下一個時代——大模型時代。他表示,“我們未來的網際網路競争,幾乎都要建立在大模型基礎上。”

他進一步提到,移動網際網路時代,誰都想不到當時如日中天的四大門戶——新浪、騰訊、網易、搜狐會在這一波浪潮之中被抖音、快手、微信等應用所取代和趕超。

“同樣的,今天我們到了大模型時代,在大模型基礎之上的應用就可能會産生新的技術,這就是人工智能技術帶給我們的希望和變數,包括一些新的産業發展契機。”

本文作者系天府文創雲記者石普甯,轉載合作相關可搜尋“天府文創雲”公衆号。

每日經濟新聞