天天看點

ChatGPT之後,一場國産大模型的絕地求生

作者:邊碼故事
ChatGPT之後,一場國産大模型的絕地求生

作者:吳少劍

1946年2月24日,美國賓夕法尼亞大學研發出了世界上第一台通用計算機ENIAC,美國國防部如獲至寶,靠着這個18000個電子管、占地170平方米、重達30噸、耗電功率達150千瓦的龐然大物,每秒鐘可以進行足足5000次運算,精準地計算出彈道軌迹。

ChatGPT之後,一場國産大模型的絕地求生

當時的計算機科學家們,怎麼都不會想到,在數十年後,一台小小的手機,其中所容納的A16晶片,每秒運算速度是16萬億次。

科技的迸發往往會催生出人類基因内那種原始的震撼感,震撼,是一種對巨大可怖的超能力的費解,人類第一次看到火焰、第一次聽到雷聲、隕石摧毀山巅、見證蒸汽列車駛過大清帝國,以及現如今,看到ChatGPT,以一種極其巨大又微乎其微的悖論形态壟斷了網際網路大部分的關注。

ChatGPT之後,一場國産大模型的絕地求生

Allegory of the Cave

ChatGPT的巨大,和世界上第一台計算機比有過之而無不及。

ChatGPT的誕生基于8000億個單詞的語料庫(45TB),包含了1750億個參數。而ChatGPT商業化後,要維持運轉,一共需要至少3萬個以上高性能GPU,搭配數千台伺服器,以及相應用來容納的500個标準機櫃。這樣一共估算,需要Open AI花上8億美元。

薩摩亞作為一個美麗的太平洋島國,其2022年的GDP,就是8.32億美元。

等于說薩摩亞的21.88萬島民,捕魚、種地、當導遊、賣手工藝品、給遊客跳舞表演才藝,做上整整一年,恰好等于一個ChatGPT的費用。

ChatGPT同樣十分渺小,世界各地上隻要能接入GPT官網的使用者,用一台很普通的電腦,都可以和ChatGPT進行交流,并且獲得較為精準的答案。目前,一共有超過一億的ChatGPT使用者,每個月有18億的通路量。

就像馮·諾依曼所說的:“我們曾經熟悉的一切,都開始變得陌生。”

AI幾年前原本無人問津的山芋,在加溫之下,逐漸炙手可熱,為了争奪AI的金杯,全中國的大廠,群起而攻之。

ChatGPT之後,一場國産大模型的絕地求生

“人工智能是我們人類正在從事的最為深刻的研究方向之一,甚至要比火與電還更加深刻。”——桑德爾·皮猜(Sundar Pichai), 2020

ChatGPT并不是一個完美無瑕的AI,但在社會層面上,ChatGPT的革命意義在于,它完成了一輪全球級别的AI普及,并且告訴從業人員,做AI是有前途的。

視角回到中國,其實在前幾年,AI從業者特别苦。

前幾年的至暗時刻裡,從業者一出去拉投資,就會說這麼一句話:“比爾蓋茨曾說過:‘語言了解是人工智能皇冠上的明珠’ ”

但其實,這句名言是瀾舟科技創始人周明替比爾蓋茲編的。

在2022年之前,AI的投資氛圍一直處于冰點,沒人投資、沒有科研經費、沒有科研人員;周明為了拉攏投資,就特意在飯桌上編了這麼一句話,但覺得自己說出來沒什麼可信度,于是他加了個“比爾蓋茨說過”

“在過去幾年,AI投資基本為0,在大家覺得滿眼霧霾的時候,突然ChatGPT出來了,給人帶來了光”周明在ChatGPT及大模型專題研讨會上,感慨了起來。

ChatGPT之後,一場國産大模型的絕地求生

似乎在在2022年11月之後,AI的行業格局似乎一瞬間都變了,各大高校的大模型人才遭到瘋搶。背靠清華的大模型創業公司智譜AI,因為人才豐富,是以在幾輪哄搶之後,估值已經超過了30億元。

而引起各大科技公司瘋狂招兵買馬的本質原因,就是ChatGPT,并沒那麼強大,就像計算機科學家楊立昆(Yann LeCun)所說,ChatGPT并不特别,也沒有什麼革命意義的功能。

如果說中國是一個牌客,那麼在光刻機、國産系統、人工智能,那麼坐上AI這張牌桌,超越美國,并非難于登天。

AI領域,是中國和美國差距最小的高科技領域之一。

就像王小川所說:“用時間衡量的話,OpenAI比我們應該領先三年時間是有的。之前我們說追上GPT-3.5,可能一年時間是有機會的。但人家已經到GPT4了,還有5在訓練當中,是以我覺得有三年。”

而隻要在AI領域追上美國,就可以在未來十年内吃盡國産AI的紅利。

因為在AI領域裡,不論是政客,還是商人,都想得十厘清楚,這就是一個赢家通吃的戰場,有點類似于絕地求生,不管你裝備多好,隻要沒活到最後,你的努力就是0。

Open AI的GPT-4一個月收費20美元,使用者們想付錢都得排隊,谷歌的Bard雖然是免費的,但就是因為性能沒GPT-4那麼強勁,通路者廖廖。

ChatGPT之後,一場國産大模型的絕地求生

而中國這個市場,有足足14億中文使用者,趁着OpenAI還沒有做足準備攻略大陸的時候,國内巨頭們必須先發制人,甚至先消滅自己人。

首先是國家支援,科技部等六部門印發《關于加快場景創新以人工智能高水準應用促進經濟高品質發展的指導意見》

有了定心丸之後,伴随而來的,是國内高管們的紛紛入局。

ChatGPT之後,一場國産大模型的絕地求生

“要參與規則的制定,就要先上牌桌,才能擁有話語權,才有全球競賽的入場券”,李彥宏在5月底舉行的中關村論壇上,說了這麼一段話。而百度确實算是較早入局大模型的玩家之一。

2023年3月中旬,文心一言開放使用者申請體驗,一經推出就引起了全社會的關注,但伴随而來的也是巨大的争議。有人認為文心一言的出現,是中國大模型發展的重要一步;亦有人覺得,文心一言很多功能尚不成熟,仍有發展空間。

李彥宏可能是最快的,但他絕對不是最為狂熱的,因為AI而睡不着的老闆比比皆是。

搜狗前CEO王小川直接說道:“這兩個月都睡不着覺,太興奮了”他自掏腰包,對外宣稱自己投了5000萬美金搞大模型,命名為“百川智能”。

然後也有人說,位元組跳動的張一鳴最近在看OpenAI的一系列論文,常常讀到深夜。

甚至3月23日的TikTok美國聽證會下,也沒看到張一鳴的身影,有人說張一鳴沒看直播,而是在挖OpenAI的華人工程師,開出的價碼是“一億現金+股權”。

無獨有偶,在今年2月,美團聯合創始人王慧文也在朋友圈發表宣言,要出資5000萬設立北京光年之外科技有限公司,揚言要打造出中國的Open AI。

ChatGPT之後,一場國産大模型的絕地求生

馬化騰性格較為内斂,不喜歡抛頭露面,更喜歡穩紮穩打,馬化騰曾在股東大會說過:“這是幾百年不遇的、類似發明電的工業革命一樣的機遇,騰訊并不急于把半成品拿出來展示。”

話雖如此,騰訊的AI投資動作也十分頻繁。

騰訊除了自研“混元大模型”外,6月1日,根據路透社報道,國内通用大模型初創企業MiniMax完成了超2.5億美元新一輪融資,其中,與有騰訊有關聯的實體參與,參投資金或為4000萬美元。

ChatGPT之後,一場國産大模型的絕地求生

之是以大家如此狂熱,因為國内AI大模型的赢家隻能有一個,要麼第一,要麼無人問津。

ChatGPT之後,一場國産大模型的絕地求生

2005年的時候,由尼古拉斯·凱奇主演的《戰争之王》在全球上映,就有這麼一段故事,蘇聯解體之後,大量的軍火流散在前蘇聯各成員國的軍火庫中,凱奇飾演的尤裡,就作為一個軍火商到處購買這些軍火,然後賣給世界各地的軍閥。

ChatGPT之後,一場國産大模型的絕地求生

電影中,凱奇說了這麼一句話:“你知道誰将繼承地球嗎?軍火商,因為其他人都在忙于自相殘殺。”

這句話放在如今中國AI領域的“百模大戰”,也十分精準。

“你知道現在誰是AI競賽的赢家嗎?英偉達,因為其他人都在忙于卷模型”

ChatGPT之後,一場國産大模型的絕地求生

訓練大模型,是成本極其高昂的一個行為,對小公司來說,無異于用全部的存款買2元的大樂透,然後等待使用者去抽獎。

有多燒錢呢?據華為大模型負責人田奇稱,大模型開發和訓練一次,需要1200萬美元。而這1200萬美元裡,有720萬花費在了電力上。

是以電力這一塊,做高壓直流(HVDC)的供應商就成買金鏟子的了,因為供電效率能提升到94%~95%,HVDC已經在BAT等大廠投入使用。

訓練大模型的另一個大頭,是顯示卡。

penAI在訓練GPT-3時使用了1萬塊V100,訓練GP3.5時,至少用了1萬張英偉達A100高性能顯示卡。

ChatGPT之後,一場國産大模型的絕地求生

Nvidia A100

1萬張A100這種頂級顯示卡,一張至少10000美元,1個億美元,隻能算是踏入大模型領域的敲門磚。

英偉達生産多少A100顯示卡,各家公司就搶多少張A100顯示卡。但由于美國政府從中阻攔,中國的高科技公司想要購買A100之類的高端GPU,得拿到美國政府的出口許可。

但英偉達的CEO黃仁勳怎會放下中國這塊巨大的市場,于是英偉達又炮制出了A800顯示卡。

A800顯示卡可以看作是A100的縮水版,規格基本相同,最大的差別在于連接配接速率上,A100的連接配接速率是600GB/s,A800的連接配接速率被限制在400GB/s。

恰好規避了美國出口管制規定中“晶片資料傳輸速率不能超過600GB/s”的要求,成了一個折中之道。

黃仁勳自然不是向中國做慈善,但出于經商頭腦,他卻間接為中國的AI發展提供了大量高性能鏟子。

據《金融時報》8月10日報道,今年英偉達将向百度、位元組跳動、騰訊和阿裡巴巴傳遞價值10億美元的A800處理器,2024年還将傳遞價值40億美元的GPU。

趁着諸侯争霸,黃仁勳賣顯示卡賺的盆滿缽滿,在各種講座和會議上,你很難看到黃仁勳不笑的情景,因為截止9月,英偉達今年股價已經漲了超過200%。

ChatGPT之後,一場國産大模型的絕地求生

但因為AMD在人工智能領域相較性能沒那麼強勁,AMD的CEO蘇姿豐就沒那麼愛笑了,今年的漲幅,僅僅有約65%。

畢竟外行看來,AI是個體面的行業,但内行看來,隻有殘酷,四處可見的赢家通吃和大魚吃小魚的原始競争法則,在這裡展現的淋漓盡緻。

想要打敗強者,隻能比強者更強,然後強者恒強。

ChatGPT之後,一場國産大模型的絕地求生

有人可能會問,為啥要這麼燒錢去做全鍊路自研呢?直接把ChatGPT作為大模型底座,然後優化優化,推出各種應用端不就行了麼?

其實,大部分人作為消費者,對AI付費的認識,可以類比于電費、水費、網費、瓦斯費。我們平時在家裡打開電燈,燒開水喝,然後用手機刷短視訊、用電腦打遊戲,最後晚上再在廚房給自己燒一頓飯,這些水電站之類的基礎設施所提供的能源都在不斷消耗,而消費者隻需要付費就行了,并不需要知道電和網絡是怎麼來的。

通用大模型所追求的終極奧義也是如此。讓AI變得跟水電瓦斯一樣成為生活的基礎。

譬如說,一個公司老闆想要在騰訊會議或者之類的智能會議軟體開會,他于是打開了AI小助手,告訴助手:“我需要你等等幫我做會議紀要,并且總結重點。”随之,在2個小時的會議之後,AI助手很完美地解決了這一個問題,老闆也并不知道AI小助手是怎麼和騰訊的混元大模型底座互通的。

隻要讓消費者簡單用上AI,并解決生活中的一部分具體問題,它就會徹底離不開AI。

在90年代,車馬很慢、書信很遠,想要遠端交友還有“書信筆友”這麼一個玩意兒,你跟90年代的人說你們沒網絡怎麼活?他們會反問這網絡有什麼用呢?

ChatGPT之後,一場國産大模型的絕地求生

同樣的,假設一個來自于2040年的未來人來到2023年,他會問老百姓們,你們生活沒有AI咋活啊?老百姓們可能會噗嗤一笑,AI除了幫我點歌、給我腦筋急轉彎、範範地回答我的問題,還能幹嘛?

這個市場,正因為有巨大的空白,是以先行者更不能拱手相讓。

一旦ChatGPT變得足夠強大,讓所有的使用者都隻用ChatGPT,那麼他們就離開不ChatGPT了。如果消費者建立起問答習慣,則所有的資料都回進入ChatGPT的飛輪,不斷地運轉、龐大,直到大而不倒,那麼中國的高科技産業,就将失去未來10年的機遇。就業崗位流失、購買力流失、想象力流失……不論于公于私,這正是政府和公司為啥一定要在名為AI的絞肉機裡浴血奮戰、不斷奔跑的原因。

因為,AI就是未來的“新能源”。

就像周潤發說的:“我要争一口氣,不是證明我有多了不起,我是要告訴人家我失去的東西我一定要拿回來!我發誓以後再也不會讓人用槍指着我的頭”

ChatGPT之後,一場國産大模型的絕地求生

美國政府制裁、矽谷巨頭壟斷,中美之間确實存在着差距,但三十年河東、三十年河西,這次AI格局,中國企業看到了轉機。

除了有錢可燒、政府支援之外,大廠們在訓練資料上也有着巨大優勢。

百度有百科類的資料,阿裡巴巴更聚焦于電商,位元組有抖音和今日頭條兩大國民應用。而騰訊更是有海量應用和微信公号等内容生态。讓他們更有底氣,進可做通用大模型底座,退可做更加垂直的行業大模型。

以騰訊混元大模型為例,這個全鍊路自研技術下的通用大模型,靠着2萬億Token的預訓練語料,在中文的理科、聯考題和數學等子項超過了GPT3.5。而且更可怕的是,它還在以天為機關加速疊代。

ChatGPT之後,一場國産大模型的絕地求生

因為對大廠來說,業界開源大模型已經無法滿足高并發業務的要求,如果已經訓練好的模型有違法錯誤資訊,從使用方角度來說很難更改,會嚴重影響産品體驗以及技術疊代。

等于說是家裡電器越來越多,光靠手搖發電機不僅效率低,還有可能把手搖廢了。

是以,退一步來說,不論是國家,還是公司,我們有且僅有“全鍊路自研”這一條路可走。這不僅是為利益而戰,也是為未來而戰。AI是人類的未來,但是要手握未來,沒有神仙皇帝,隻有我們自己。

像是論語裡說的:“人生則有四方之志,豈鹿豕也哉,而常聚乎?”

人生要有遠大志向,不可像豬狗一樣,等待喂食。

AI的時代裡,就算是燒幹籌碼,我們也不能做第一個退出牌桌的。

參考資料:

1. 《AI大模型在退燒,但巨頭已經卷瘋了》 Chaos新觀察

2.《2023 大語言模型綜合能力測評報告》

3.《國産ChatGPT和大模型研究現與未來發展》中國人工智能學會

4.《大型語言模型的湧現能力:現象與解釋》中國人工智能學會

5.《中國大模型“内卷月”,焦慮興奮的中國ChatGPT們》量子連線

6.《預訓練大模型白皮書》德邦研究所

7.《激戰大模型,雲廠商到底拼什麼》新商業派

8.《8.23 中國大模型「頂流群聊」筆記》極客公園

9.《中美科技競争力評估報告(2022)》上海科學技術出版社

繼續閱讀