天天看點

中國大模型現狀:一面狂熱,一面冷峻

中國大模型現狀:一面狂熱,一面冷峻

中國大模型現狀:一面狂熱,一面冷峻

騰訊新聞《潛望》作者 張小珺

01 中國大模型艦隊的高調組局現象

中國大模型的關鍵人物都集中在少數的幾個局裡。

在王慧文下決心創業之初,源碼資本創始合夥人曹毅連續見了他幾次面。待王慧文入局後,曹毅支援稱,願意拿出相當比例的資金額度,押注王慧文這個人。

曹毅投資師承紅杉中國創始及執行合夥人沈南鵬,曾是紅杉最年輕的副總裁,于2014年離開并創立源碼資本。該基金被認為是新銳派代表之一。

一開始,王慧文正在幾個想法之間劇烈變化。

他想拿5000萬美元支援中國通用人工智能(AGI)事業。選擇之一是,這5000萬美元分散投給5個項目;選擇之二是,5000萬美元中一部分,比方說3000萬美元給自己買一張船票,其餘2000萬美元給其他人買一到兩張船票;但很快,他全然放棄了前兩個想法,而是選擇為自己“買了一張全家福”——創立人工智能公司光年之外。

由于曹毅快速且堅決地下注,源碼成為了光年之外第一輪開放給機構股東的領投方。其他參與本輪融資的投資方是一衆投資圈明星,包括紅杉資本、五源資本、騰訊、真格基金、今日資本、宿華、王興等。據知情人士稱,由于各方高漲的熱情該輪融資總意向認購金額高達5億美元,但王慧文沒要這麼多,最終融資規模大約為3億美元。該輪融資估值超過10億美元。

光年之外是中國大模型創業艦隊中備受矚目的一支,項目特色是創始人有創造千億級市值公司的創業經驗(是美團聯合創始人),帶資入組誠意大,有号召力和令人信服的格局。雖不懂AI技術,但王慧文在組織、戰略、節奏把握和産品能力上突出。

此外,這輪大模型創業潮,大佬之間的組局現象顯著。以沈南鵬為例,他最近數月有些事必躬親,會親自約見一些大模型創業者。

在中國創投行業,紅杉被認為是應對此輪AI浪潮最激進的基金之一。多位不同基金的投資人表示,就在一些基金還在幾家初創企業中搖擺時,紅杉在多個大模型及應用的創業局裡都“放了錢”。

而沈南鵬的表現也象征着此輪創業潮的特征之一——此番皆為“諸神之戰”,大佬們披甲上陣。

“他們覺得時代又來了,都來勁了,又可以親自上陣。”一位美元基金投資人說。據了解,除了沈南鵬和曹毅,奇績創壇創始人兼CEO陸奇、今日資本創始合夥人徐新、真格基金管理合夥人戴雨森等,都是這輪創投潮中的積極派個人代表。

“這次都是老闆,像分析師一樣。”他們獨攬了從找項目、看項目、見創始人,到談條款等所有環節,甚至有些基金連公衆号都在老闆的親手指揮下寫作完成。就在這部分VC界大佬群起沸騰時,另一邊,這也導緻“下面的年輕投資人根本就沒有事做”。

不僅投資人如此,中國大模型以及其上的應用層創業者,在融資過程中也呈現出兩極分化嚴重的現象。如王慧文、闫俊傑、楊植麟、王小川等被認定為第一梯隊的創業人選,VC會紮堆搶份額,估值水漲船高。有些公司在第一輪面向機構股東的估值就已高達10億美元,他們往往在開放給機構股東前自己先會投一小輪——開場即是獨角獸,這在網際網路應用的時代不可想象。但這隻是極少數個例。更普遍的大量的被暫時認定為第二、甚至第三梯隊的創業者們,則在一級市場境況慘淡。

除了王慧文的局,大模型創業艦隊還至少包括以下這些,清華系盤踞半壁江山。

1、前商湯科技副總裁闫俊傑創立的MiniMax。該公司已達獨角獸規模,但行事頗為低調。投資方包括騰訊、米哈遊、IDG、高瓴創投、雲啟資本和明勢資本等。

2、楊植麟創立的月之暗面。楊畢業于清華和CMU,被認為是中國頂尖的AI研究人員之一,曾與圖靈獎得主楊樂昆和約書亞·本吉奧分别發表過合作論文。他目前是清華交叉資訊研究院助理教授,也是循環智能聯合創始人。這個項目很多VC願意投,因為楊年輕,本人有技術号召力,團隊裡也有衆多技術明星。同時,他積累了一些創業經驗,大模型是他的第二個創業項目。據了解,紅杉對這個項目有孵化作用,紅杉與真格是天使輪投資方。

3、清華計算機系李涓子和唐傑教授擔任首席科學家的智譜AI。該項目特色是,首席科學家的學術地位高,産品ChatGLM推出得早且效果不錯。該公司CEO張鵬是李涓子和唐傑同門師弟,師從王克宏教授。張鵬說,他們所在的知識工程實驗室有既做科研又做工程落地項目的傳統,智譜AI脫胎于此前嘗試的業務:科技情報系統。正是做這套系統期間,他們找準大模型賽道,于2020年開始投入。

這家公司的氣質更偏學院派和技術理想主義,張鵬對内有一句名言:“我們現在不管融多少、掙多少錢,都是我們通向 AGI 這條路上的盤纏。”該公司目前為B輪,投資方包括啟明創投和君聯資本。據了解,按照國家知識成果轉化的相關規定,清華大學也占該項目一部分股份。

4、王小川創立的百川智能。王小川是搜狗創始人和前CEO,項目優勢是創始人有技術背景,在這輪創業中最大的标簽是做過搜尋引擎。他們獲5000萬美元融資,啟動資金來自王小川與業内好友的個人支援。

5、前Google科學家、出門問問創始人兼CEO李志飛。他原本打算另起爐竈創業做通用大模型,但很快,随着巨頭和資金瘋狂湧入,大模型的門檻被踏得粉碎。于是,他選擇了一條更現實的路——基于出門問問原有業務繼續做大模型底層及各類應用。這讓他暫無融資需求。5月底,出門問問向港交所遞交上市申請。

6、周伯文創立的銜遠科技。他是清華大學電子工程系長聘教授,在工業界也有建樹,曾任IBM人工智能基礎研究院院長、Watson Group首席科學家;2017年回國任京東進階副總裁,負責AI研究與平台部相關業務。目前該公司完成了數億元人民币規模的天使輪,投後估值為10億元人民币,投資方包括啟明創投和經緯創投。

7、藍振忠創立的西湖心辰。他目前是西湖大學教師、深度學習實驗室負責人。藍畢業于CMU,後在Google AI部門做自然語言處理和計算機視覺的研發,曾主導研發了谷歌大模型BERT的輕量化版本:ALBERT。回國後,藍創業起步做心理咨詢的垂類模型,通用大模型出現後他意識到這個很容易被颠覆,因而轉型。西湖心辰的投資人包括藍馳創投、百度風投和湯姆貓。據了解,王慧文曾接觸并想收購西湖心辰,邀藍振忠加盟,但最終沒談攏。

8、前微軟亞洲研究院副院長周明創立的瀾舟科技。投資方包括創新工場、聯想創投、中關村科學城等。

9、清華計算機科學與技術系長聘副教授黃民烈創立的聆心智能。投資方包括清華控股、智譜AI、無限基金SEE Fund等。

10、豈凡超創立的深言科技。他是清華2017級博士畢業生,師從清華計算機科學與技術系教授、人工智能研究院常務副院長孫茂松。孫茂松是深言科技的首席科學家。投資方包括紅杉、奇績、騰訊、好未來等。

11、清華計算機科學與技術系副教授劉知遠創立的面壁智能(劉知遠也是孫茂松的學生)。投資方包括知乎和智譜AI,知乎CTO李大海已兼任面壁董事兼CEO。

12、創新工場董事長兼CEO李開複籌組的“Project AI 2.0”項目。

……

一位基金管理合夥人将這輪大模型創業者分三派:大佬派、學院派和已在路上的創業者。

中國大模型現狀:一面狂熱,一面冷峻

“最後一拉發現,就這十來個項目。大家就集中在投這十來個項目,融不到錢的就融不到錢。”另一位基金的創始合夥人說。

“所有人都知道哪些人要創業,這是前所未有的。”一位基金的合夥人說。據他觀察,中國創投行業2023年上半年的情形是,一線投資人見面會先對一遍你見了誰,發現大家都見過,接着交流觀點,最後,“所有人都一起進了”;而二線投資人見不到其中許多創業者。同時,一線基金也大多由老闆親自去見創業者,是以“這次投資對年輕的投資人不友善,大佬直接跟大佬都認識,不需要通過年輕人找項目”。

上述創始合夥人分析稱,組局背後有多重成因:其一,大模型創業是太過昂貴的遊戲——這不僅展現在人才密度高及相應的人力成本上,更展現在資金門檻上。“要做大模型,怎麼也得融個2億美金以上,或者說pipeline裡頭有2億到3億美金——人家排着隊要給你錢的,得有這麼多。”他估算稱,“差不多一個創業公司一年燒5000萬美金到1億美金是很正常的。”其二,它的商業化落地周期漫長甚至遙遙無期,要打持久戰役。其三,這件事不是一個人就能幹出來,需要一組人,包括但不限于算法、架構和工程的頂級人才。

而更關鍵的是,這次機會實在太大了,即便大佬們也害怕擦肩而過。

況且,此次形勢特殊。“不太像自然增長,而是有點拔苗助長的意味。”一位參投了上述大模型項目的投資人稱。

“這個時代跟淘金時代很像。如果你那個時候去加州淘金,一大堆人會死掉,但是賣勺子、賣鏟子的人永遠可以賺錢。”陸奇曾說道。他判斷,大模型是平台型機會;以模型為先的平台,将比以資訊為先的平台體量更大。“有可能這是曆史上第一個10萬億美元的公司。”是以不論如何,很多人都要奮力一搏。否則,“The price is too big(代價實在太大)”。

于是,大佬與大佬們在中國AI浪潮的起點通過資本結盟。他們既是朋友,又是利益共同體。他們開出手中一張張巨額支票,原因很簡單——重金賭注大方向和他們信任的人。

這場豪賭甚至違背了一些VC内部判斷标的的準則。未來應用場景是什麼、商業模式如何、燒錢要燒多久才能看到回報,甚至這裡究竟有沒有創業公司的機會、VC能不能從中獲利等現實考量,很多并無清晰答案。但他們為自己購置了最奢侈的入局門票。也因為有錢,這增加了所有人的底氣。

後來,沒參投的投資人再去約見某些創始人,對方禮貌地回絕了。他說,自己實在太忙,因而,隻有時間見投過錢給自己的人。

02 久違的狂熱下,投資人出手異常審慎

如果你以為,過去5個月中國VC在新一輪技術革命的高亢情緒中積極出手,那就大錯特錯了。

針對這股驟起的技術浪潮,投資人心态迥異。一位網際網路公司高層人士觀察調侃稱,他今年見到的VC大體分三類,第一類是興奮派,他們覺得這是彎道超車的一次良機;第二類是保守派,這類VC大機率是過往紅利的既得利益者,不希望大變革發生;第三類則是焦慮派,因為今年一二月份剛把項目處理好,春節ChatGPT火了後,所有規劃要推翻重來,因而很焦慮、很沮喪。

表面看,中國風投業正經曆着自移動網際網路浪潮紅利消弭後,久違的狂熱。

“所有人都被攪動了。”藍馳創投管理合夥人朱天宇說,“過去三五年都沒有見過,這麼密集的創始人在active地想要幹什麼事。”

據他觀察,這些人很多經曆過移動網際網路增長陡峭的黃金時期,不少人已“成功上岸”,過去兩三年要麼賦閑、要麼旅居海外,“到後來都感覺要養生了”。但最近,他們全出來了。而他自己,這幾個月生活軌迹驟變,每周見項目的數量是過去的3至4倍。

這從技術突破上有迹可循。深度學習創始者、全球前十大AI科學家之一的特倫斯·謝諾夫斯基(Terrence Sejnowski)表示,大語言模型帶來了深度學習新範式。最大改變是,此次生成模型采用自我監督學習方法,不再依賴标記資料——以前需要給資料打标簽,這是有監督學習,需要人工标注因而耗費資源;而通過自我監督,可以直接使用資料。

“美妙之處在于,你隻需要訓練它預測下一個單詞或句子。如果訓練資料無窮,就不再有限制了。”他說,“一切都将在你的有生之年發生轉變。”

更直接的是,從去年Midjourney、Stable Diffusion誕生起,AI就從純粹的技術演化變成終端使用者可感覺的産品,ChatGPT更将此推向高潮。技術突破外加殺手級的終端産品,成為AI浪潮的引爆點。

投資人的共識是:AI浪潮不同于元宇宙、區塊鍊等短暫風口,它有長期價值支撐,會是未來十年的機遇。現在隻是開端。是以不論主動或被動,他們都在盡可能多地搜羅AI項目,各地黑客馬拉松也如火如荼。

然而,中國VC過去5個月真實的出手數量與這種看似火熱的情緒相比,反差巨大。

綜合多位基金的投資人稱,今年真實的交易數量,和在去年處于市場冷淡低迷中的投資數量并無二緻,有的基金甚至比去年同期縮減了三成。

“大家都在積極地看。”上述基金創始合夥人說,“但是你說大家在很active地出手麼?也沒有。”他所在的基金和市場上很多基金一樣,截至當時,今年一個AI項目都沒出手。

謹慎的原因有很多。第一層原因是,中國大模型還沒有穩定下來一個格局,因而上面的應用難以生長。而通用大模型到底是巨頭的盤中餐還是創業公司的新機會,尚無定論。

一種觀點是,OpenAI有機會,是因為美國巨頭都“打瞌睡了”,而中國第一波覺醒勢要追趕的就是巨頭們。是以一類從根本上相信大企業更有機會的投資人,會謹慎把錢投向要做通用大模型的創業者。另一類投資人相對糾結。“紅杉是錢多,要錢不夠多,你也不會在多家公司都放一點。”倘若不是同時下注,就要從牌桌上挑選最有可能決勝的一家,但現在除了分析創始人,可供判斷的次元太少,難以決斷。

第二層原因是,如果不投通用大模型,投資人就會看垂直領域大模型。這也面臨兩難。首先,垂直領域的資料需要特别且稀缺;其次,它具備的能力必須不是大模型“伸伸手就能做的”,比如大量的文字生文字就是大模型能覆寫的能力,價值不大。那麼,究竟哪些行業資料足夠深,能建立的門檻足夠高,創業公司又能做,答案亦不清晰。這導緻“劃掉一些不應該投的很容易,但回答什麼是應該投的,沒有答案”。

一位投A輪左右輪次的投資人觀察說,“中國這種項目還比較少,大家都在一窩蜂地搞通用大模型”,是以作為投資人“要是不投大模型,國内标的有限”。

第三層原因是,一切變化太過迅疾,投資人們找不到恒定不變的錨點是什麼。“現在,就覺得什麼東西都像在流沙上一樣。”這在VC中滋生出一絲悲觀主義氣息——既然底層的大模型什麼都能做,上面的應用看起來隻是在“雕花”。“在移動時代,一個産品很驚豔,那很好;但今天會想,它能讓你體驗這麼好的原因,底層如果是大語言模型,但這個模型不是團隊自己的,同時模型本身也會變”,這就讓以前認知中的很多經典意義上的護城河失效了。

另外,大部分投過上一輪AI和軟體企業的投資人,在這一輪更加克制。因為他們知道,若商業模式僅限to B,一來,中國的商業環境對于SaaS産品“土地不平整”,大量企業沒有數字化,SaaS産品無用武之地;二來其商業化落地會相當遲緩。

這些都緻使面對今天激動人心的技術大爆發,很多中國VC的态度是:仍在觀望中。

不過,在一片謹慎的VC間,這幾家基金稍顯例外——若單從投資項目數量看,源碼、奇績、真格、藍馳、五源、紅杉等,在場上的表現相較同行更活躍。

朱天宇理性分析道,他們也對比了網際網路爆發的時間圖譜,結論是AI還處在很早期的階段,“有些現在冒出來的應用,不一定是穩定的、能站得住的機會”。即便如此,這幾家基金表現踴躍,背後原因很容易了解——藍馳、奇績、真格是投天使輪的基金,而紅杉、源碼、五源近些年也加重了投早期的力度。越是投早期,越是笃信“人是生産要素裡最活躍的因素”,他們更樂于在沒有一張BP、隻有人的階段出手。

“很多人覺得變化太快,現在不敢下手。但現在就是要bet on founders(賭注創始人)。”朱天宇說,“founder是船長,他在驚濤駭浪裡navigate(導航),出現變化讓他來解決。”

但總體而言,中國大部分VC的真實出手數量遠遠低于他們表現出來的高漲情緒。“我想很客觀說,除了大佬,事實上拿到投資的人是有限的。”另一位美元基金的合夥人說道。

一面狂熱、一面冷峻——這是中國大模型現狀。

03 向垂直的大模型場景跑馬圈地

在中國,創業公司們正一條腿奮力追趕OpenAI,争取複現它的能力;另一條腿已經邁入新場景的跑馬圈地中。

他們的目标和方向早就默默分化,李志飛是其中典型代表。剛開始,他一心想複制ChatGPT,探索AGI天花闆;但不久他的心态變了——這位在AI領域已創業十年的老兵認為,不想清楚商業模式而一味地做通用大模型,到最後會很痛苦,尤其在中國這個比美國競争激烈10倍的市場。

“我其實是希望勸一些人不要去做大模型。與其現在就匆匆忙忙跳進去做通用大模型,不如多想想我做出了通用大模型以後又怎麼樣。”他說,“包括大佬們。他們可能走進了一個,他們不知道是什麼、也不一定像他想象中擅長、最後也不一定是喜歡(的地方)。”他目前訓練的模型是百億規模。

“你看現在十幾個團隊,但做非常通用的大模型可能也就三四個團隊。”在藍振忠看來,通用大模型有強大聚攏效應,OpenAI這樣的先行者有先發優勢。而大模型與産業做深度結合,或者做個性化大模型(比如幫不願意将私有資料交給巨頭的公司做大模型),這些是創業公司可另辟蹊徑的機會點。他稱,西湖心辰會做情感對話模型,相比現有大模型,他們會更注重訓練它的情商。

周伯文将生成式人工智能能重塑格局的場景分為兩類:存量市場和增量市場。第一類是在已有場景上進一步提升效率,比如将其應用至客服、辦公等場景,但總體這類是幫已占據這些場景的的公司做大做強。另一類才是創業公司的機會,這類市場由于沒有大模型出現,導緻“從來沒有人想過這些問題可以這樣解決,是以沒有哪家企業在這些場景上把它全做起來了”。而由于生成式人工智能的誕生,可以孕育出新場景和新模式。他的創業方向是做壓縮消費者和商品之間關系的通用大模型及應用。

到最後,多位創業者表達了相似觀點:能跑出來的中國大模型創業公司,很可能是垂直整合型。即,在做底層大模型的同時,自己找準一個主應用場景,收集使用者資料并做快速疊代,兩條腿走路,缺一不可。

“一橫一縱都要做,但是縱(指垂直應用),可能比橫的要粗一點。”一位基金的管理合夥人判斷道,“通用大模型是聖杯,大家都要拼一下,但實際上chance slim(機會很小)。你看OpenAI,到後來也沒幾個VC,而是非正常的機構。”

金沙江主管合夥人朱嘯虎公開稱,金沙江是國内垂直AIGC出手最多的早期機構之一,他認為不要迷信通用大模型,對于大部分創業者,“場景優先、資料為王”,應當訓練自己的垂直模型。

朱天宇的觀點是,通用智能在三五年就會把人類存量的資料和知識吃完,接下來靠什麼?就靠在新的場景裡帶出增量的資料飛輪持續投喂。誰率先找到那個場景,讓AI改變這個場景的效率和體驗,讓賺錢、賺資料、賺知識這三個飛輪同時轉起來,這個垂直方向就會是誰的。

但具有巨大增量的新場景究竟是什麼?沒有人能給出肯定答案。

可以看到,中國大模型生态尚不繁榮。在美國,OpenAI正快速建構自己的生态,這是與OS(作業系統)類似的底層機會,差別在于這一代AI産品經理更需要洞察怎麼應用好Plugin(插件)。而在中國,以智譜AI為例,雖然它已是國内聚攏開發者較多的大模型,但對比OpenAI的生态仍然薄弱。以他們6月25日剛舉辦的50人小規模釋出會看,它目前的發力點是私有化模型部署和共享算力平台,幫助生态夥伴建構垂直大模型,而其生态夥伴大多還沒想好用大模型做什麼,處于試用和摸索階段。

一位垂類公司創始人說,生态不繁榮的根本原因是,國内還沒有人做出讓人足夠吃驚的産品。

就在市場火熱、大小公司紛至沓來争奪大模型基礎設施之時,位元組跳動創始人張一鳴也親自帶隊研究大模型。他不僅自己閱讀論文,在他、梁汝波(位元組跳動CEO)、楊震源(位元組跳動VP)等與一家投資團隊視訊交流中,張一鳴抛出了一個很根本的疑問:未來如果這個模型是PaaS(平台即服務),開源和不開源有什麼差別呢?

據知情人士透露,楊震源與智譜AI接洽,有意與其大模型産品合作。

也許,中國大模型的競争不在底層,如何深入場景應用、建立一個繁榮生态才是平台們的重中之重。而最終,能得到大模型底座聖杯的各路創業者和 VC鳳毛麟角,甚至于根本沒有。

一位對AI有研究的連續創業者說,經過中國大模型上半年的狂飙後,很多從業者已冷靜下來。他們意識到,“這次是機會,也是殘酷的被剝奪”。在美國,創業者想到的一些創業方向,有的很快被ChatGPT自己做了,有的被Sam Altman任總裁的Y Combinator所投資的公司做了,同時,“微軟也是以壟斷者的角色往下推進”。而中國的格局更不明朗。

“我們看到的是,一半是繼續狂熱的未來,一半是創始人意識到自己可以運作的空間并不那麼大。”他說。

最新消息顯示,王慧文由于疑似抑郁的健康問題暫時從光年之外離休,而光年之外一直被認為是大佬創業艦隊中拿錢、招人進展最迅猛,也是最有旗幟性的一家。多位業内人士對這個突然的消息表達了意外,并真誠地希望他快點好起來。這更給中國大模型的當下現實增添了幾分冷峻色彩。

就在一團團迷霧中,中國人工智能正走過它崎岖而混沌的序章。

繼續閱讀