天天看點

大模型創業300天:成者100億估值,80%敗者出局

大模型創業300天:成者100億估值,80%敗者出局

作者:楊曉鶴,頭圖來自:視覺中國

2023年,知名投資機構老虎基金募資不成的消息,悄然傳遍了整個網際網路。

在習慣了風口創業的過去10年中,“投資人寒冬”似乎還是第一次出現。這與新消費、直播帶貨、元宇宙幾個風口悄然落幕,并購和中概股等退出管道的大門半遮半掩,種種不利因素都息息相關,創投市場似乎要真正冷清下來。

創業公司融資艱難,大佬的二次創業也不好找方向。從美團退休的王慧文,研究了好一陣的Web3和元宇宙。被騰訊收購公司後離開的王小川,試水了AI醫療。但一切轉變在2022年末,ChatGPT 3.5釋出,迅速讓市場形成共識,AGI(通用人工智能)時代來了,全行業開始跑步入局大模型。

據了解,當時在低調創業的王小川,已經成立了公司做智能硬體。意圖幫助有睡眠障礙的上億人,打造一款治療打鼾的智能枕頭。當3月份大模型熱潮興起後,王小川用了2周時間做了決定,放下這個創業項目,布局大模型。

王小川找來原搜狗CTO楊洪濤幫忙接管醫療項目,原搜狗COO茹立雲在這家公司的股份,也兌給了楊洪濤,追随王小川的大模型創業。王小川共拿出5000萬美元成立“百川智能”,并邀請了Soul的技術人才來做算法負責人,加速去做大模型。而王慧文的故事,大家就十分熟悉了,酒桌上釋出英雄招募貼,成立光年之外公司做大模型。

在網際網路大廠中,大模型也帶來了翻天覆地的影響。有大模型的項目負責人,年前因為升職不成的問題,進而提出離職。年後3個月時間後,該集團CEO就成為大模型的總負責人,舉公司之力All in大模型。

沒有人想錯過這波AGI時代的浪潮,大家都相信AI在經過三起三落的發展後,通用人工智能的奇點正在來臨。畢竟在AI熱潮下,類似ChatGPT和Midjourney等幾十人規模的公司,創造40億美金左右的估值,美股“七巨頭”總市值一年飙至11萬億美元,大漲60%。這些激動人心的爆發式增長的故事,再一次攪動了國内科技商業市場。

國内網際網路大廠中,李彥宏、張勇、張一鳴、王興等大佬都已經親自挂帥,可以說除了拼多多,已經全部入局大模型。正如7月19日,微軟和英偉達的市值增加了1750億美元,馬斯克在評價相關推文時驚歎:“瘋狂的時代。”

大模型創業300天:成者100億估值,80%敗者出局

即将沉寂的科技商業市場,突然迎來了AI這一興奮劑,也讓網際網路進入了最後一次的狂歡。

一、低谷中燃起的新曙光

李明是一家創業公司的CEO,團隊規模在100多人。2023年是他最為融資發愁的一年。

最開始創業的過程十分順利,早期拿到知名天使投資機構的天使和A輪融資。“那時候工業網際網路還是個熱門賽道,也不像很多AI項目那麼浮誇。”李明告訴AI鲸選社,但2023年中,他在啟動的新一輪融資中,慢慢發現了行情不對。

投資機構不僅看資料和故事,還要看營收了。此前執着産品化的李明,根本還沒意識到,投資風向的變化。用梅花創投創始合夥人吳世春的話講,就是現在投資項目“既要(技術),又要(資料),還要(營收)”。沒辦法,他開始找FA機構幫助融資,而且融資輪次也退步,求個A++。

“FA幫找了30多家投資機構,都不了了之了。”融資的不順利,讓李明有些洩氣。但在6月份,他感受到大模型的威力,于是内部上馬了基于ChatGPT的産業化業務。“現在也還沒融到資,不過投資人會主動找來交流,對方明顯感興趣了。”

而對于袁進輝的一流科技來說,大模型也是個救命稻草。2022年,這家做AI深度學習架構的公司,已經到了融資不順,不得不裁員生存的地步。此前公司3次瀕臨資金鍊斷裂,都是找天使投資人,也是當時快手CEO的宿華借錢。

“做的事情和百度的飛槳、華為昇思差不多,最重要的是那時候市場大模型訓練的業務還沒起來。”一流科技員工告訴AI鲸選社,公司屬于有錢的時候(2021年)沒業務,有業務的時候(2023年)沒錢了。

就在袁進輝感覺前途無望的時候,2023年公司迎來了收購的機會。2023年4月份,在清華科技園的一流科技公司内,迎來了一位貴賓,他就是剛剛宣布進軍大模型的美團聯合創始人王慧文。

最終的收購價格還可以,一位被裁員的一流科技的員工告訴我們,“能與上一輪高瓴資本投資的估值相當,自己的期權也有着落了。”

而成為光年之外聯合創始人的袁進輝,終于再也不用為融資發愁。王慧文的融資能力,在當下創投圈無出其右。根據後來的美團收購協定顯示,光年之外在沒有大模型産品的情況下,就融資了20億元。

當然,這波行動中更早布局的投資人,已經成功狩獵到獨角獸。

Minimax是在2021年11月成立,在2022年1月獲得天使輪投資,2023年初公司估值就達到獨角獸級别。最早4家投資機構中,還有上海遊戲公司米哈遊,據悉是因為兩家創始高管中有家人關系。而據鲸選社了解,智譜最近也在以100億人民币的估值融資。

這兩家公司的成立時間都不到2年,卻都已經成為獨角獸,大模型賽道的發展速度驚人。

而AGI熱潮,對于那些老牌AI公司也是一次救贖。此前,出門問問的IoT上市故事,已經曆經幾次無功而返。伴随着大模型“序列猴子”和4款AIGC産品的故事推出,盡管其大模型還小心翼翼不對外公開測評,但也讓出門問問終于有了新故事可講,目前已經送出港股上市申請。

更多的大模型和AIGC創業者走在了路上,甚至在一家創業營裡,60%的項目都和AI相關,擁有輕資産、高壁壘、天花闆高的優點,AGI徹底成為當下最火的賽道。

二、将AGI的夢想做到最巅峰

如果說2023年是大模型創業“元年”。那麼網際網路大廠最早入局大模型的“源年”,則可以追溯到2019年。

阿裡是2019年9月開始布局大模型,2021年4月釋出PLUG大模型。而早在ChatGPT 3.0面世之前,國内就已經有多家萬億參數的大模型,他們分别是達摩院的M6和華為雲的盤古大模型,以及智源的悟道2.0。和ChatGPT相比,盡管模型參數超越了,但資料豐度不一樣,效果還沒法比較,在達摩院的張聰看來,國内大模型起大早趕晚集,最重要的是沒做兩件事。

第一件事是沒做對齊。那時候阿裡有很多大小模型,主要沒有做訓練結果對齊。“你看現在ChatGPT能做詩會聊天,很像人的智力,實際上就是與人的價值觀對齊。”張聰講道,這些都需要對推理結果進行人為調整,而不是用機器的邏輯去做。

第二沒有去做高品質的資料集,ChatGPT早期利用菲律賓的大學教授進行資料标注,國内是利用中專生做标注,語料的問題也十分影響結果。在張聰看來,7月19日公布的Llama 2的精調Chat模型,就是在100萬人類标記資料上訓練的,訓練token總數增加了40%,相比Llama的提升是全方位的。“是以大模型并不是大力出奇迹的發明,而是精心設計的工程創造”。

并且反觀國内AI産業,也會面臨很多其他因素幹擾。當時,達摩院主要有兩個團隊做大模型,一個是金榕上司的機器智能團隊,司羅負責的是AliciMind;一個是周靖人上司的自然語言實驗室,其中楊紅霞負責的是大模型M6。

在2022年末的測評中,M6大模型的成果稍具優勢,二者最終整合成現在的通義大模型。“實際上,達摩院大模型團隊隻有二三十人,主要它的預訓練,都放在阿裡雲。”張聰告訴AI鲸選社,不過現在通義是集團的重要項目,涉及到的人員有600多人,現在很多資源都傾斜給大模型,集團CEO每2周過問一次技術進展。

而對于百度來說,這波AGI熱潮,可是自己從2016年就預言來臨的AI時代,自然也不會錯過。

今年2月7号在内部正式立項,3月16号正式釋出。這期間直接上升到百度集團優先級最高的項目, 李彥宏親自督戰,CTO王海峰博士直接挂帥,那時候百度陽泉超算中心就專門為大模型訓練。

百度算法工程師趙輝告訴AI鲸選社,百度自然語言處理部一直就在研究NLP等技術,首席科學家吳華也一直是上司,這個部門就有幾百人。百度的ERNIE2.0後轉成文心大模型,“以前就在做百度大腦,現在都說是大模型文心麼。”

做的事情有相似,當然也有差別。趙輝提到,以前百度會做很多垂直搜尋的Rank,就是為了根據人為的點選,重新排序搜尋的結果。大模型出現後,這些能力都會被沉澱在大模型的算法中,也有利于給出的回答更精準。

對于百度來說,大模型推動下一代搜尋質變,已經寫進了李彥宏的OKR。不過,對于生态來說,百度的文心大模型是基于bert模式,“包括智源的GLM都是獨立的技術路線,和國際的GPT并不一樣。”一位百度雲的人員告訴AI鲸選社,這點其實倒也不用擔心,文心千帆什麼類型的模型都有,GPT2、3、4也非常不同。

而說回從阿裡離職的楊紅霞, 她在去往海外後,也被位元組跳動挖去做北美大模型的研發負責人。張一鳴一直在研究大模型會開源還是閉源,是以也沒要求集中力量趕工。“年底前會有真正意義上的突破。”楊紅霞對AI鲸選社說道。

綜合來看,位元組跳動應該是繼百度之後,在業務上與大模型更比對的公司。有獵頭告訴我們,雖然大模型不着急,但在AIGC領域還是挺激進。比如TikTok在做廣告創意業務AIGC,總監職務給出預算100~150W,要求是88後帶隊。

至此,網際網路大廠除了拼多多,已經全部入局大模型。大廠入局的熱情,甚至比當年的O2O和直播還有過之而無不及。

三、分水嶺突然出現的那一夜

6月份,在北京搜狐大廈,光年之外這家融資最多的大模型企業,正熱火朝天地創業。

原一流科技的Oneflow深度學習架構還尋思繼續做,但被大模型業務抽調了很多人。可就在6月23日,突然有人在社交媒體上透露王慧文病了,當時公司還有人去求證,得到的是沒有這回事的消息。可是在25日晚,美團突然宣布聯合創始人王慧文因為抑郁症住院,辭去公司董事一事,其創業的光年之外公司面臨出手的新聞。

一時間,光年之外做不下去,王慧文提前跑路的新聞,成為一些人的猜測。AI鲸選社從投資人圈得到的消息,是王慧文的病情确實很嚴重。最後王慧文睡在上鋪的兄弟,美團創始人王興幫助接盤了光年之外。

大模型真的不行了嗎?大家萌生出此疑問。那期間,正好知名投資人朱嘯虎和獵豹創始人傅盛也在朋友圈争論,大模型行業是否有泡沫。朱嘯虎極度看衰市場一擁而上,做通用大模型的現狀,認為絕大多數都會在年底死掉。

光年之外的主動變動,也是否印證了朱嘯虎的言論?

從AI鲸選社獲得資訊看,收購了光年之外的美團,目前并沒有停止大模型的腳步。不僅獨家投資了智譜AI數億元,當下還在招聘大模型的項目總監,給出的年薪高達300萬元,甚至還在美國成立技術研究院。賺辛苦錢的美團,也并不想在這波科技大潮中落後,尤其在餓了麼明确要接入通義大模型,有業務競争的攜程,也已經推出了大模型之後。

但對于國内市場來說,通用大模型确實已經太多。據不完全統計,短短不到8個月時間,已經有超過85家大模型釋出,其中很多成了上市公司的套現概念。

Wind資料顯示,2023年24家“AIGC概念股”已經合計發生67筆減持,大股東的離婚潮也令人驚歎。2023年初至今,近十家AI闆塊公司大股東家庭被曝離婚。備受關注的是,A股AI企業昆侖萬維,最近就發生占股11%的李瓊女士(創始人周亞輝的前妻),計劃減持3%的股份(大概13億元),然後有息借給公司。據了解内情的人向AI鲸選社介紹,感受到了AGI紅利的昆侖萬維,不僅做了大模型,最近還在密集組建團隊,全力以赴做對标微軟的Copilot。

上市公司利用AGI 抓緊炒概念,套現離場。大模型創業公司則在内卷到死。

一位在近期成立了AIGC基金的投資人張陽告訴我們,伴随着開源免費且強大的Llama 2襲來之際,下半年很多大模型企業勢必會面臨融資難的問題。

如今一切已經有端倪,在7月11日,百川智能推出了百億級别參數的大模型Baichuan-13B,不僅宣布開源,同樣還是免費可商用。雖然Baichuan-13B的參數規模不大,但是基于精準的中文語料訓練,在百億規模參數的大模型中,百川經常排名頭部。

Baichuan-13B的免費政策,大大沖擊了國内大模型付費行情。目前,智源AI就在14日宣布,企業登記獲得授權,允許免費商業使用ChatGLM-6B和ChatGLM2-6B。

越來越多的大模型開源免費後,大模型的死亡淘汰賽正式開啟。一位基于大模型創業公司的CTO對AI鲸選社表示,智源的大模型從最開始的私域部署要2000萬元,到年初的調用價格為180萬到30萬選包,再到現在的免費,行業變化非常之快。傅盛認為這是市場從大模型參數之争,進入生态規模之争。

網際網路大廠并不愁生态建設,由于内部模型非常多,也有免費和付費之分,最主要的大模型目前還是閉源和付費形态。創業公司要建立生态就比較困難,很多初創企業做大模型已花光了力氣,做生态就難免力有不逮。據了解目前MiniMax是創業公司中,為數不多堅持公有雲,做MaaS模式的大模型企業。

丁香園CTO範凱形容這波開源免費潮,就像把自來水廠(大模型)免費接到使用者家裡,讓每家人手一個水龍頭,那些閉源的自來水廠,最好你的水無敵好喝,大家才願意付費去你那。

四、AGI發展進入分岔路口

分水嶺出現後,當下創業競争已經發展了三派。

一派是堅持全自研大模型,都是實力選手。這一派主要是百度、阿裡、位元組等網際網路大廠以及智譜、MiniMAX、銜遠等創業企業。但這些實力選手也被劃分成兩類企業。

第一類是堅持做自研的通用大模型,對标ChatGPT,不斷追趕ChatGPT的疊代速度。

在雲啟資本董事合夥人陳昱看來,通用大模型是必經之路,垂直大模型發展受限。“因為對于通用大模型而言,垂直領域并不需要重新訓練,通用大模型可以通過向量資料庫做行業深化,垂直大模型卻很難智能湧現。”

從目前看,有夢想的肯定還要做通用大模型,畢竟做成了可以成為下一個網際網路大廠。ChatGPT 在協同辦公、電商、代碼生成、輔助設計等領域已經展現出了這種颠覆性潛質。

第二類是認清現實聚焦落地,堅持做垂直大模型,這一派包括最後達成觀點統一的朱嘯虎和傅盛,二者都認為垂直大模型将更有産業适用性。

通用大模型一般是在千億參數以上,而垂直大模型則在百億或者70億規模左右。達觀資料的大模型産品曹植,參數就都在500億規模之間。

據達觀資料的CEO陳運文告訴AI鲸選社,“曹植”大模型采用混合訓練資料方案,分别是50%的通用混合語料+50%垂直專業語料。“我們在金融、政務等領域做文本智能很多年,很多資料是獨有的,客戶也要求我們做私有化訓練。”陳運文告訴AI鲸選社,“以前四五個人用一個星期做一份報告,現在AI半天做好了。”

放棄成為下一個ChatGPT的夢想,才能在商業場景中盡早落地,這是很多垂直大模型的清醒認知。

在行業看來,通往AGI聖殿的第二條路線,是基于别人的模型(如GPT),然後結合自己的行業Know-how去做訓練。“對于第二類能不能成功,我覺得需要時間去驗證,現在還不明确。原因在于大家還不知道如何把行業Know-how去和大模型做融合的有效路徑,如何在有護城河的同時又有可持續的商業模式,這仍是個未知數。”

“尤其很多大模型,本身就有套殼的嫌疑,”投資人張陽告訴AI鲸選社,結合行業做商業化的時候,就會面臨很多問題。據悉,兩個知名同姓創業者的大模型,是基于Faceboook的開源Llama;某遊戲和防護公司用的是智源大模型的基礎架構。

更強的開源大模型正在來襲,Meta近期釋出免費可商用版本Llama 2,傅盛對此就在朋友圈表示:“這一下不知道多少公司笑醒在深夜,多少公司哭暈在廁所….”朱嘯虎對此也評論道:很多人要笑醒了吧,大家都可以Take free ride(搭便車)了。

傅盛的“笑醒”所指,和朱嘯虎略有不同。傅盛笑醒指的是使用開源大模型開發AIGC應用的企業,也能做出更好的産品,朱嘯虎笑醒是指那些号稱自研實則套殼的大模型企業,最近也要宣布更新了。大家所指的哭暈内容相同,都是那些号稱自研的大模型企業,國外大模型最強之一Llama 2 宣布開源免費,大家都基于相同的開源大模型,怎麼在行業中做出特色能力?

AGI的第三條路線是純粹做應用,是将模型拿來直接使用,這種的壁壘會較低。朱嘯虎也不看好這類模式,認為如果90%的能力是ChatGPT 提供,那麼AIGC應用就沒有什麼投資價值。

在OpenAI的生态中,山姆·奧特曼承諾盡量避免做應用層,和生态開發者競争,是以效仿Google做了ChatGPT Plugin,從目前看,國内還沒有誰做出這種承諾。

文心一言和通義千問,已經有了上百個功能更新,這些功能也覆寫了一些開發者的工作。雖然文心一言也有插件,但目前就兩個,一個是百度搜尋,另一個是ChatFile(長文檔的分析處理能力)。百度千帆和阿裡魔搭的生态發展如何協調,還是個有挑戰的命題工作。

堅定看好AGI的朱嘯虎,認為通用大模型的創業和投資視窗期已過,不絕對依賴某家大模型能力的AIGC,才是AGI時代低垂的果實。比如,近期朋友圈突然蹿火的“妙鴨相機”,算是國内AIGC第一個爆火的産品,國外也曾火過類似的産品“lensa”,月收入曾達到800萬美元。

時代的浪潮襲來之際,投資人吳世春就曾打趣問道朱嘯虎:“投AI賺的錢把投SaaS虧的錢,彌補回來了嗎?”朱嘯虎回答,還沒,但是AI的前景無限。

目前,創投圈也都認可朱嘯虎表達的道理,但很多人并不期待朱嘯虎說出實話,諸如“ChatGPT對創業公司很不友好,未來兩三年内請大家放棄融資幻想”這些帶有寒意的話。

“大模型就是網際網路的房地産,就算有泡沫也是美麗的泡沫,”一位剛下場做AI職業教育教育訓練的創業者說道,雷軍曾在2013年網際網路紅利消失之際疾呼,要相信網際網路的力量,今天我們也要相信AGI,無論它有沒有泡沫。

注:本文中李明、張聰、趙輝等為化名。

本内容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯系 [email protected]

正在改變與想要改變世界的人,都在 虎嗅APP