大模型創業300天：成者100億估值，80%敗者出局

作者：楊曉鶴，頭圖來自：視覺中國

2023年，知名投資機構老虎基金募資不成的消息，悄然傳遍了整個網際網路。

在習慣了風口創業的過去10年中，“投資人寒冬”似乎還是第一次出現。這與新消費、直播帶貨、元宇宙幾個風口悄然落幕，并購和中概股等退出管道的大門半遮半掩，種種不利因素都息息相關，創投市場似乎要真正冷清下來。

創業公司融資艱難，大佬的二次創業也不好找方向。從美團退休的王慧文，研究了好一陣的Web3和元宇宙。被騰訊收購公司後離開的王小川，試水了AI醫療。但一切轉變在2022年末，ChatGPT 3.5釋出，迅速讓市場形成共識，AGI（通用人工智能）時代來了，全行業開始跑步入局大模型。

據了解，當時在低調創業的王小川，已經成立了公司做智能硬體。意圖幫助有睡眠障礙的上億人，打造一款治療打鼾的智能枕頭。當3月份大模型熱潮興起後，王小川用了2周時間做了決定，放下這個創業項目，布局大模型。

王小川找來原搜狗CTO楊洪濤幫忙接管醫療項目，原搜狗COO茹立雲在這家公司的股份，也兌給了楊洪濤，追随王小川的大模型創業。王小川共拿出5000萬美元成立“百川智能”，并邀請了Soul的技術人才來做算法負責人，加速去做大模型。而王慧文的故事，大家就十分熟悉了，酒桌上釋出英雄招募貼，成立光年之外公司做大模型。

在網際網路大廠中，大模型也帶來了翻天覆地的影響。有大模型的項目負責人，年前因為升職不成的問題，進而提出離職。年後3個月時間後，該集團CEO就成為大模型的總負責人，舉公司之力All in大模型。

沒有人想錯過這波AGI時代的浪潮，大家都相信AI在經過三起三落的發展後，通用人工智能的奇點正在來臨。畢竟在AI熱潮下，類似ChatGPT和Midjourney等幾十人規模的公司，創造40億美金左右的估值，美股“七巨頭”總市值一年飙至11萬億美元，大漲60%。這些激動人心的爆發式增長的故事，再一次攪動了國内科技商業市場。

國内網際網路大廠中，李彥宏、張勇、張一鳴、王興等大佬都已經親自挂帥，可以說除了拼多多，已經全部入局大模型。正如7月19日，微軟和英偉達的市值增加了1750億美元，馬斯克在評價相關推文時驚歎：“瘋狂的時代。”

即将沉寂的科技商業市場，突然迎來了AI這一興奮劑，也讓網際網路進入了最後一次的狂歡。

一、低谷中燃起的新曙光

李明是一家創業公司的CEO，團隊規模在100多人。2023年是他最為融資發愁的一年。

最開始創業的過程十分順利，早期拿到知名天使投資機構的天使和A輪融資。“那時候工業網際網路還是個熱門賽道，也不像很多AI項目那麼浮誇。”李明告訴AI鲸選社，但2023年中，他在啟動的新一輪融資中，慢慢發現了行情不對。

投資機構不僅看資料和故事，還要看營收了。此前執着産品化的李明，根本還沒意識到，投資風向的變化。用梅花創投創始合夥人吳世春的話講，就是現在投資項目“既要（技術），又要（資料），還要（營收）”。沒辦法，他開始找FA機構幫助融資，而且融資輪次也退步，求個A++。

“FA幫找了30多家投資機構，都不了了之了。”融資的不順利，讓李明有些洩氣。但在6月份，他感受到大模型的威力，于是内部上馬了基于ChatGPT的産業化業務。“現在也還沒融到資，不過投資人會主動找來交流，對方明顯感興趣了。”

而對于袁進輝的一流科技來說，大模型也是個救命稻草。2022年，這家做AI深度學習架構的公司，已經到了融資不順，不得不裁員生存的地步。此前公司3次瀕臨資金鍊斷裂，都是找天使投資人，也是當時快手CEO的宿華借錢。

“做的事情和百度的飛槳、華為昇思差不多，最重要的是那時候市場大模型訓練的業務還沒起來。”一流科技員工告訴AI鲸選社，公司屬于有錢的時候（2021年）沒業務，有業務的時候（2023年）沒錢了。

就在袁進輝感覺前途無望的時候，2023年公司迎來了收購的機會。2023年4月份，在清華科技園的一流科技公司内，迎來了一位貴賓，他就是剛剛宣布進軍大模型的美團聯合創始人王慧文。

最終的收購價格還可以，一位被裁員的一流科技的員工告訴我們，“能與上一輪高瓴資本投資的估值相當，自己的期權也有着落了。”

而成為光年之外聯合創始人的袁進輝，終于再也不用為融資發愁。王慧文的融資能力，在當下創投圈無出其右。根據後來的美團收購協定顯示，光年之外在沒有大模型産品的情況下，就融資了20億元。

當然，這波行動中更早布局的投資人，已經成功狩獵到獨角獸。

Minimax是在2021年11月成立，在2022年1月獲得天使輪投資，2023年初公司估值就達到獨角獸級别。最早4家投資機構中，還有上海遊戲公司米哈遊，據悉是因為兩家創始高管中有家人關系。而據鲸選社了解，智譜最近也在以100億人民币的估值融資。

這兩家公司的成立時間都不到2年，卻都已經成為獨角獸，大模型賽道的發展速度驚人。

而AGI熱潮，對于那些老牌AI公司也是一次救贖。此前，出門問問的IoT上市故事，已經曆經幾次無功而返。伴随着大模型“序列猴子”和4款AIGC産品的故事推出，盡管其大模型還小心翼翼不對外公開測評，但也讓出門問問終于有了新故事可講，目前已經送出港股上市申請。

更多的大模型和AIGC創業者走在了路上，甚至在一家創業營裡，60%的項目都和AI相關，擁有輕資産、高壁壘、天花闆高的優點，AGI徹底成為當下最火的賽道。

二、将AGI的夢想做到最巅峰

如果說2023年是大模型創業“元年”。那麼網際網路大廠最早入局大模型的“源年”，則可以追溯到2019年。

阿裡是2019年9月開始布局大模型，2021年4月釋出PLUG大模型。而早在ChatGPT 3.0面世之前，國内就已經有多家萬億參數的大模型，他們分别是達摩院的M6和華為雲的盤古大模型，以及智源的悟道2.0。和ChatGPT相比，盡管模型參數超越了，但資料豐度不一樣，效果還沒法比較，在達摩院的張聰看來，國内大模型起大早趕晚集，最重要的是沒做兩件事。

第一件事是沒做對齊。那時候阿裡有很多大小模型，主要沒有做訓練結果對齊。“你看現在ChatGPT能做詩會聊天，很像人的智力，實際上就是與人的價值觀對齊。”張聰講道，這些都需要對推理結果進行人為調整，而不是用機器的邏輯去做。

第二沒有去做高品質的資料集，ChatGPT早期利用菲律賓的大學教授進行資料标注，國内是利用中專生做标注，語料的問題也十分影響結果。在張聰看來，7月19日公布的Llama 2的精調Chat模型，就是在100萬人類标記資料上訓練的，訓練token總數增加了40%，相比Llama的提升是全方位的。“是以大模型并不是大力出奇迹的發明，而是精心設計的工程創造”。

并且反觀國内AI産業，也會面臨很多其他因素幹擾。當時，達摩院主要有兩個團隊做大模型，一個是金榕上司的機器智能團隊，司羅負責的是AliciMind；一個是周靖人上司的自然語言實驗室，其中楊紅霞負責的是大模型M6。

在2022年末的測評中，M6大模型的成果稍具優勢，二者最終整合成現在的通義大模型。“實際上，達摩院大模型團隊隻有二三十人，主要它的預訓練，都放在阿裡雲。”張聰告訴AI鲸選社，不過現在通義是集團的重要項目，涉及到的人員有600多人，現在很多資源都傾斜給大模型，集團CEO每2周過問一次技術進展。

而對于百度來說，這波AGI熱潮，可是自己從2016年就預言來臨的AI時代，自然也不會錯過。

今年2月7号在内部正式立項，3月16号正式釋出。這期間直接上升到百度集團優先級最高的項目，李彥宏親自督戰，CTO王海峰博士直接挂帥，那時候百度陽泉超算中心就專門為大模型訓練。

百度算法工程師趙輝告訴AI鲸選社，百度自然語言處理部一直就在研究NLP等技術，首席科學家吳華也一直是上司，這個部門就有幾百人。百度的ERNIE2.0後轉成文心大模型，“以前就在做百度大腦，現在都說是大模型文心麼。”

做的事情有相似，當然也有差別。趙輝提到，以前百度會做很多垂直搜尋的Rank，就是為了根據人為的點選，重新排序搜尋的結果。大模型出現後，這些能力都會被沉澱在大模型的算法中，也有利于給出的回答更精準。

對于百度來說，大模型推動下一代搜尋質變，已經寫進了李彥宏的OKR。不過，對于生态來說，百度的文心大模型是基于bert模式，“包括智源的GLM都是獨立的技術路線，和國際的GPT并不一樣。”一位百度雲的人員告訴AI鲸選社，這點其實倒也不用擔心，文心千帆什麼類型的模型都有，GPT2、3、4也非常不同。

而說回從阿裡離職的楊紅霞，她在去往海外後，也被位元組跳動挖去做北美大模型的研發負責人。張一鳴一直在研究大模型會開源還是閉源，是以也沒要求集中力量趕工。“年底前會有真正意義上的突破。”楊紅霞對AI鲸選社說道。

綜合來看，位元組跳動應該是繼百度之後，在業務上與大模型更比對的公司。有獵頭告訴我們，雖然大模型不着急，但在AIGC領域還是挺激進。比如TikTok在做廣告創意業務AIGC，總監職務給出預算100~150W，要求是88後帶隊。

至此，網際網路大廠除了拼多多，已經全部入局大模型。大廠入局的熱情，甚至比當年的O2O和直播還有過之而無不及。

三、分水嶺突然出現的那一夜

6月份，在北京搜狐大廈，光年之外這家融資最多的大模型企業，正熱火朝天地創業。

原一流科技的Oneflow深度學習架構還尋思繼續做，但被大模型業務抽調了很多人。可就在6月23日，突然有人在社交媒體上透露王慧文病了，當時公司還有人去求證，得到的是沒有這回事的消息。可是在25日晚，美團突然宣布聯合創始人王慧文因為抑郁症住院，辭去公司董事一事，其創業的光年之外公司面臨出手的新聞。

一時間，光年之外做不下去，王慧文提前跑路的新聞，成為一些人的猜測。AI鲸選社從投資人圈得到的消息，是王慧文的病情确實很嚴重。最後王慧文睡在上鋪的兄弟，美團創始人王興幫助接盤了光年之外。

大模型真的不行了嗎？大家萌生出此疑問。那期間，正好知名投資人朱嘯虎和獵豹創始人傅盛也在朋友圈争論，大模型行業是否有泡沫。朱嘯虎極度看衰市場一擁而上，做通用大模型的現狀，認為絕大多數都會在年底死掉。

光年之外的主動變動，也是否印證了朱嘯虎的言論？

從AI鲸選社獲得資訊看，收購了光年之外的美團，目前并沒有停止大模型的腳步。不僅獨家投資了智譜AI數億元，當下還在招聘大模型的項目總監，給出的年薪高達300萬元，甚至還在美國成立技術研究院。賺辛苦錢的美團，也并不想在這波科技大潮中落後，尤其在餓了麼明确要接入通義大模型，有業務競争的攜程，也已經推出了大模型之後。

但對于國内市場來說，通用大模型确實已經太多。據不完全統計，短短不到8個月時間，已經有超過85家大模型釋出，其中很多成了上市公司的套現概念。

Wind資料顯示，2023年24家“AIGC概念股”已經合計發生67筆減持，大股東的離婚潮也令人驚歎。2023年初至今，近十家AI闆塊公司大股東家庭被曝離婚。備受關注的是，A股AI企業昆侖萬維，最近就發生占股11%的李瓊女士（創始人周亞輝的前妻），計劃減持3%的股份（大概13億元），然後有息借給公司。據了解内情的人向AI鲸選社介紹，感受到了AGI紅利的昆侖萬維，不僅做了大模型，最近還在密集組建團隊，全力以赴做對标微軟的Copilot。

上市公司利用AGI 抓緊炒概念，套現離場。大模型創業公司則在内卷到死。

一位在近期成立了AIGC基金的投資人張陽告訴我們，伴随着開源免費且強大的Llama 2襲來之際，下半年很多大模型企業勢必會面臨融資難的問題。

如今一切已經有端倪，在7月11日，百川智能推出了百億級别參數的大模型Baichuan-13B，不僅宣布開源，同樣還是免費可商用。雖然Baichuan-13B的參數規模不大，但是基于精準的中文語料訓練，在百億規模參數的大模型中，百川經常排名頭部。

Baichuan-13B的免費政策，大大沖擊了國内大模型付費行情。目前，智源AI就在14日宣布，企業登記獲得授權，允許免費商業使用ChatGLM-6B和ChatGLM2-6B。

越來越多的大模型開源免費後，大模型的死亡淘汰賽正式開啟。一位基于大模型創業公司的CTO對AI鲸選社表示，智源的大模型從最開始的私域部署要2000萬元，到年初的調用價格為180萬到30萬選包，再到現在的免費，行業變化非常之快。傅盛認為這是市場從大模型參數之争，進入生态規模之争。

網際網路大廠并不愁生态建設，由于内部模型非常多，也有免費和付費之分，最主要的大模型目前還是閉源和付費形态。創業公司要建立生态就比較困難，很多初創企業做大模型已花光了力氣，做生态就難免力有不逮。據了解目前MiniMax是創業公司中，為數不多堅持公有雲，做MaaS模式的大模型企業。

丁香園CTO範凱形容這波開源免費潮，就像把自來水廠（大模型）免費接到使用者家裡，讓每家人手一個水龍頭，那些閉源的自來水廠，最好你的水無敵好喝，大家才願意付費去你那。

四、AGI發展進入分岔路口

分水嶺出現後，當下創業競争已經發展了三派。

一派是堅持全自研大模型，都是實力選手。這一派主要是百度、阿裡、位元組等網際網路大廠以及智譜、MiniMAX、銜遠等創業企業。但這些實力選手也被劃分成兩類企業。

第一類是堅持做自研的通用大模型，對标ChatGPT，不斷追趕ChatGPT的疊代速度。

在雲啟資本董事合夥人陳昱看來，通用大模型是必經之路，垂直大模型發展受限。“因為對于通用大模型而言，垂直領域并不需要重新訓練，通用大模型可以通過向量資料庫做行業深化，垂直大模型卻很難智能湧現。”

從目前看，有夢想的肯定還要做通用大模型，畢竟做成了可以成為下一個網際網路大廠。ChatGPT 在協同辦公、電商、代碼生成、輔助設計等領域已經展現出了這種颠覆性潛質。

第二類是認清現實聚焦落地，堅持做垂直大模型，這一派包括最後達成觀點統一的朱嘯虎和傅盛，二者都認為垂直大模型将更有産業适用性。

通用大模型一般是在千億參數以上，而垂直大模型則在百億或者70億規模左右。達觀資料的大模型産品曹植，參數就都在500億規模之間。

據達觀資料的CEO陳運文告訴AI鲸選社，“曹植”大模型采用混合訓練資料方案，分别是50%的通用混合語料+50%垂直專業語料。“我們在金融、政務等領域做文本智能很多年，很多資料是獨有的，客戶也要求我們做私有化訓練。”陳運文告訴AI鲸選社，“以前四五個人用一個星期做一份報告，現在AI半天做好了。”

放棄成為下一個ChatGPT的夢想，才能在商業場景中盡早落地，這是很多垂直大模型的清醒認知。

在行業看來，通往AGI聖殿的第二條路線，是基于别人的模型（如GPT），然後結合自己的行業Know-how去做訓練。“對于第二類能不能成功，我覺得需要時間去驗證，現在還不明确。原因在于大家還不知道如何把行業Know-how去和大模型做融合的有效路徑，如何在有護城河的同時又有可持續的商業模式，這仍是個未知數。”

“尤其很多大模型，本身就有套殼的嫌疑，”投資人張陽告訴AI鲸選社，結合行業做商業化的時候，就會面臨很多問題。據悉，兩個知名同姓創業者的大模型，是基于Faceboook的開源Llama；某遊戲和防護公司用的是智源大模型的基礎架構。

更強的開源大模型正在來襲，Meta近期釋出免費可商用版本Llama 2，傅盛對此就在朋友圈表示：“這一下不知道多少公司笑醒在深夜，多少公司哭暈在廁所….”朱嘯虎對此也評論道：很多人要笑醒了吧，大家都可以Take free ride（搭便車）了。

傅盛的“笑醒”所指，和朱嘯虎略有不同。傅盛笑醒指的是使用開源大模型開發AIGC應用的企業，也能做出更好的産品，朱嘯虎笑醒是指那些号稱自研實則套殼的大模型企業，最近也要宣布更新了。大家所指的哭暈内容相同，都是那些号稱自研的大模型企業，國外大模型最強之一Llama 2 宣布開源免費，大家都基于相同的開源大模型，怎麼在行業中做出特色能力？

AGI的第三條路線是純粹做應用，是将模型拿來直接使用，這種的壁壘會較低。朱嘯虎也不看好這類模式，認為如果90%的能力是ChatGPT 提供，那麼AIGC應用就沒有什麼投資價值。

在OpenAI的生态中，山姆·奧特曼承諾盡量避免做應用層，和生态開發者競争，是以效仿Google做了ChatGPT Plugin，從目前看，國内還沒有誰做出這種承諾。

文心一言和通義千問，已經有了上百個功能更新，這些功能也覆寫了一些開發者的工作。雖然文心一言也有插件，但目前就兩個，一個是百度搜尋，另一個是ChatFile（長文檔的分析處理能力）。百度千帆和阿裡魔搭的生态發展如何協調，還是個有挑戰的命題工作。

堅定看好AGI的朱嘯虎，認為通用大模型的創業和投資視窗期已過，不絕對依賴某家大模型能力的AIGC，才是AGI時代低垂的果實。比如，近期朋友圈突然蹿火的“妙鴨相機”，算是國内AIGC第一個爆火的産品，國外也曾火過類似的産品“lensa”，月收入曾達到800萬美元。

時代的浪潮襲來之際，投資人吳世春就曾打趣問道朱嘯虎：“投AI賺的錢把投SaaS虧的錢，彌補回來了嗎？”朱嘯虎回答，還沒，但是AI的前景無限。

目前，創投圈也都認可朱嘯虎表達的道理，但很多人并不期待朱嘯虎說出實話，諸如“ChatGPT對創業公司很不友好，未來兩三年内請大家放棄融資幻想”這些帶有寒意的話。

“大模型就是網際網路的房地産，就算有泡沫也是美麗的泡沫，”一位剛下場做AI職業教育教育訓練的創業者說道，雷軍曾在2013年網際網路紅利消失之際疾呼，要相信網際網路的力量，今天我們也要相信AGI，無論它有沒有泡沫。

注：本文中李明、張聰、趙輝等為化名。

本内容為作者獨立觀點，不代表虎嗅立場。未經允許不得轉載，授權事宜請聯系 [email protected]

正在改變與想要改變世界的人，都在虎嗅APP