天天看點

中科院,剛剛跑出一隻獨角獸

作者:投中網
中科院,剛剛跑出一隻獨角獸

6月伊始,國産大模型明星團隊MiniMax傳出了新的融資消息,規模将超過2.5億美元,推動MiniMax的整體估值規模超過12億美元,成為标準意義上的“獨角獸”。

與此同時,本輪融資也吸引了新的投資方參與,其中包括與騰訊有關聯的投資實體。一旦消息坐實,MiniMax将成為騰訊在國産大模型熱之後的第一次相關布局。

MiniMax的創始團隊稱得上是“中科院系”。它由前商湯科技副總裁、通用智能技術負責人闫俊傑成立,他博士畢業于中科院自動化所,而技術合夥人楊斌,則是闫俊傑的中科院校友。

對這筆交易,人們感歎“這展現了中國投資者對大模型賽道的興趣仍然在上升階段”,并通過對相關投資者和行業顧問的交談做出預測,“今年下半年,中國泛AIGC賽道将會出現具有裡程碑意義的投資交易”。

這個論述邏輯不難了解。MiniMax成立于2021年12月,用不到一年的時間就完成了兩輪融資,囊括了讓國内人工智能賽道多家有頭有臉的代表性玩家,包括天使輪的雲啟資本、Pre-A輪的明勢資本、高瓴創投、IDG資本、米哈遊,這種堪稱“衆望所歸”的成長速度顯然很難直接用“明星團隊”來簡單概括。

順帶提一嘴,按我聽到的消息,Minimax這一輪融資份額,各家頭部VC争得可是相當激烈,但率先傳出入局的卻是騰訊,接下來可以再看,等融資正式釋出,有沒有VC最終投得進去。

更重要的是,進入2023年之後MiniMax并不是貨架上的唯一選擇——王慧文在即刻上官宣帶資創業,5000萬美元成立了“光年之外”,還争取到了王興“仗義合夥”;李開複牽頭了Project AI 2.0,喊話“AI 2.0就是來掀桌子的”;王小川同樣帶着5000萬美元成立了“百川智能”,和百度打起了“是不是一線從業者”的嘴仗——可以說MiniMax在其初創階段所呈現的成長節奏,清晰地折射出資本市場對于大模型賽道的堅決與耐心。

就在MiniMax新一輪融資即将完成的消息傳出來四天後,也就是6月5日,光年之外将成為“騰訊大模型第一投”的消息迅速占領了熱搜。據量子位的消息,光年之外以10億美元的估值,已在近期完成了新一輪2.3億美元(折合人民币16.3億)融資,由源碼資本領投,騰訊、五源資本和快手創始人宿華參與其中。

雖然這條消息在當天就被“辟謠”,但也有一種說法是:因為參投的美元基金礙于某些因素而不能公開确認此消息,而宿華也确實參與了這一筆的融資,并且投資額“相當可觀”。

其實無論如何,從市場表現出來的熱情來看,國産大模型賽道确實到了“需要獨角獸出現”的時候。

獨角獸?吞金獸?

首先需要明确的一點是,盡管到2023年才出現了獨角獸級别的估值,但國産大模型賽道的成型其實遠遠早于ChatGPT的釋出。第一個正式對外釋出的國産AI大模型,可以追溯到2021年3月由智源研究院釋出的“悟道1.0”,其中就已經包括面向中文的預訓練語言模型悟道·文源、中文通用圖文多模态預訓練模型悟道·文瀾、具有認知能力的超大規模預訓練模型悟道·文彙、超大規模蛋白質序列預測預訓練模型悟道·文溯。

而智源研究院的成立更是可以追溯到2018年11月在北京舉辦的中國(北京)跨國技術轉移大會。當時北京市科學技術委員會主任許強作為代表正式釋出北京智源行動計劃,旗幟鮮明地指出智源研究院的使命就是“推動共享資料、智能計算程式設計架構和算力基礎設施建設”“圍繞人工智能領域重大核心基礎理論問題,布局研究團隊和項目”。

光年之外4月并購的AI架構公司“一流科技OneFlow”也是這個狀況。創始人袁進輝2008年從清華大學計算機專業畢業,拿到博士學位,一年之後就草創了世界上最快、被微軟研究院全球副總裁周以真稱贊“年度最好成果”的主題模型訓練算法系統LightLDA。2017年因為預判到深度學習架構市場在“大模型分布式”方向上有着空缺決定創業,對标的産品是谷歌TensorFlow和臉書PyTorch。

王慧文也因為這筆并購交易在即刻、知乎上大受好評,一個頗具代表性的觀點是“袁總(指袁進輝)及OneFlow一直深耕于深度學習架構和算法部署,在大模型算法的并行訓練和部署方面有很多積累,執着的技術專家”,并購OneFlow證明光年團隊對LLM(大語言模型)生态的了解上,擁有比其他團隊“更好的判斷力”“更早的視野”——當然這都是後話。

總之早在2019年,美國白宮就在《國家人工智能研發戰略規劃》中敏銳指出中國将是美國人工智能的主要對手,并通過深度觀察點出中國人工智能産業的短闆:“缺點亦十分明顯,硬體、算法、人才……人工智能架構創新能力薄弱。”

而正是這種首尾分離的行業狀态,決定了中國投資者們一方面獲得了相對于歐洲、日韓市場更好的配置機會,另一方面又不得不接受流向國産大模型賽道的熱錢,将不可避免地長期作為沉沒成本,用于“補齊”必要的水下部分。以至于當時一些路子比較野的自媒體,直接玩梗式地調侃“搞深度學習架構的那幫人,不是瘋子,就是騙子”。

但即便是在公認的發達市場美國,大模型也很難說浮上了水面。

2020年3月,《福布斯》雜志指出當時人工智能行業面臨的最大挑戰“不是技術問題,而是如何從技術中獲得價值”,論據來自麻省理工斯隆管理學院的調研。調研報告顯示“在接受調查的10家公司中,有7家公司表示截止送出報道,人工智能業務在财務上帶來的積極影響很小或沒有……在那些90%的業務布局圍繞着人工智能展開的公司裡,隻有不到2/5的公司表示在過去三年中從人工智能中獲得了業務收益……如果将調研樣本擴大到對人工智能有過‘大筆投資’的企業,這個數字也僅僅隻被提到到3/5。這也意味着在所有對 AI 方面進行重大投資的公司裡,有40%暫時沒有因為人工智能獲得過收益。”

買到即血虧,美國商業精英們很現實地選擇用腳投票。美國政策顧問NewVantage Partners在2019年的調查中發現,雖然有91.5%的公司表示已經嘗試了對人工智能的布局,但認為在人工智能領域布局應該加快節奏的受訪投資者,從2018年92%下降到了52%。

作者是以悲觀地認為這種美國企業缺乏資料驅動文化(data-driven culture),企業的決策者們缺乏了解人工智能的興趣和動力。再加上人工智能技術本質上是一次“範式革命”,與人工智能的結合将導緻全流程“端對端”的改造,——例如新産品和服務開發、客戶服務、訂單管理、“采購到付款”等——進而實際增加企業營運成本,作者進一步認為短時間内“即便人工智能開發出應用場景,也很難完成推廣”。

2022年後,ChatGPT的出現很大程度上改變了這個現狀。在過去一年,人工智能幫助13家初創團隊成長為獨角獸,在經濟名額上打了一場漂亮的翻身仗,之前用腳投票的商業精英們紛紛回流。但這時人們又發現,當所謂的市場經濟充分發揮了調配職能,人工智能幹脆直接向資源導向型行業狂奔。

例如據調研機構TrendForce指出,OpenAI訓練GPT-3時,大概用到2萬個英偉達A100 GPU的算力;疊代到ChatGPT時GPU數量進一步上漲到了3萬個以上,另外還需要搭載晶片的數千台伺服器和數百個标準機櫃。按照A100晶片售價1萬-1.5萬美元的大緻區間計算,這意味着Open AI僅在GPU晶片上所消耗的硬成本至少3億美元。

同樣為了支撐大模型的不斷疊代與優質體驗,OpenAI也對雲服務的需求也水漲船高。2017年,OpenAI在雲服務上的總花費為790萬美元,占公司總支出的1/4,到了2020年這筆費用上漲到了7500萬美元。OpenAI也正是在2019年底決定接受微軟10億美元的投資,逐漸将更多服務轉移到Azure平台上,使得雲服務需求增長帶來的壓力得到緩解。

OpenAI甚至需要借用“鈔能力”來解決人力資源。

據公開資訊,截止2023年3月,OpenAI目前擁有超過200名員工,其中大部分來自谷歌和人工智能研究實驗室DeepMind的母公司Alphabet,也有相當部分員工來自Meta、亞馬遜、Uber。知名獵頭公司Punks & Pinstripes的CEO Greg Larkin是以向傳統巨頭們發出警告“大公司們需要優化在人才方面的投資”。

而資源導向型行業的本質,決定了在行業平均利潤短時間内無法快速提到的情況下,生産成本的增加必然會帶來虧損的增加。根據5月公布的資料,2022年OpenAI的虧損相較去年翻了一番,達到5.4億美金,主要出口正是ChatGPT的運維成本以及員工跳槽所産生的人力成本。OpenAI的CEO Sam Altman直接攤牌,表示如果要執行預期中的開發計劃,OpneAI除了要提高自身的盈利能力,還需要未來幾年完成多達1000億美元的融資。

應景的是,幾乎就在同期(也就是截止2023年1月),日本的日經新聞通過調研發現中國學界發表的與人工智能相關的研究論文數量是美國的兩倍左右,同時在論文引用率方面美國學界落後中國約70%。

誰也沒辦法用三言兩語來解釋這個“資源叢集”是怎樣悄然形成的,但可以肯定的是,在這個時間節點上,中國市場幾乎是配置大模型的最後機會。

投資人?CEO?

還有一個值得注意的點。據天眼查顯示,5月31日,北京深言科技有限責任公司發生工商變更,股東新增騰訊旗下廣西騰訊創業投資有限公司、好未來旗下公司欣欣相融教育科技 (北京)有限公司等。深言科技核心團隊來自清華大學,主要方向為通過 NLP 技術聚焦在大模型的一體化文本資訊處理平台研發。這意味着騰訊實際上已經完成了“大模型第一投”。如果再算上MiniMax和光年之外這兩筆潛在的交易,騰訊堪稱完成了一場“奇襲”。

要知道此前騰訊在自研大模型方面的布局,在時間線上呈現出來是這樣的:

2022年4月,騰訊就釋出了混元AI大模型,其中包含NLP、CV和多模态等基礎模型和衆多行業/領域模型,并且在釋出之前初步應用到廣告創作、廣告檢索、廣告推薦等騰訊業務場景中,實作了一定的應用效果提升;

2022年底,混元AI大模型團隊推出國内首個低成本、可落地的萬億中文NLP預訓練模型HunYuan-NLP-1T,速度提升至用256卡在一天内即可完成;

2023年2月,官宣成立對類ChatGPT産品“混元助手(HunyuanAide)”項目組,目标是聯合内部團隊建構大參數語言模型,通過性能穩定的強化學習算法訓練……

這種節奏上的劇烈變化很容易讓人聯想到馬化騰5月18日在騰訊股東大會上的講話。會上馬化騰在回應有關ChatGPT和AI相關的提問時,進行了一次無限類似于“自省”式的發言。他說:“我們最開始以為(人工智能)是網際網路十年不遇的機會,但是越想越覺得,這是幾百年不遇的、類似發明電的工業革命一樣的機遇……關鍵還是要把底層的算法、算力和資料紮紮實實做好,而且更關鍵的是場景落地,目前(我們)還在做一些思考。我感覺現在有很多公司太急了,感覺是為了提振股價,我們一貫不是這種風格。”

結合當時的語境,很多人認為這次“自省”與騰訊最新的财報表現高度相關。雖然2023年Q1季度的财報顯示,騰訊呈現出全面複蘇态勢,總營收、遊戲營收、廣告營收、金融科技及企業服務業務收入等關鍵資料都實作了超過10%的增長,但這些增長基本都由傳統業務完成。

沒有人比馬化騰更懂這種局面背後的隐憂。2011年騰訊在赢得3Q大戰的“勝勢”下,被百度搶走了保持了五年的中國網際網路企業市值頭把交椅。那段時間又恰逢所謂“web2.0時代社交平台”崛起,新浪微網誌快速成長,人人網帶着中國版Facebook的概念去紐約上市,根據潘亂寫的那篇《騰訊沒有夢想》,“看衰騰訊”幾乎是一夜之間成為了輿論場中的政治正确,就連高盛也直言不諱地批評騰訊“管理層習慣性地持保守态度,導緻騰訊的核心平台面臨新浪和人人等威脅”,直接逼出了騰訊創業史上一個名場面的誕生:

2011年初,“陷入嚴重自我懷疑”的馬化騰在一次總辦會上邀請16名高管一起在紙上寫下他們心中最真實的“騰訊核心競争力”,最後在全部21個答案裡篩選出兩個,分别是“流量”和“資本”——劉熾平的釋義是“通過資本形成結盟關系,既可以實作開放的目的,同時也可以讓騰訊龐大的流量資源獲得一次資本意義上的釋放”。

據說騰訊是以一度出現了所謂投資部的“當權派”和做業務的“少壯派”之間的對立,但在這之後馬化騰确實“Make Tencent Great Again”。

此去十二年,或許又是一個輪回。

其實,這屆大模型明星創業者們說不定也是這麼想的。

MiniMax雖然早在Pre-A輪融資時就被廣泛認為擁有與OpenAI相似的商業模型,業務圍繞着to B與to C兩條線展開。但實際上to B業務起步緩慢,直到今年3月才逐漸開始AI服務接口,不到一個季度的營運時間很難幫助MiniMax API形成足夠的競争壁壘。上個月,金山辦公CEO章慶元在直播裡聊到大模型應用時就非常坦誠地表示“之前與MiniMax合作,接下來也會與百度深度合作”。

To C業務相對成熟,目前主打的對話式AI軟體Glow目前已經積累了數百萬使用者,初步具備了通過“内容生成與使用者回報内循環”的“user-in-the-loop”的方式來不斷疊代基礎大模型的能力,在形态上已經盡可能地向ChatGPT的人類回報強化學習機制(RLHF)看齊。但由于Glow與ChatGPT、文心一言不同,産品定位向“AI情感機器人”傾斜,MiniMax在營運層面承擔着超額的壓力。今年3月的下架,就被認為是其内部調整應用場景,履行年初出台的《網際網路資訊服務深度合成管理規定》中關于“深度合成服務提供者有義務建立健全使用者管理制度、制定和公開管理規則、加強内容管理”的要求。

2月份王慧文剛剛宣布下場創業、準備尋找聯創搭建核心團隊的時候,同樣作為并購傳聞當事方的西湖心辰的創始人藍振忠曾經在朋友圈裡進行了一次“兩段式的辟謠”:前半段是一次禮貌地婉拒,藍振忠表達了“心辰打造成中國的OpenAl”的決心以及“心辰的打法更适合中國國情”的自信;後半段是一則招聘啟事,藍振忠希望招聘一名CEO,找到屬于西湖心辰“Sam Altman”。

當時很多人對此的解讀是,西湖心辰在等待比王慧文更合适的領路人。而莊明浩、陳巍等則相信藍振忠是在談一個共性問題:人工智能賽道的競争,早就不是一個純粹的技術問題了。