“中國大模型五虎”浮出水面

大模型浪潮的席卷速度，超越了曆史上任何一場技術革命。

年初，OpenAI釋出Sora，馬斯克、周鴻祎不惜溢美之詞，狂熱蔓延全世界。正當大家還在驚歎“未來已來”，Anthropic公司宣布Claude-3正式釋出，并宣布在AI邏輯基準測試中超過了ChatGPT-4。與此同時，Google和馬斯克同時跳入開源大戰，分别推出Gemma和Grok。

全球大模型的競争熱潮，從小衆圈層向外擴散，像漣漪一樣，播散向全世界。一場大模型的無限競争就此打響。全球科技巨頭攜帶着大筆充沛的資金、漂亮履曆的技術人才将戰場燒的更加火熱。

但冷靜一看，目前世界上公認的大模型領軍者，大多卻是年輕的AI企業：估值高達290億美元的OpenAI，成立于2015年；被稱為OpenAI“最強競争對手”的大模型公司Anthropic成立于2021年；“歐洲新秀”Mistra創立至今，剛到一年。三家閃耀的AI明星公司的員工加起來卻可能不到一千人，隻是科技大廠的一個部門的人數。

為什麼這場對大模型王冠的追逐戰，不在巨頭的射程範圍内？

01 為什麼榮光屬于AI企業？

首先，打破一個認知誤區：大模型并不是一場單單依靠資源的軍備競賽。

在ChatGPT橫空出世後，一個廣為流傳的說法是，OpenAI成功的關鍵在于背靠微軟Azure雲上的數萬張A100卡，成本高達數億美元。更有甚者認為大模型的勝率取決于資源的充沛程度。

然而，今年3月，美國初創公司 Databricks 突然公布旗下開源大語言模型 DBRX，号稱是全球最強開源大模型，參數規模達到 1320 億，表現更是超越 Meta 的 Llama2、Mistral AI 的 Mixtral，以及馬斯克旗下 xAI 公司剛剛開源的 Grok-1。

更重要的是，他們隻花了 2 個月和 1000 萬美元，在性能全面超越 GPT-3.5 的同時，訓練時間和成本都隻有 GPT-3.5 的一小部分。

事實上，資源對于任何領域的競争都很重要，但資源在大模型領域卻不是萬能的、更不是唯一因素。而AI企業相比科技巨頭，有一個得天獨厚的優勢，就在于技術探索上的靈活性。

Google曾是人工智能深度學習領域裡當之無愧的王者。2016年，擊敗人類圍棋冠軍李世石的阿爾法go就是出自谷歌Deepmind，而在自然語言模型領域，谷歌也曾遙遙領先。

然而，2022年ChatGPT橫空出世。實際上拉開身位差距的是技術路線上的分歧。谷歌追逐的自然語言模型應該是一系列的垂類，參數相對較小、适用場景面相對較窄的模型，而OpenAI認為應該做一個通用的海量參數，海量資料訓練的超級大模型。

OpenAI當年的夢想看來是天方夜譚。但即便在與谷歌的較量中長期落于下風，OpenAI也沒有放棄将GPT作為唯一路線。阿爾特曼的一句話給出了答案——“創業公司做什麼都很難，那不如抓住大機會。”（Startups are very hard no matter what you do , you may as well go after a big opportunity.）

相比于AI企業的靈活性，科技巨頭在押注技術路線上卻很難如此孤注一擲，這也一定程度上造成了動作的遲緩。這也注定了，AI的最新方向大機率要靠AI企業去探索。

海外AI明星公司鱗次栉比、星光璀璨。那麼問題來了，中國領域的AI明星公司在哪？

02 “ 中國大模型五虎”浮出水面

一張SuperCLUE評測榜單揭開了中國大模型五虎的秘密。

刨除BAT，榜單上展現着中國最強AI企業的身影，分别是百川智能、智譜AI、月之暗面、MiniMax、雲從科技。

百川智能成立于 2023 年 4 月，創始人為前搜狗公司 CEO 王小川。成立後短短數月，百川智能便跻身科技獨角獸行列，成立至今更是連續釋出了11款基礎大模型。

智譜AI成立于2019年，今年初已完成新一輪融資。創始人張鵬，畢業于清華大學計算機科學與技術系。幾年來，公司連續釋出了GLM系列大模型、ChatGLM、CodeGeeX代碼大模型等，已成為國内最早也是最有大模型研發經驗的企業之一。

MiniMax成立于2021年，背後的掌舵者闫俊傑畢業于中科院自動化所，在商湯科技擔任副總裁期間，負責搭建深度學習的工具鍊和底層算法，以及通用智能的技術發展。聯合創始人楊斌，則是闫俊傑在中科院的校友。

同樣來勢洶洶的還有月之暗面（Moonshot AI）——2023年，月之暗面接連完成兩輪共計近20億人民币的融資，估值超25億美金。月之暗面成立于2023年3月由三位清華校友創辦，帶頭人則是90後學霸楊植麟。

至此，加上雲從科技，中國AI大模型五虎呼之欲出。

雲從科技曾是“AI四小龍”中A股第一股，也是國内AI三駕馬車中，唯一一家具備全内資背景的企業。在業内，雲從科技與商湯科技、曠視科技、依圖科技并稱“AI四小龍”，但論起光環與熱度，最年輕的雲從科技，卻是最“頂流”的存在。

“AI國家隊選手”、“中國科學院孵化企業”、“中國AI第一梯隊企業”、“首個同時承擔國家發展和改革委人工智能基礎平台、應用平台，科技部開放平台等重大項目建設任務、并參與國家及行業标準制定的人工智能企業”等稱号，讓雲從科技自2015年誕生以來，始終處于行業聚光燈下。

如今，雲從科技又在大模型時代昂首闊步。

03 被時代眷顧的優等生

去年五月，位列國内人工智能第一梯隊的雲從科技，正式釋出了AI智能體（AI-agent）領域的戰略級産品——“從容多模态大模型”。

雲從科技研究院産品總監孫進在接受媒體采訪時表示：從容大模型在内部已經曆了多輪疊代。1.5版本時，平衡上下文長度、模型性能與推理成本是疊代重點。從容大模型 2.0 版本已經完成，3.0版本重點是多模态能力--跳過文本直接處理不同模态的資料。

不隻是對話體驗，從容大模型還可以程式設計、寫作、解題等。雲從還對“從容”與ChatGPT進行橫向對比示範，在對同一真題的解答過程中，從容大模型的答題速度相較更快，但推理能力、語義了解能力已超過GPT 3.5，略低于GPT4.0。

經第三方機構SuperClue、C-Eval等綜合評測，從容大模型綜合性能位列全球前五。同時，從容大模型具備多模态能力，在視覺、跨模态領域10次重新整理世界紀錄。

據雲從科技介紹，公司已布局了數十個行業大模型，并研發了DataGPT、智能客服、AI滑鼠等多個泛AI智能應用，成為雲從科技布局AI智能體（AI-agent）的重要抓手。

同時，雲從科技與華為昇騰聯合提出應對智算基礎設施挑戰的解決之道，開啟“國産化算力+智算”的新布局。目前，雙方已合作推出大模型應用底座——從容大模型訓推一體機，并與天津港集團、首鍊科技、今世緣、國網山東、中國電信等合作夥伴一起，成功幫助港口、醫藥、制造、電力、銀行等行業客戶落地生成式AI應用場景。

雲從科技連續踏中兩波AI浪潮，離不開其深厚的科研背景。

雲從科技的創始人周曦，曾以中科院“百人計劃”專家身份引進回國，擔任中國科學院重慶綠色智能技術研究院資訊所副所長等職位。用了半年時間，他在全國範圍内組建起一支擁有20多位專業人才的團隊，并入選中國科學院A類戰略性先導科技專項，成為其中唯一的人臉識别團隊。

在日後，這隻團隊成為了計算機視覺領域的國家隊，其技術成果先後被用在多個省份，在alpha go尚未大戰李世石讓AI一夜爆火之前，就悄然将這一技術帶到了普通人的生活之中。

一直到2015年4月，33歲的周曦，卻放棄别人豔羨的“鐵飯碗”，選擇内部創業，牽頭成立雲從科技，專攻人臉識别領域。

“很驚訝，因為在這個領域很少見到願意放棄現有職位全力投入創業的科學家。”海通證券某人士在接受媒體采訪時表示，“海通作為雲從的第一個項目，在應用實作上有特别多困難，周曦當時把整個研發弄到上海來攻堅了一周，系統上線後到現在再也沒出過問題。”

從2015年開始，人臉識别作為計算機視覺領域最易落地的賽道，開始逐漸形成風口。在筚路藍縷七年之後，雲從交上了他的答卷：作為唯一一家全内資AI企業，順利登陸科創闆，被稱為“AI國家隊”。

翻開雲從科技的招股書，我們可以看到，雲從科技的創始團隊大多來自中科院、中科大。公司擁有近600名科研人員，研發人員占比超過50%，核心團隊曾先後10次獲得國内外人工智能領域桂冠。

如今全球大模型競争風起雲湧，新的科技浪潮席卷各行各業，中國人工智能領域在焦慮和追趕中又一次走到了十字路口。

如何書寫這一次新的篇章，既是雲從科技新的課題，同樣也是所有中國AI企業迫切的使命。

“中國大模型五虎”浮出水面

繼續閱讀

中國股市大反彈可持續嗎？高盛、彙豐說了同一句話：曆史說别離場！

最高優惠2300元！蘋果在中國宣布史上最大降價

近2000名中國寒門學霸的自白：讀書還有用嗎？

幸災樂禍！泰媒慶祝張玉甯受傷：中國隊已傷3主力，幾乎無人可用

美媒稱中國若做好這幾點，會繼續“稱霸”全球光伏競賽

官宣！中國女排名單做出調整，小鋼炮重獲啟用，最美二傳意外離隊

3-0！世界女排全亂了！5隊争4個名額，澳門站中國女排能赢幾場？

中國最沒人情味城市，外地遊客很失望，有人說來了幾十年還是客人

美版知乎：中國每年1000萬人失蹤，那為什麼很多人說中國安全呢？

谷歌大佬丁林偉被捕！美國正在圍獵華人精英，防止他們回中國！

上午10點！中國女排官宣，新隊長謎底揭曉！朱婷安心，袁心玥懂了

懇請中國隊退出！巴黎街頭屎尿橫飛，畫面不忍直視，還開奧運會？

董明珠夜遊龍門石窟：“這是屬于中國人的工匠精神”

懇請中國隊退賽！巴黎街頭屎尿橫飛，畫面慘不忍睹，還開奧運會？

哀悼，前央視解說田宗琦墜樓離世，終年41歲曾為中國女排奪冠哽咽

中國足協棄用澳洲人範埃格蒙德，将為U17女足重新選帥