大模型開源還是閉源好，周鴻祎與李彥宏針尖對麥芒

開源大模型還是閉源大模型，究竟誰才是“版本答案”？圍繞這個問題，360創始人周鴻祎和百度創始人李彥宏最近就來了一次隔空論戰。

先是在4月12日，有媒體曝光了李彥宏在百度内部的講話。其中就有他認為閉源大模型在能力上會持續領先、而不是一時領先，并且開源大模型的運作模式和傳統開源軟體不同、不是衆人拾柴火焰高，閉源是有真正的商業模式、并能夠賺到錢，隻有能賺到錢才能聚集算力和人才。

緊接着在4月16日舉行的Create 2024百度AI開發者大會上，李彥宏在演講中就宣稱，“開源模型會越來越落後”。

就兩天後的第二十七屆哈佛中國論壇上，自稱開源信徒的周鴻祎站出來唱了反調，“我是一直相信開源的力量，至于說網上有些名人胡說八道，你們别被忽悠了。他說開源不如閉源好？連說這話的公司自己都是借助了開源的力量才成長到今天。”

其實在國内市場，大模型的開源、還是閉源并不是一個技術問題。無論閉源、還是開源，這一衆大模型客觀上的性能還遜色于海外的同類産品，它們也都不是在大模型技術層面的引領者。而單純在技術層面，目前閉源大模型在能力上處于領先，諸如OpenAI的GPT-4、Anthropic的Claude-3、谷歌的Gemini Ultra就都是閉源，國内的情況也一樣，百度的文心一言、阿裡的通義千問、位元組跳動的雲雀、月之暗面的Kimi等叫得上号的大模型，也通通都是閉源。

周鴻祎認為，開源模型為整個社群提供了一個共享、協作和創新的平台，推動了技術的快速發展，開源社群聚集的工程師和科學家的數量是閉源的數百倍，是以今年開源大模型隻做了一年，就已經超過了GPT-3.5的能力。然而實際情況遠沒有他所說的那般樂觀，不管從模型能力層面、還是在産品落地的次元，事實是開源大模型還始終落後于閉源大模型。

盡管Meta方面剛剛釋出的Llama 3确實做到了性能優于GPT-3.5，可問題是誰都不會認為Llama 3是開源社群的産物，畢竟其核心開發力量自始至終都來自Meta。

事實上，考慮到李彥宏和周鴻祎早已遠離一線，是以兩者關于大模型開源和閉源的觀點相左，或許并不是對于技術路線的分歧。是以有觀點認為，一方支援閉源、另一方相信開源的力量，其實更像是各自所代表商業利益的驅使。

周鴻祎支援開源模型的原因其實很簡單，畢竟在如今的“百模大戰”裡，360智腦還處于追趕者的地位，在使用者規模和對業界的影響力上都遜色于文心一言、通義千問等網際網路巨頭推出的大模型。

此前360方面在開源360智腦7B模型時就說得很清楚，“大家沒必要重複造輪子”，言外之意就是AI創業者不用再自研了，直接使用開源360智腦的能力就好。縱觀軟體業的發展史，商業公司通過開源來獲得某一賽道的上司權其實是非常經典的操作，比如谷歌就靠開源，讓Chromium生态得以一統PC浏覽器市場。

從某種意義上來說，周鴻祎的360開源自家大模型，其實是複刻Meta開源Llama的操作。既然自稱是開源信徒的周鴻祎有私心，堅持閉源大模型更好的李彥宏，其實也有自己的小算盤。

李彥宏在對開源模型潑冷水的同時還表示，“大模型本身并不直接創造價值，基于大模型開發出來的AI應用才能滿足真實的市場需求。這是我們百度根據過去一年的實踐，踩了無數的坑，交了高昂的學費換來的。”

這句話的言外之意，就要關聯他在一年前的公開發言了。在去年夏季的世界網際網路大會數字文明尼山對話上，李彥宏在主題演講中就曾表示，“新的國際競争戰略關鍵點，不是一個國家有多少個大模型，而是你的大模型上有多少原生的AI應用，這些應用在多大程度上提升了生産效率。”

在這不同時間的相似論述背後，其實是李彥宏想勸退大模型創業者，并希望他們直接加入百度的AI生态。而百度的底氣，則來源于搶占了先發優勢的文心一言，基于更大的算力、更多的資料和更強的算法，依托飛槳平台，從文心3.0、3.5，到4.0，文心大模型的能力也逐漸增強。

相比一年前，文心大模型的算法訓練效率提升到了原來的5.1倍，周均訓練有效率達到98.8%、推理性能提升了105倍，推理的成本更降到了原來的1%。

此前百度CTO王海峰就曾透露，目前文心一言累計使用者規模已達2億，日均調用量也達到了2億；飛槳文心生态已聚集1295萬開發者、服務24.4萬家企事業機關，基于飛槳和文心建立89.5萬個模型，利用千帆平台開發的AI原生應用數量更是超過了19萬。

是以百度想要的其實是類似OpenAI那樣建立AI生态，并以文心一言為支點進行平台化。如此一來，百度方面希望大模型賽道的參與者自然是越少越好，一旦創業者都去開發AI應用、而非大模型，自然就有可能會重演當年App Store的故事。

多年以來持續在AI領域投入的百度無疑是國内AI大模型的先行者，而其AI領域實作的增量收入也反映在了2023年的财報中，但絕對值卻并不大。是以對于幾乎錯失了整個移動網際網路時代的百度而言，夯實自家AI生态、并提升AI業務的貨币化能力，無疑就是目前的頭等大事。而相比于自己來做産品，做應用商店來“收稅”顯然會是個更好的選擇。

歸根結底，大模型到底是開源好、還是閉源更佳，目前在技術層面暫時還沒有分出高下，但閉源或開源對于不同公司的商業利益卻各有優劣。

大模型開源還是閉源好，周鴻祎與李彥宏針尖對麥芒

繼續閱讀

五力模型，提升個人核心能力

卷瘋了！Meta AI釋出了最強開源大模型Llama 3，提供了8B和70B版?

怎麼用AI大模型解決實際問題？

大模型時代，資料中台現在過氣了嗎？

軒轅大模型的實踐與應用 | ML-Summit 2024

移動UI大模型問世，蘋果iPhone或迎更新新周期

科大訊飛不講大模型的“性感故事”

Meta釋出“最強開源AI模型”，下一代或比GPT更強

面壁新模型：早于Llama3、比肩 Llama3、推理超越 Llama3！

華為一季度利潤暴漲564%；天涯社群恢複；小紅書内測自研大模型

有效溝通表達的13個模型

一天吃透一條産業鍊:NO.37 AI大模型産業鍊

10款國産大模型大戰弱智吧——中文了解能力測評

最全解讀MoE混合專家模型：揭秘關鍵技術與挑戰

全面超越！開源！百度最強SOTA：基于擴散模型的3DGS！

沖刺2024“半年紅” | 六成AI企業實作盈利增長，大模型企業賺錢了？