天天看點

大模型開源還是閉源好,周鴻祎與李彥宏針尖對麥芒

作者:三易生活

開源大模型還是閉源大模型,究竟誰才是“版本答案”?圍繞這個問題,360創始人周鴻祎和百度創始人李彥宏最近就來了一次隔空論戰。

先是在4月12日,有媒體曝光了李彥宏在百度内部的講話。其中就有他認為閉源大模型在能力上會持續領先、而不是一時領先,并且開源大模型的運作模式和傳統開源軟體不同、不是衆人拾柴火焰高,閉源是有真正的商業模式、并能夠賺到錢,隻有能賺到錢才能聚集算力和人才。

大模型開源還是閉源好,周鴻祎與李彥宏針尖對麥芒

緊接着在4月16日舉行的Create 2024百度AI開發者大會上,李彥宏在演講中就宣稱,“開源模型會越來越落後”。

就兩天後的第二十七屆哈佛中國論壇上,自稱開源信徒的周鴻祎站出來唱了反調,“我是一直相信開源的力量,至于說網上有些名人胡說八道,你們别被忽悠了。他說開源不如閉源好?連說這話的公司自己都是借助了開源的力量才成長到今天。”

其實在國内市場,大模型的開源、還是閉源并不是一個技術問題。無論閉源、還是開源,這一衆大模型客觀上的性能還遜色于海外的同類産品,它們也都不是在大模型技術層面的引領者。而單純在技術層面,目前閉源大模型在能力上處于領先,諸如OpenAI的GPT-4、Anthropic的Claude-3、谷歌的Gemini Ultra就都是閉源,國内的情況也一樣,百度的文心一言、阿裡的通義千問、位元組跳動的雲雀、月之暗面的Kimi等叫得上号的大模型,也通通都是閉源。

大模型開源還是閉源好,周鴻祎與李彥宏針尖對麥芒

周鴻祎認為,開源模型為整個社群提供了一個共享、協作和創新的平台,推動了技術的快速發展,開源社群聚集的工程師和科學家的數量是閉源的數百倍,是以今年開源大模型隻做了一年,就已經超過了GPT-3.5的能力。然而實際情況遠沒有他所說的那般樂觀,不管從模型能力層面、還是在産品落地的次元,事實是開源大模型還始終落後于閉源大模型。

盡管Meta方面剛剛釋出的Llama 3确實做到了性能優于GPT-3.5,可問題是誰都不會認為Llama 3是開源社群的産物,畢竟其核心開發力量自始至終都來自Meta。

事實上,考慮到李彥宏和周鴻祎早已遠離一線,是以兩者關于大模型開源和閉源的觀點相左,或許并不是對于技術路線的分歧。是以有觀點認為,一方支援閉源、另一方相信開源的力量,其實更像是各自所代表商業利益的驅使。

大模型開源還是閉源好,周鴻祎與李彥宏針尖對麥芒

周鴻祎支援開源模型的原因其實很簡單,畢竟在如今的“百模大戰”裡,360智腦還處于追趕者的地位,在使用者規模和對業界的影響力上都遜色于文心一言、通義千問等網際網路巨頭推出的大模型。

此前360方面在開源360智腦7B模型時就說得很清楚,“大家沒必要重複造輪子”,言外之意就是AI創業者不用再自研了,直接使用開源360智腦的能力就好。縱觀軟體業的發展史,商業公司通過開源來獲得某一賽道的上司權其實是非常經典的操作,比如谷歌就靠開源,讓Chromium生态得以一統PC浏覽器市場。

從某種意義上來說,周鴻祎的360開源自家大模型,其實是複刻Meta開源Llama的操作。既然自稱是開源信徒的周鴻祎有私心,堅持閉源大模型更好的李彥宏,其實也有自己的小算盤。

李彥宏在對開源模型潑冷水的同時還表示,“大模型本身并不直接創造價值,基于大模型開發出來的AI應用才能滿足真實的市場需求。這是我們百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。”

大模型開源還是閉源好,周鴻祎與李彥宏針尖對麥芒

這句話的言外之意,就要關聯他在一年前的公開發言了。在去年夏季的世界網際網路大會數字文明尼山對話上,李彥宏在主題演講中就曾表示,“新的國際競争戰略關鍵點,不是一個國家有多少個大模型,而是你的大模型上有多少原生的AI應用,這些應用在多大程度上提升了生産效率。”

在這不同時間的相似論述背後,其實是李彥宏想勸退大模型創業者,并希望他們直接加入百度的AI生态。而百度的底氣,則來源于搶占了先發優勢的文心一言,基于更大的算力、更多的資料和更強的算法,依托飛槳平台,從文心3.0、3.5,到4.0,文心大模型的能力也逐漸增強。

相比一年前,文心大模型的算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%、推理性能提升了105倍,推理的成本更降到了原來的1%。

大模型開源還是閉源好,周鴻祎與李彥宏針尖對麥芒

此前百度CTO王海峰就曾透露,目前文心一言累計使用者規模已達2億,日均調用量也達到了2億;飛槳文心生态已聚集1295萬開發者、服務24.4萬家企事業機關,基于飛槳和文心建立89.5萬個模型,利用千帆平台開發的AI原生應用數量更是超過了19萬。

是以百度想要的其實是類似OpenAI那樣建立AI生态,并以文心一言為支點進行平台化。如此一來,百度方面希望大模型賽道的參與者自然是越少越好,一旦創業者都去開發AI應用、而非大模型,自然就有可能會重演當年App Store的故事。

多年以來持續在AI領域投入的百度無疑是國内AI大模型的先行者,而其AI領域實作的增量收入也反映在了2023年的财報中,但絕對值卻并不大。是以對于幾乎錯失了整個移動網際網路時代的百度而言,夯實自家AI生态、并提升AI業務的貨币化能力,無疑就是目前的頭等大事。而相比于自己來做産品,做應用商店來“收稅”顯然會是個更好的選擇。

大模型開源還是閉源好,周鴻祎與李彥宏針尖對麥芒

歸根結底,大模型到底是開源好、還是閉源更佳,目前在技術層面暫時還沒有分出高下,但閉源或開源對于不同公司的商業利益卻各有優劣。