開源，會是對手打敗 ChatGPT 的絕招嗎？

周二，Meta 釋出了最新一代的開源大語言模型 Llama 2。

與 Meta 在 2 月釋出的第一代大模型 Llama 1 相比，Llama 2 在許多方面得到提升，比如訓練資料比 Llama 1 多了 40%、訓練所用的 token 翻了一倍，增加至 2 萬億、上下文長度限制也翻了一倍……總而言之，就是 Llama 變得更強了。

不過，使整個行業震驚的不是 Llama 2 的強大——當然，它足夠強——而是 Meta 宣布 Llama 2 對研究和商用都是免費。

這也意味着衆多研究機構和商業公司可免費使用開源的 Llama 2，無需自己耗費巨大的成本來開發一個大模型，降低了企業的研發成本，有利于 Meta 争取更多的合作夥伴。

目前與 Llama 2 合作的就包括了微軟、亞馬遜、IBM、高通、Spotify 等知名企業。

關于 Llama 2 的介紹網上已經足夠多了，這裡不再贅述，而本文，老狐想來介紹一下“開源”，這個在當今網際網路十分常見，但大家對它卻比較陌生的概念。

開源的基本概念

所謂“開源”，即開放源代碼，也稱源代碼公開，是軟體的一種散布形式，而開源軟體即公開源代碼的軟體。

一般的軟體他人僅可取得已經編譯過的二進制可執行檔，隻有軟體的作者或著作權所有者等擁有程式的源代碼，這類軟體稱為閉源軟體。

開源軟體不僅僅是源代碼公開，更重要的是其他人可以在開源協定的規定内對軟體進行學習，修改以及出于任何目的的再分發。

開放源代碼的定義最先由 Bruce Perens 提出，經由 Eric S.Raymond 發展，主要有以下十條：

開源的曆史

雖然現在人們用到的軟體，閉源居多，但最早期的軟體開發，軟體都是開源的，因為早期硬體發達，而軟體隻是附屬品。

例如在 1970 年之前，IBM 出售的大規模計算機，采用的部分軟體，軟體公司會提供源代碼，讓懂程式的維護人員知道軟體是如何運作的，友善修正或添加想要的功能。

*IBM S/360 計算機，于 1964 年推出

後來随着軟體行業的發展，軟體公司意識到其中的商業利益，開始進入封閉式的開發模式，不再提供軟體的源代碼，人們稱其為“教堂式”。

所謂教堂式，就是将軟體開發比作建造一座教堂，應該由高手或專家來設計并建造，等到版本成熟時才開放提供給使用者，并利用知識産權制度将開放的軟體私有财産化，将其閉源，不被他人模仿，以滿足企業的商業利益。

我們熟悉的 Windows 系統便是閉源軟體開發模式的代表。

*Windows3.0

但閉源軟體開發模式帶來了一系列問題，比如軟體費用高、安全漏洞多、新舊版支援問題、不符合個人需求等等，一部分軟體開發者對其不滿意，于是興起了“開放源代碼運動”。

開放源代碼運動的支援者認為不阻礙合作、可共享的研究風氣才是軟體開發應有的路徑，反對把軟體建立在知識産權與許可證的基礎之上，認為這樣限制了他人利用源代碼修改、調整軟體以适應自身的需要，阻礙了軟體的進一步完善和發展，導緻軟體安全性下降、創新減少、不相容等問題。

随着開放源代碼運動的進行，産生了許多實際性成果。

Richard M.Stallman 于 1985 年創立了自由軟體基金會，并開啟了 GUN 項目，後者是一個自由的作業系統，其内容軟體完全以 GPL 的方式釋出。

*Richard M.Stallman

加州伯克利大學的計算機研究團隊發展并改進了 AT&T 的 Unix 系統，建立許多應用程式，并迅速成為“BSD Unix”，後來“BSD Unix”被蘋果的 macOS 采用。

1991 年，Linux 核心被芬蘭一名大二學生編寫出來。

1999 年，Eric S.Raymond 出版了著作《大教堂與市集》，該書講述了黑客文化史、Linux的開發過程、以及作者本人主持開發的開放源代碼軟體 Fetchmail 的經曆，并讨論了軟體開發的方法論。《大教堂與市集》成為開放源代碼活動的聖經。

*Eric S.Raymond

與“教堂式”對應的，開源軟體開發模式被稱為“市集式”，就是通過不同的軟體開發愛好者，組成一個不同流程和不同方式的市集，共同開發軟體。

市集式的代表便是 Linux，最初由芬蘭大二學生 Linus Torvalds 于 1991 年首次釋出 Linux 的核心，後來無數人加入合作使其可用性增強。現如今，采用 Linux 核心的系統已經運作在很多的裝置上，比如大型計算機和超級計算機、伺服器、手機（安卓）、路由器、電視等等。

*Linux 創始人 Linus Torvalds

開源的意義

在前面提到了，開放源代碼運動旨在追求不阻礙合作、可共享的軟體開發路徑，并認為開放源代碼更有利于提高軟體的安全性、創新性和相容性，這是開放源代碼最直接的意義。

*Github 上的開源項目

将軟體源代碼公之于衆，使得所有開發者都成為軟體的潛在開發者，其中不乏許多優秀的網絡人才，共同開發軟體，能夠讓軟體存在的漏洞很快被發現并彌補，同時，每個人的想法也能在軟體上實作，促進了軟體的發展和疊代，有利于軟體的發展。

以上是軟體開源在軟體層面的意義，而像 Meta 将 Llama 2 開源，更多的是商業層面的考量，因為站在 Meta Llama 前面的是 ChatGPT 這個巨頭。

Meta 将 Llama 2 開源，能争取更多的開發者支援，包括那些知名的合作企業，進而促進 Llama 的發展，提高市場占有率。過往不乏類似的案例。

Windows 從 3.0 開始取得了廣泛的成功，占據了個人電腦作業系統的大部分市場，對微軟不滿的科技行業從業者，在 Linux 的基礎上開發，将後者變成了網站和網際網路應用的運作系統。

2007 年 1 月，蘋果釋出了初代 iPhone，并展示了強大的 iOS 系統。該年11月，谷歌向外界公布了安卓系統，與 84 家軟、硬體企業以及電信營運商組成“開放手持裝置聯盟”，并以免費開源的方式，釋出了安卓的源代碼，以此來與 iOS 競争。

從網際網路發展史來看，行業領先的巨頭往往會選擇閉源式開發，以保證技術領先，賺取更多的商業利益，而後來者選擇開源，争取更多的市場和合作夥伴，以此抗衡行業領先者。

是以，“開源”成為部分企業以小博大的戰略選擇。

例如谷歌雖然不直接通過安卓系統授權獲利，但卻可以賺取 GMS 的授權服務費，而 Llama 如果取得成功，Meta 未來也能通過其他方式取得收益。

不過，現在站在 Meta 的 Llama 2 前面的巨頭不隻是 OpenAI 的 ChatGPT，還有 Google 的大語言模型 Bard——是的，将安卓開源的谷歌，在大語言模型開發上選擇将 Bard 閉源。

對企業來說，開發軟體選擇開源還是閉源不是基于主義，商業利益才是最主要的考量因素。

不過值得一提的是，Meta 的 AI 首席科學家楊立昆是一名開源主義者，當初紮克伯格邀請他出任臉書的 AI 實驗室主任一職時，他曾要求研究成果必須開源。

*楊立昆Yann LeCun

開源的缺點

在前面，老狐介紹的都是開源的優點，事實上，開源的缺點某種程度上也是其優點帶來的，展現了一個事物的兩面性。

首先是開源項目參與人數衆多，且自發進行，這必然造成管理困難，需要項目上司者付出更多精力去整合項目，做好決策。

例如 80 年代與比爾·蓋茨齊名的技術天才米切爾·卡普爾曾出資幾百萬美元啟動一個名為 Chandler 的開源項目，旨在開發一個個人資訊管理軟體，但因為項目管理混亂，開發人員更疊，項目最後失敗。

*米切爾·卡普爾

其次，開源項目疊代頻繁，不斷有新版本被開發出來，這需要軟體使用者不斷安裝新版本，這給使用者帶來了更高的使用成本。

最後則是開源軟體未來的不确定性，因為其成員來自不同的人，軟體的品質和未來發展都沒法得到保證，一款軟體使用者正用着可能就沒下文了。

以上開源的三個缺點恰好是閉源的商業軟體的優勢，以 Windows 為例，微軟有專業團隊負責開發，後期有穩定的更新和維護，能給使用者減少許多的麻煩。

寫在最後

讀到這裡，我想大家對“開源”已經有了大概的了解。

近些年，伴随着網際網路的快速發展，尤其是大資料、物聯網、AI 等技術的火熱，開源軟體的開發者逐漸增多，相關的開源項目也越來越多，促進了開源軟體行業的發展。

一向封閉的微軟，也在納德拉上任後開始擁抱開源。2014 年，微軟在開源社群 Github 上開設了賬戶，并成為社群的最大貢獻者；2018 年，微軟花費 75 億美元收購了 Github，後者當時已是全球最大的開源社群和代碼托管平台；如今，微軟也将與 Meta 的 Llama 展開合作。

*納德拉和紮克伯格

開源社群 Hugging Face 伴随着 AI 的興起，成為了開源社群的頂流，如今 Hugging Face 上有超過 25 萬個模型，包括 Meta 的 Llama 2、國内王小川創立的百川智能的大語言模型“百川”。

*Hugging Face上的大模型

現在回到文章開頭的話題上來，小夥伴們認為 Llama 能通過開源的方式，擊敗閉源的 ChatGPT 和 Bard 麼？

雖然結果老狐也無法預測，但非常樂意見到這樣的競争，這是一場技術落後者借助群衆力量與技術領先者的競争，也是開源的理想主義者與閉源的現實主義者的競争，結果會怎樣呢？

答案在時間裡。

參考資料

财聯社：Meta 釋出 Llama 2 模型與微軟、高通展開合作

晚點 LastPost：Llama 2 釋出，一夜之間，大模型競争來到新起點

維基百科：“開放源代碼”

石娟：開放源代碼及相關知識産權法理刍論[D].重慶:西南政法大學,2007.

遠川研究所：差一步稱霸AI：曆史程序中的紮克伯格

Web3 天空之城：楊立昆最新訪談：AI 威脅論是蒙昧主義，控制欲隻有人才有

維基百科：《Dreaming in code》

虎嗅：Github 50 億美元把自己賣了，為什麼是微軟呢？

極客公園：為了中國市場，Hugging Face 甚至玩上了小紅書

編輯：木易

開源，會是對手打敗 ChatGPT 的絕招嗎？

繼續閱讀

ChatGPT沒有做的AI搜尋，是不是下一個戰場

最強OpenAI釋出新ChatGPT-4o，AI領域的突破情感識别+視覺了解

OpenAI一夜幹翻語音助手！ChatGPT學會看螢幕，現實版Her來了

突然殺出！中國版阿裡ChatGPT來了！我忍不住去注冊體驗

胡錫進要失業了？網友用ChatGPT模仿“胡編體”寫作，笑瘋

從人機互動角度聊聊ChatGPT-4o

iOS 版 ChatGPT 更新支援 App 首選語言設定中文

如何讓ChatGPT更“懂你”

生成式人工智能的風險與治理——以ChatGPT為例

這才是ChatGPT4o最大的更新！釋出會居然隻字未提！GPT-4o的識圖能力居然這麼強！連人像照都可以看出是誰👍我這裡

ChatGPT 新功能上線：聊天時可直接選擇 OneDrive 等網盤檔案｜懂點AI

ChatGPT能夠幫助醫生準确分析臨床研究和病案記錄

ChatGPT 日耗電超 50 萬度，卡死AI發展的竟然是能源？

恐怖！懇求斯坦福教授幫它“越獄”？ChatGPT-4已出現自

和ChatGPT搞黃色的年輕人

OpenAI前董事揭示奧特曼罷免内幕：董事會是從X上知道ChatGPT已釋出的