天天看點

開源,會是對手打敗 ChatGPT 的絕招嗎?

作者:科技狐

周二,Meta 釋出了最新一代的開源大語言模型 Llama 2。

開源,會是對手打敗 ChatGPT 的絕招嗎?

與 Meta 在 2 月釋出的第一代大模型 Llama 1 相比,Llama 2 在許多方面得到提升,比如訓練資料比 Llama 1 多了 40%、訓練所用的 token 翻了一倍,增加至 2 萬億、上下文長度限制也翻了一倍……總而言之,就是 Llama 變得更強了。

不過,使整個行業震驚的不是 Llama 2 的強大——當然,它足夠強——而是 Meta 宣布 Llama 2 對研究和商用都是免費。

開源,會是對手打敗 ChatGPT 的絕招嗎?

這也意味着衆多研究機構和商業公司可免費使用開源的 Llama 2,無需自己耗費巨大的成本來開發一個大模型,降低了企業的研發成本,有利于 Meta 争取更多的合作夥伴。

目前與 Llama 2 合作的就包括了微軟、亞馬遜、IBM、高通、Spotify 等知名企業。

開源,會是對手打敗 ChatGPT 的絕招嗎?

關于 Llama 2 的介紹網上已經足夠多了,這裡不再贅述,而本文,老狐想來介紹一下“開源”,這個在當今網際網路十分常見,但大家對它卻比較陌生的概念。

開源,會是對手打敗 ChatGPT 的絕招嗎?

開源的基本概念

所謂“開源”,即開放源代碼,也稱源代碼公開,是軟體的一種散布形式,而開源軟體即公開源代碼的軟體。

開源,會是對手打敗 ChatGPT 的絕招嗎?

一般的軟體他人僅可取得已經編譯過的二進制可執行檔,隻有軟體的作者或著作權所有者等擁有程式的源代碼,這類軟體稱為閉源軟體。

開源軟體不僅僅是源代碼公開,更重要的是其他人可以在開源協定的規定内對軟體進行學習,修改以及出于任何目的的再分發。

開放源代碼的定義最先由 Bruce Perens 提出,經由 Eric S.Raymond 發展,主要有以下十條:

開源,會是對手打敗 ChatGPT 的絕招嗎?
開源,會是對手打敗 ChatGPT 的絕招嗎?

開源的曆史

雖然現在人們用到的軟體,閉源居多,但最早期的軟體開發,軟體都是開源的,因為早期硬體發達,而軟體隻是附屬品。

例如在 1970 年之前,IBM 出售的大規模計算機,采用的部分軟體,軟體公司會提供源代碼,讓懂程式的維護人員知道軟體是如何運作的,友善修正或添加想要的功能。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*IBM S/360 計算機,于 1964 年推出

後來随着軟體行業的發展,軟體公司意識到其中的商業利益,開始進入封閉式的開發模式,不再提供軟體的源代碼,人們稱其為“教堂式”。

所謂教堂式,就是将軟體開發比作建造一座教堂,應該由高手或專家來設計并建造,等到版本成熟時才開放提供給使用者,并利用知識産權制度将開放的軟體私有财産化,将其閉源,不被他人模仿,以滿足企業的商業利益。

我們熟悉的 Windows 系統便是閉源軟體開發模式的代表。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*Windows3.0

但閉源軟體開發模式帶來了一系列問題,比如軟體費用高、安全漏洞多、新舊版支援問題、不符合個人需求等等,一部分軟體開發者對其不滿意,于是興起了“開放源代碼運動”。

開放源代碼運動的支援者認為不阻礙合作、可共享的研究風氣才是軟體開發應有的路徑,反對把軟體建立在知識産權與許可證的基礎之上,認為這樣限制了他人利用源代碼修改、調整軟體以适應自身的需要,阻礙了軟體的進一步完善和發展,導緻軟體安全性下降、創新減少、不相容等問題。

随着開放源代碼運動的進行,産生了許多實際性成果。

Richard M.Stallman 于 1985 年創立了自由軟體基金會,并開啟了 GUN 項目,後者是一個自由的作業系統,其内容軟體完全以 GPL 的方式釋出。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*Richard M.Stallman

加州伯克利大學的計算機研究團隊發展并改進了 AT&T 的 Unix 系統,建立許多應用程式,并迅速成為“BSD Unix”,後來“BSD Unix”被蘋果的 macOS 采用。

1991 年,Linux 核心被芬蘭一名大二學生編寫出來。

開源,會是對手打敗 ChatGPT 的絕招嗎?

1999 年,Eric S.Raymond 出版了著作《大教堂與市集》,該書講述了黑客文化史、Linux的開發過程、以及作者本人主持開發的開放源代碼軟體 Fetchmail 的經曆,并讨論了軟體開發的方法論。《大教堂與市集》成為開放源代碼活動的聖經。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*Eric S.Raymond

與“教堂式”對應的,開源軟體開發模式被稱為“市集式”,就是通過不同的軟體開發愛好者,組成一個不同流程和不同方式的市集,共同開發軟體。

市集式的代表便是 Linux,最初由芬蘭大二學生 Linus Torvalds 于 1991 年首次釋出 Linux 的核心,後來無數人加入合作使其可用性增強。現如今,采用 Linux 核心的系統已經運作在很多的裝置上,比如大型計算機和超級計算機、伺服器、手機(安卓)、路由器、電視等等。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*Linux 創始人 Linus Torvalds

開源,會是對手打敗 ChatGPT 的絕招嗎?

開源的意義

在前面提到了,開放源代碼運動旨在追求不阻礙合作、可共享的軟體開發路徑,并認為開放源代碼更有利于提高軟體的安全性、創新性和相容性,這是開放源代碼最直接的意義。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*Github 上的開源項目

将軟體源代碼公之于衆,使得所有開發者都成為軟體的潛在開發者,其中不乏許多優秀的網絡人才,共同開發軟體,能夠讓軟體存在的漏洞很快被發現并彌補,同時,每個人的想法也能在軟體上實作,促進了軟體的發展和疊代,有利于軟體的發展。

以上是軟體開源在軟體層面的意義,而像 Meta 将 Llama 2 開源,更多的是商業層面的考量,因為站在 Meta Llama 前面的是 ChatGPT 這個巨頭。

Meta 将 Llama 2 開源,能争取更多的開發者支援,包括那些知名的合作企業,進而促進 Llama 的發展,提高市場占有率。過往不乏類似的案例。

Windows 從 3.0 開始取得了廣泛的成功,占據了個人電腦作業系統的大部分市場,對微軟不滿的科技行業從業者,在 Linux 的基礎上開發,将後者變成了網站和網際網路應用的運作系統。

開源,會是對手打敗 ChatGPT 的絕招嗎?

2007 年 1 月,蘋果釋出了初代 iPhone,并展示了強大的 iOS 系統。該年11月,谷歌向外界公布了安卓系統,與 84 家軟、硬體企業以及電信營運商組成“開放手持裝置聯盟”,并以免費開源的方式,釋出了 安卓的源代碼,以此來與 iOS 競争。

開源,會是對手打敗 ChatGPT 的絕招嗎?

從網際網路發展史來看,行業領先的巨頭往往會選擇閉源式開發,以保證技術領先,賺取更多的商業利益,而後來者選擇開源,争取更多的市場和合作夥伴,以此抗衡行業領先者。

是以,“開源”成為部分企業以小博大的戰略選擇。

例如谷歌雖然不直接通過安卓系統授權獲利,但卻可以賺取 GMS 的授權服務費,而 Llama 如果取得成功,Meta 未來也能通過其他方式取得收益。

不過,現在站在 Meta 的 Llama 2 前面的巨頭不隻是 OpenAI 的 ChatGPT,還有 Google 的大語言模型 Bard——是的,将安卓開源的谷歌,在大語言模型開發上選擇将 Bard 閉源。

開源,會是對手打敗 ChatGPT 的絕招嗎?

對企業來說,開發軟體選擇開源還是閉源不是基于主義,商業利益才是最主要的考量因素。

不過值得一提的是,Meta 的 AI 首席科學家楊立昆是一名開源主義者,當初紮克伯格邀請他出任臉書的 AI 實驗室主任一職時,他曾要求研究成果必須開源。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*楊立昆Yann LeCun

開源,會是對手打敗 ChatGPT 的絕招嗎?

開源的缺點

在前面,老狐介紹的都是開源的優點,事實上,開源的缺點某種程度上也是其優點帶來的,展現了一個事物的兩面性。

首先是開源項目參與人數衆多,且自發進行,這必然造成管理困難,需要項目上司者付出更多精力去整合項目,做好決策。

例如 80 年代與比爾·蓋茨齊名的技術天才米切爾·卡普爾曾出資幾百萬美元啟動一個名為 Chandler 的開源項目,旨在開發一個個人資訊管理軟體,但因為項目管理混亂,開發人員更疊,項目最後失敗。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*米切爾·卡普爾

其次,開源項目疊代頻繁,不斷有新版本被開發出來,這需要軟體使用者不斷安裝新版本,這給使用者帶來了更高的使用成本。

最後則是開源軟體未來的不确定性,因為其成員來自不同的人,軟體的品質和未來發展都沒法得到保證,一款軟體使用者正用着可能就沒下文了。

以上開源的三個缺點恰好是閉源的商業軟體的優勢,以 Windows 為例,微軟有專業團隊負責開發,後期有穩定的更新和維護,能給使用者減少許多的麻煩。

開源,會是對手打敗 ChatGPT 的絕招嗎?

寫在最後

讀到這裡,我想大家對“開源”已經有了大概的了解。

近些年,伴随着網際網路的快速發展,尤其是大資料、物聯網、AI 等技術的火熱,開源軟體的開發者逐漸增多,相關的開源項目也越來越多,促進了開源軟體行業的發展。

一向封閉的微軟,也在納德拉上任後開始擁抱開源。2014 年,微軟在開源社群 Github 上開設了賬戶,并成為社群的最大貢獻者;2018 年,微軟花費 75 億美元收購了 Github,後者當時已是全球最大的開源社群和代碼托管平台;如今,微軟也将與 Meta 的 Llama 展開合作。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*納德拉和紮克伯格

開源社群 Hugging Face 伴随着 AI 的興起,成為了開源社群的頂流,如今 Hugging Face 上有超過 25 萬個模型,包括 Meta 的 Llama 2、國内王小川創立的百川智能的大語言模型“百川”。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*Hugging Face上的大模型

現在回到文章開頭的話題上來,小夥伴們認為 Llama 能通過開源的方式,擊敗閉源的 ChatGPT 和 Bard 麼?

雖然結果老狐也無法預測,但非常樂意見到這樣的競争,這是一場技術落後者借助群衆力量與技術領先者的競争,也是開源的理想主義者與閉源的現實主義者的競争,結果會怎樣呢?

答案在時間裡。

參考資料

财聯社:Meta 釋出 Llama 2 模型 與微軟、高通展開合作

晚點 LastPost:Llama 2 釋出,一夜之間,大模型競争來到新起點

維基百科:“開放源代碼”

石娟:開放源代碼及相關知識産權法理刍論[D].重慶:西南政法大學,2007.

遠川研究所:差一步稱霸AI:曆史程序中的紮克伯格

Web3 天空之城:楊立昆最新訪談:AI 威脅論是蒙昧主義,控制欲隻有人才有

維基百科:《Dreaming in code》

虎嗅:Github 50 億美元把自己賣了,為什麼是微軟呢?

極客公園:為了中國市場,Hugging Face 甚至玩上了小紅書

編輯:木易

繼續閱讀