開源大模型分水嶺：Meta釋出Llama 3 對标GPT-4

本報記者李玉洋上海報道

大幅領先Gemma 7B和Mistral 7B Instruct、超越了閉源的當紅的Claude 3 Sonnet、更能和谷歌Gemini Pro 1.5扳手腕……當地時間4月18日，Meta正式釋出了讓人等待已久的開源大模型Llama 3，一些基準測試結果顯示其是目前性能最強的開源模型之一。

據了解，Meta釋出了80億參數的Llama 3 8B和700億參數的Llama 3 70B兩個版本（B代表數十億，代表模型的複雜程度以及它對訓練的了解程度），其中Llama 3 8B在語言（MMLU）、知識（GPQA）、程式設計（HumanEval）、數學（GSM-8K、MATH）等能力上評測得分大幅超過Google和Mistral所開發的同級别模型，數學、程式設計能力翻倍。Meta公司首席執行官馬克·紮克伯格（Mark Zuckerberg）表示，最小的Llama 3基本上與最大的Llama 2一樣強大。

不止于此，Meta未來還将推出超過4000億參數的Llama 3版本。對此，英偉達進階研究經理Jim Fan說，這個還在訓練中的Llama 3 400B将成為開源大模型的一個分水嶺，将改變許多研究工作和創業公司的經營狀況。

“公司技術說微調Llama 3可以對标PK GPT-4。”AIGC創業者席文告訴《中國經營報》記者，雖然他自己将信将疑，但是很期待。他表示，會将Llama 3應用于銷售和營銷、人力資源管理等2B業務領域，因為“剛需高頻容易變現，也是迫在眉睫要改變的”。

功能強大的公開可用大模型

根據介紹，Llama 3的主要亮點有以下這些：基于超過15萬億token訓練，相當于Llama 2資料集的7倍還多；預訓練資料雖然主要以英語為主，但其中包含超30種語言的高品質非英語資料；支援8K長文本，改進的tokenizer具有128K token的詞彙量，可實作更好的性能；包括增強的推理和代碼能力的新能力範疇；訓練效率比Llama 2高3倍；帶有Llama Guard 2、Code Shield和CyberSec Eval 2的新版信任和安全工具等。

随後，Llama 3很快在亞馬遜AWS、Databricks、谷歌雲、Hugging Face、Kaggle、IBM的雲平台WatsonX、微軟雲Azure、英偉達的NIM和Snowflake上推出，并得到AMD、AWS、戴爾、英特爾、英偉達提供的硬體平台支援。

關于Llama 3的全方位技術詳解也跟着浮現。比如Llama 3采用了優化的自回歸Transformer架構，這種架構能夠有效提升生成文本的連貫性和相關性；結合了監督式微調（SFT）和帶人類回報的強化學習（RLHF），這種混合調優方法不僅增強了模型的幫助性，也提高了安全性，使得模型在實際應用中更加可靠和符合使用者預期。此外，為了提高Llama 3模型的推理效率，Meta還采用了分組查詢注意力（GQA）機制，在8192個tokens的序列上訓練模型，并使用掩碼確定自注意力不會跨越文檔邊界。

值得一提的是，與基礎模型一同釋出的，還有基于Llama 3的官方Web版本，名字就叫Meta AI。據Meta介紹，Llama 3将被整合到其虛拟助手Meta AI中，這是免費使用的同類産品中最先進的AI應用程式。Meta AI助手已經在Facebook、Instagram、WhatsApp和Messenger等應用中上線，随後也将迎來更新。

對于Llama 3，業界大佬對其表現點贊。OpenAI原資深研究科學家安德烈·卡帕蒂（Andrej Karpathy）認為，80億參數的Llama 3“會非常受歡迎”，效果接近參數更多的GPT-3.5，而且需要的算力低、反應快，甚至可以在手機、電腦上本地運作。

Meta AI首席科學家、圖靈獎得主Yann LeCun不僅為Llama 3的釋出搖旗呐喊，并再次預告未來幾個月将推出更多版本。就連特斯拉CEO馬斯克也現身于評論區，用一句簡潔而含蓄的“Not bad”，表達了對Llama 3的認可和期待。

研究機構Omdia人工智能首席分析師蘇廉節認為，Meta公開了Llama 3訓練資料集，還有一些資料安全的措施，這更加透明，且有助于提升使用者的信心。據了解，Llama 3 8B版本資料更新截至2023年3月，而70B版本則為同年12月。

Meta公布的基準測試結果顯示，Llama 3 8B在MMLU、GPQA、HumanEval等測試的得分遠超Google Gemma 7B和Mistral 7B Instruct；而Llama 3 70B則跻身于頂尖AI模型的行列，整體表現碾壓Claude 3大杯，與Gemini 1.5 Pro相比則是互有勝負。

不止于此，紮克伯格還表示4050億參數頂配版Llama 3将在今年晚些時候推出。對此，JIm Fan認為即将推出的Llama 3 400B+，像是開源模型與頂尖閉源模型并駕齊驅的象征。

為開源模型扳回一城

與不開源的OpenAI相比，Meta沿着開源路線朝AGI（通用人工智能）的聖杯發起了沖鋒。手握35萬塊GPU的紮克伯格在接受The Verge的采訪時描繪了Meta的願景——緻力于打造AGI。

如今的開源模型當真是百花齊放、百家争鳴。AI寫作助手創企HyperWriteAI的CEO見到Llama 3的驚人表現忍不住感慨：“我們正在步入一個新世界，一個GPT-4級别的模型開源并且可以自由通路的世界。”

在過去的一年中，整個AI圈在圍繞開源或閉源的路線争論不休。馬斯克親自下場，通過開源Grok 1.0為開源路線站台。日前，百度創始人、董事長兼首席執行官李彥宏在Create 2024百度AI開發者大會上表示：“大家以前用開源覺得便宜，其實在大模型場景下，開源是最貴的。是以，開源模型會越來越落後。”

如今，Llama 3的到來，為開源模型扳回一局，但這場關于開源與閉源的辯論還遠未結束。“我覺得最重要的還是應用場景，目前Meta部署得相對保守，我期待看到Meta将這個部署在更多的商業應用上。”蘇廉節表示。

AI創業者劉付江告訴記者，Llama 3的釋出，意味着他們不需要花錢購買OpenAI他們的API了。“相比Llama 2，Llama 3的參數規模更大，模型架構得到優化，訓練資料更多，所支援語言增多，對話問答推理都有很大提升。初體驗下來效果比GPT-3.5強，比4.0差一點。”他表示，将在本地部署Llama 3，幫企業做大模型的中控系統，連接配接工廠工廠中的房間裡的數字化系統、ERP系統和裝置，“先試用一段時間，仍需要大量的測試”。

席文則把Llama 3的商業應用優先放在了營銷上。“AI可以幫助企業更精準地定位目标市場，提高廣告和營銷活動的效果。”他表示，因為營銷剛需高頻，且容易變現。

記者注意到，用AI将營銷全鍊條重做一遍，已是大廠共識。如果說大模型的落地，在一些領域像“拿着錘子找釘子”，那營銷領域則屬于“一堆釘子等錘子”，因為營銷中存在大量的基礎性工作，等待AI來解放。

文生圖、圖生圖、文生視訊……各種形式的AIGC，首當其沖的是制作廣告素材，近一年内，大廠們相繼推出了自己的AIGC工具，用于商家制作廣告素材。

比如，阿裡媽媽去年7月上線了“萬相實驗室”，今年3月阿裡又上線了“繪蛙”；百度去年6月推出“擎舵”；抖音去年10月推出“即創”；京東去年12月推出“京點點”；騰訊今年1月推出“妙思”。它們左手有AI大模型，右手有客戶和場景，可謂是AI營銷落地的最佳“試煉場”。

需要指出的是，雖然現在Meta已經提供了Llama 3的下載下傳方式，便于廣大開發者免費使用，但該公司更傾向于用“開放”而不是“開源”一詞來定義該模型。原因在于，Meta即便允許開發者用Llama 3開展學術研究或開發商業應用，但卻并不像使用者想象的沒有任何附加條件去使用。

換句話說，Meta禁止開發者使用該模型訓練其他生成式模型，并且要求“每月活躍使用者超過7億”的公司必須向它申請特殊許可，再由Meta自行決定是否授予這一許可。

（編輯：吳清稽核：李正豪校對：顔京甯）

開源大模型分水嶺：Meta釋出Llama 3 對标GPT-4

繼續閱讀

怎麼用AI大模型解決實際問題？

大模型時代，資料中台現在過氣了嗎？

軒轅大模型的實踐與應用 | ML-Summit 2024

移動UI大模型問世，蘋果iPhone或迎更新新周期

科大訊飛不講大模型的“性感故事”

Meta釋出“最強開源AI模型”，下一代或比GPT更強

面壁新模型：早于Llama3、比肩 Llama3、推理超越 Llama3！

華為一季度利潤暴漲564%；天涯社群恢複；小紅書内測自研大模型

有效溝通表達的13個模型

一天吃透一條産業鍊:NO.37 AI大模型産業鍊

10款國産大模型大戰弱智吧——中文了解能力測評

最全解讀MoE混合專家模型：揭秘關鍵技術與挑戰

全面超越！開源！百度最強SOTA：基于擴散模型的3DGS！

沖刺2024“半年紅” | 六成AI企業實作盈利增長，大模型企業賺錢了？

對話優必選焦繼超：大模型加速人形機器人“進廠打工”

科大訊飛的盈利迷局：在大模型領域的高投入與低回報