卷瘋了！Meta AI釋出了最強開源大模型Llama 3，提供了8B和70B版?

Meta AI推出Llama 3，開源大模型實力再更新

在人工智能領域，開源模型一直是推動技術發展的重要力量。經過多年的努力，開源大模型的實力已經接近甚至超越了一些商業模型，為廣大開發者和研究人員提供了極具價值的資源。近日，Meta AI釋出了其最新開源大語言模型Llama 3，在多個方面實作了重大突破，引發了業界廣泛關注。

主要特點:Llama 3是Meta繼Llama 2之後推出的全新一代大模型，提供了8B和70B兩個版本。它采用了全新設計的128K詞彙量tokenizer，能更高效地編碼語言，進而大幅提升模型性能。兩個版本均采用了分組查詢注意力（GQA機制，顯著提高了推理效率。更令人印象深刻的是，Llama 3在15萬億詞元的大規模資料集上訓練，比Llama 2多出7倍，其中包括4倍的代碼資料，有望進一步增強模型在程式設計領域的能力。

卷瘋了！Meta AI釋出了最強開源大模型Llama 3，提供了8B和70B版?

對比優勢:Meta對Llama 3進行了廣泛的指令微調，使其在各項基準測試中表現出色，推理、代碼生成、指令遵循能力均有大幅提升。8B版本在多項基準測試中已經超過了Mistral 7B、Google Gemma 7B等其他知名開源模型。而70B版本的實力更加強大，在部分測試中甚至可以與Google Gemini Pro 1.5、Anthropic Claude 3等商業大模型一較高下。Llama 3再次拓展了開源大模型的新高度。

深入解析Llama 3的技術創新

新tokenizer和詞彙量:Llama 3采用了全新的128K詞彙量tokenizer，相比之前的32K有了大幅提升。更大的詞彙量意味着模型能夠更精确地表示語言，減少未知詞的數量，進而提高了語義了解和生成的準确性。新tokenizer還針對代碼資料進行了優化，有助于更好地處理程式設計相關的任務。

注意力機制優化:Llama 3的8B和70B版本均采用了分組查詢注意力（GQA機制。傳統的全連接配接注意力會随着序列長度的增加而計算量成指數級增長，而GQA通過将查詢分組并分别計算注意力，大幅降低了計算複雜度，使得模型能夠更高效地處理長序列，提升了推理速度。

大規模訓練資料集:資料是訓練大模型的關鍵因素之一。Llama 3在15萬億詞元的海量資料集上進行了預訓練，相比Llama 2多出了7倍的資料量。代碼資料的比例也增加了4倍，有望進一步增強模型在程式設計領域的表現。如此龐大的資料集，確定了Llama 3對各種領域的知識有更全面的覆寫。

模型表現和基準測試:經過大規模訓練，Llama 3在多項基準測試中展現出了卓越的能力。指令微調版本不僅在推理、代碼生成等傳統任務上表現優異，而且對于新興的指令遵循任務也有出色的成績，展現了強大的通用性。

具體來看，8B版本在多項基準測試中已經超過了Mistral 7B、Google Gemma 7B等其他知名開源模型，例如在Codex代碼了解測試中的分數高達57.1%，而Gemma 7B隻有46.6%。70B版本的實力就更加強大了，在測試中甚至可以與Google Gemini Pro 1.5、Anthropic Claude 3等商業大模型一較高下，如在MMLU任務上的準确率高達61.9%，與Claude 3的62.5%相差無幾。

開源AI新高度，Llama 3引領大模型新趨勢

開源AI願景:作為開源AI的堅定支援者，Meta一直在推動這一領域的發展。通過開源Llama 3模型并在多家雲平台部署，Meta希望為廣大開發者和研究人員提供更強大的工具，激發創新靈感，推動人工智能技術的快速進步。

應用前景廣闊:作為一款全能型大模型，Llama 3在各個領域都有廣闊的應用前景。它不僅能夠勝任傳統的自然語言處理任務，如問答、摘要、機器翻譯等，而且在程式設計代碼生成、和了解方面也有出色的表現，可以為軟體開發帶來革命性的提升。Llama 3強大的推理和指令遵循能力，使其在智能助手、決策支援等新興場景也大有可為。

未來更加開放:雖然目前Llama 3隻提供了文本模型，但Meta已經在醞釀更加宏大的計劃。他們正在訓練400B+參數量的大型模型，未來将支援多模态輸入如圖像、視訊等，同時也将拓展到多語種支援和更長的語境視窗。Llama系列在不久的将來有望成為真正意義上的通用人工智能，成為最強大的開源多模态大模型。

開源大模型新趨勢:Llama 3的出現，标志着開源大模型已經進入了一個新的發展階段。過去，開源模型主要局限于中小規模，性能上與商業模型有一定差距。但現在，開源大模型不僅在規模上已經突破了十億參數大關，在性能上也可以與頂尖商業模型媲美，甚至在某些方面更勝一籌。這種變革不僅給予了開發者前所未有的機會，也将極大推動人工智能技術的民主化程序。

開源大模型必将成為人工智能發展的重要驅動力。Llama 3就是這一趨勢的最新代表，它的出現将進一步激發創新熱情，吸引更多的人才和資源投入到這個領域。我們有理由相信，在不久的将來，開源大模型将在越來越多的場景中大放異彩，為人類社會帶來深遠的影響。

卷瘋了！Meta AI釋出了最強開源大模型Llama 3，提供了8B和70B版?

繼續閱讀

海拔3200米的無影雲教室：雪山下的孩子遇見AI大模型

小鑫分享：元胞自動機模型

男子偷走800元手機模型被拘留

隻有谷歌受傷的世界達成了，但“全能模型”到底該不該跟？

揭秘記憶之謎：艾賓浩斯遺忘曲線與思維模型撲克牌法助你成長飛躍

GPU之後，NPU再成标配，手機、PC如何承載AI大模型？

搶先看！位元組跳動破天荒！大模型驚豔亮相，價格低至99%！

3900 萬人圍觀雷軍直播試駕；馬斯克招募第二名腦機實驗患者；DeepMind 推出大模型危險性評估架構

從“天價”到“骨折價”，大模型要變天了

大模型想落地，先讓大家用得起

與億級使用者直接互動第三方AI大模型加速接入微網誌生态

訊飛星火大模型賦能，開啟虛拟人“全新意識”

當開源遇到大模型，将産生怎樣的變革？

傳清華系大模型公司高層變動

58同城孫啟明：生活服務垂類大模型怎麼搭？自研+開源兩手抓

AI天玑全量推送國内首個端到端大模型量産上車小鵬開啟AI智駕時代