天天看點

卷瘋了!Meta AI釋出了最強開源大模型Llama 3,提供了8B和70B版?

作者:極速楊梅8L1R

Meta AI推出Llama 3,開源大模型實力再更新

在人工智能領域,開源模型一直是推動技術發展的重要力量。經過多年的努力,開源大模型的實力已經接近甚至超越了一些商業模型,為廣大開發者和研究人員提供了極具價值的資源。近日,Meta AI釋出了其最新開源大語言模型Llama 3,在多個方面實作了重大突破,引發了業界廣泛關注。

主要特點:Llama 3是Meta繼Llama 2之後推出的全新一代大模型,提供了8B和70B兩個版本。它采用了全新設計的128K詞彙量tokenizer,能更高效地編碼語言,進而大幅提升模型性能。兩個版本均采用了分組查詢注意力(GQA機制,顯著提高了推理效率。更令人印象深刻的是,Llama 3在15萬億詞元的大規模資料集上訓練,比Llama 2多出7倍,其中包括4倍的代碼資料,有望進一步增強模型在程式設計領域的能力。

卷瘋了!Meta AI釋出了最強開源大模型Llama 3,提供了8B和70B版?

對比優勢:Meta對Llama 3進行了廣泛的指令微調,使其在各項基準測試中表現出色,推理、代碼生成、指令遵循能力均有大幅提升。8B版本在多項基準測試中已經超過了Mistral 7B、Google Gemma 7B等其他知名開源模型。而70B版本的實力更加強大,在部分測試中甚至可以與Google Gemini Pro 1.5、Anthropic Claude 3等商業大模型一較高下。Llama 3再次拓展了開源大模型的新高度。

卷瘋了!Meta AI釋出了最強開源大模型Llama 3,提供了8B和70B版?

深入解析Llama 3的技術創新

新tokenizer和詞彙量:Llama 3采用了全新的128K詞彙量tokenizer,相比之前的32K有了大幅提升。更大的詞彙量意味着模型能夠更精确地表示語言,減少未知詞的數量,進而提高了語義了解和生成的準确性。新tokenizer還針對代碼資料進行了優化,有助于更好地處理程式設計相關的任務。

注意力機制優化:Llama 3的8B和70B版本均采用了分組查詢注意力(GQA機制。傳統的全連接配接注意力會随着序列長度的增加而計算量成指數級增長,而GQA通過将查詢分組并分别計算注意力,大幅降低了計算複雜度,使得模型能夠更高效地處理長序列,提升了推理速度。

卷瘋了!Meta AI釋出了最強開源大模型Llama 3,提供了8B和70B版?

大規模訓練資料集:資料是訓練大模型的關鍵因素之一。Llama 3在15萬億詞元的海量資料集上進行了預訓練,相比Llama 2多出了7倍的資料量。代碼資料的比例也增加了4倍,有望進一步增強模型在程式設計領域的表現。如此龐大的資料集,確定了Llama 3對各種領域的知識有更全面的覆寫。

模型表現和基準測試:經過大規模訓練,Llama 3在多項基準測試中展現出了卓越的能力。指令微調版本不僅在推理、代碼生成等傳統任務上表現優異,而且對于新興的指令遵循任務也有出色的成績,展現了強大的通用性。

卷瘋了!Meta AI釋出了最強開源大模型Llama 3,提供了8B和70B版?

具體來看,8B版本在多項基準測試中已經超過了Mistral 7B、Google Gemma 7B等其他知名開源模型,例如在Codex代碼了解測試中的分數高達57.1%,而Gemma 7B隻有46.6%。70B版本的實力就更加強大了,在測試中甚至可以與Google Gemini Pro 1.5、Anthropic Claude 3等商業大模型一較高下,如在MMLU任務上的準确率高達61.9%,與Claude 3的62.5%相差無幾。

卷瘋了!Meta AI釋出了最強開源大模型Llama 3,提供了8B和70B版?

開源AI新高度,Llama 3引領大模型新趨勢

開源AI願景:作為開源AI的堅定支援者,Meta一直在推動這一領域的發展。通過開源Llama 3模型并在多家雲平台部署,Meta希望為廣大開發者和研究人員提供更強大的工具,激發創新靈感,推動人工智能技術的快速進步。

應用前景廣闊:作為一款全能型大模型,Llama 3在各個領域都有廣闊的應用前景。它不僅能夠勝任傳統的自然語言處理任務,如問答、摘要、機器翻譯等,而且在程式設計代碼生成、和了解方面也有出色的表現,可以為軟體開發帶來革命性的提升。Llama 3強大的推理和指令遵循能力,使其在智能助手、決策支援等新興場景也大有可為。

卷瘋了!Meta AI釋出了最強開源大模型Llama 3,提供了8B和70B版?

未來更加開放:雖然目前Llama 3隻提供了文本模型,但Meta已經在醞釀更加宏大的計劃。他們正在訓練400B+參數量的大型模型,未來将支援多模态輸入如圖像、視訊等,同時也将拓展到多語種支援和更長的語境視窗。Llama系列在不久的将來有望成為真正意義上的通用人工智能,成為最強大的開源多模态大模型。

開源大模型新趨勢:Llama 3的出現,标志着開源大模型已經進入了一個新的發展階段。過去,開源模型主要局限于中小規模,性能上與商業模型有一定差距。但現在,開源大模型不僅在規模上已經突破了十億參數大關,在性能上也可以與頂尖商業模型媲美,甚至在某些方面更勝一籌。這種變革不僅給予了開發者前所未有的機會,也将極大推動人工智能技術的民主化程序。

卷瘋了!Meta AI釋出了最強開源大模型Llama 3,提供了8B和70B版?

開源大模型必将成為人工智能發展的重要驅動力。Llama 3就是這一趨勢的最新代表,它的出現将進一步激發創新熱情,吸引更多的人才和資源投入到這個領域。我們有理由相信,在不久的将來,開源大模型将在越來越多的場景中大放異彩,為人類社會帶來深遠的影響。

卷瘋了!Meta AI釋出了最強開源大模型Llama 3,提供了8B和70B版?

繼續閱讀