全球第一！Llama 3中文版大模型

作者：郵電設計技術 2024-04-20 22:02:00

來源：聯通科技創新 2024-04-20 21:41

4月19日，美國Meta公司釋出了新一代開源大模型Llama 3，提供了80億參數和700億參數兩個版本的供開發者下載下傳。相較于上一代模型Llama 2，Llama 3在模型整體架構上變化不大，在對詞表等子產品進行更新的同時，使用了更多高品質的預訓練資料，這使得它在代碼、推理、寫作、總結等各方面能力上有了大幅度提升，并在多項權威評測中超越了同參數規模的一衆對手。然而，由于它的訓練資料以英文為主，該模型的中文能力尚存較大欠缺。在使用時，經常會出現中文提問，英文回答的現象，無法在以中文為主的應用中直接使用。

中國聯通第一時間迅速啟動Llama 3中文優化工作，利用前期積累的大模型相關技術和經驗，使用覆寫多個領域和行業的、價值觀對齊的高品質指令微調資料，在Llama 3模型釋出後24小時内完成了全球第一個中文微調版本的Unichat-llama3-Chinese-8B，并開源給業界，供開發者使用。從下面的例子可以看到，經過微調的模型，已經具備進行中文問答和創作的能力，同時在價值觀上也更符合人類的認知。

中國聯通在2024年2月推出了元景“1+1+M”大模型體系，包括1套基礎大模型（含語言大模型和多模态大模型，支援聲圖文3種模态）、1個大模型平台和M種行業大模型（目前已具備10種行業大模型）。其中元景語言模型已具備10/70/130/340/700億等參數規模版本，同參數級性能達到業界先進水準，并已賦能網絡、客服、政務、服裝等多個内外部行業應用。接下來，中國聯通會持續在大模型領域發力，實作通用大模型能力提供與行業大模型快速定制相結合的體系化賦能。

接下來，我們會推進對該模型的深度評測，并逐漸開放支援長文本的中文Llama 3-8B模型、中文深度預訓練模型版本以及Llama 3-70B模型的中文版本，敬請期待和關注！

關注聯通科技創新公衆号

背景回複

“元景”

擷取模型網址

全球第一！Llama 3中文版大模型

繼續閱讀

叫闆蘋果MacBook？華碩無畏Pro15新品上架，這顆骁龍AI晶片不一般

誰才是新能源汽車座艙天花闆？鴻蒙座艙名聲在外，但新的挑戰者已經出現了！#智能座艙#6月12日，長城汽車釋出CoffeeO

今日競價打闆總結（6月13日）1-3号日線結構壓力較大，競價有瑕疵或有誘多嫌疑，都沒入場，但最終全都封闆。4号競價尚可，

大模型“價格戰”打響，AI界迎來大變天？

大模型應用之路：從提示詞到通用人工智能（AGI）

首批通過！商湯小浣熊獲信通院代碼大模型評估最高評級

iPhone 16會殺死大模型APP嗎？

華為開發者大會：HarmonyOS Next系統、盤古5.0大模型等技術亮相

大模型在持續學習領域的最新研究進展與綜述

【好文轉發】大模型為什麼能把業務系統拉通?

阿裡通義Qwen2拿下大模型最新測評全球開源第一周鴻祎發文祝賀：未來開源模式一定會超過閉源

AI手機風口下，位元組選擇做手機廠商的大模型供應商

一個生産動畫效果的文生圖模型：AnimateDiff

英偉達開源最強通用模型Nemotron-4 340B：開啟AI合成資料新紀元！

高效組織團隊會議，關鍵在于會前明确目标、準備充分；會中引導讨論、聚焦核心；會後總結成果、跟蹤行動。這三點構成了會議成功的

中國AI大模型平台排行榜 | 5月