天天看點

全球第一!Llama 3中文版大模型

作者:郵電設計技術

來源:聯通科技創新 2024-04-20 21:41

4月19日,美國Meta公司釋出了新一代開源大模型Llama 3,提供了80億參數和700億參數兩個版本的供開發者下載下傳。相較于上一代模型Llama 2,Llama 3在模型整體架構上變化不大,在對詞表等子產品進行更新的同時,使用了更多高品質的預訓練資料,這使得它在代碼、推理、寫作、總結等各方面能力上有了大幅度提升,并在多項權威評測中超越了同參數規模的一衆對手。然而,由于它的訓練資料以英文為主,該模型的中文能力尚存較大欠缺。在使用時,經常會出現中文提問,英文回答的現象,無法在以中文為主的應用中直接使用。

全球第一!Llama 3中文版大模型

中國聯通第一時間迅速啟動Llama 3中文優化工作,利用前期積累的大模型相關技術和經驗,使用覆寫多個領域和行業的、價值觀對齊的高品質指令微調資料,在Llama 3模型釋出後24小時内完成了全球第一個中文微調版本的Unichat-llama3-Chinese-8B,并開源給業界,供開發者使用。從下面的例子可以看到,經過微調的模型,已經具備進行中文問答和創作的能力,同時在價值觀上也更符合人類的認知。

全球第一!Llama 3中文版大模型
全球第一!Llama 3中文版大模型
全球第一!Llama 3中文版大模型
全球第一!Llama 3中文版大模型

中國聯通在2024年2月推出了元景“1+1+M”大模型體系,包括1套基礎大模型(含語言大模型和多模态大模型,支援聲圖文3種模态)、1個大模型平台和M種行業大模型(目前已具備10種行業大模型)。其中元景語言模型已具備10/70/130/340/700億等參數規模版本,同參數級性能達到業界先進水準,并已賦能網絡、客服、政務、服裝等多個内外部行業應用。接下來,中國聯通會持續在大模型領域發力,實作通用大模型能力提供與行業大模型快速定制相結合的體系化賦能。

全球第一!Llama 3中文版大模型

接下來,我們會推進對該模型的深度評測,并逐漸開放支援長文本的中文Llama 3-8B模型、中文深度預訓練模型版本以及Llama 3-70B模型的中文版本,敬請期待和關注!

關注聯通科技創新公衆号

背景回複

“元景”

擷取模型網址

繼續閱讀