天天看點

通義千問再放大招:720億大模型開源,全尺寸趕上LLaMA-2,還有移動端可用的18億模型

作者:36氪

時隔一個月,通義千問又放大招了!

在一個月前的阿裡雲栖大會上,阿裡正式釋出通義千問2.0版本,在複雜指令了解、文學創作、通用數學、知識記憶、幻覺抵禦等能力上,都有較大提升。并且,阿裡雲還釋出了包括程式設計、AI閱讀、音視訊轉錄、AI角色生成等八大産品模型。

當時,阿裡雲就已經預告,接下來還要再發更大規模的開源模型。

12月1日,三款新模型如約而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通義千問大模型也更新到了2.1版本。

最受矚目的首先是Qwen-72B,參數達到720億,基于3T tokens的高品質資料訓練。阿裡雲表示,Qwen-72B在10個權威基準測評中奪得開源模型最優成績,在部分測評中超越閉源的GPT-3.5和GPT-4。

通義千問再放大招:720億大模型開源,全尺寸趕上LLaMA-2,還有移動端可用的18億模型

△來源:阿裡雲

具體來說,在英語任務上,Qwen-72B在MMLU基準測試取得開源模型最高分;中文任務上,Qwen-72B在C-Eval、CMMLU、GaokaoBench等基準得分超越GPT-4。

而在數學推理方面,Qwen-72B在GSM8K、MATH測評中也領先其他開源模型;代碼了解方面,Qwen-72B在HumanEval、MBPP等測評中的表現大幅提升,代碼能力也有質的飛躍。

通義千問再放大招:720億大模型開源,全尺寸趕上LLaMA-2,還有移動端可用的18億模型

△72B模型做數學題

在複雜語義了解上,72B的能力也提高了不少,比如,現在就能夠聽懂中文裡的“潛台詞”了:

通義千問再放大招:720億大模型開源,全尺寸趕上LLaMA-2,還有移動端可用的18億模型

△72B模型了解“職場之道”

目前,國内外大模型都分為閉源和開源兩大路線。對标國外——OpenAI已走閉源路線,開源模型的代表則是Meta旗下的Llama。Meta在今年7月釋出了Llama 2,分别有7B(70億參數)、13B(130億參數)和70B(700億參數)三個尺寸。

阿裡雲Qwen-72B的推出,也意味着國内市場又多了一個對标Llama 2-70B的頭部開源模型。目前,通義千問的大語言模型家族已經實作全尺寸開源——包括18億、70億、140億、720億7個參數。

不同規模和尺寸的模型,意味着應用場景可以拓寬更多。比如,高達720億參數的Qwen-70B推出後,大中型企業就可以基于此可開發商業應用,高校、科研院所可利用AI來輔助科研工作——這些工作都需要複雜的運算,也依賴于模型能力邊界的不斷拓展。

阿裡雲在會上也請了不少開發者、企業介紹已有的模型實踐。比如華東理工大學的X-D Lab,及基于基于開源的通義千問開源模型開發了心理健康大模型MindChat(漫談)、醫療健康大模型Sunsimiao(孫思邈)、教育/考試大模型GradChat(錦鯉)等,并為下遊客戶開發基于行業大模型的産品。

目前,已經有已有超過20萬人次用過上述的大模型,X-D Lab已經累計提供了超過100萬次的問答服務。

“當我們用同樣的方法,把同樣規模的資料應用到各個開源模型,Qwen的效果比其他模型好得多。”華東理工大學·X-DLab(心動實驗室)成員顔鑫表示,團隊隻用20萬tokens的資料微調了Qwen基座模型,就獲得了比另一家用百萬級資料微調的模型更好的效果。

阿裡雲還釋出了一款參數量更小的大模型——Qwen-1.8B。這是一款專為端側設計的模型,推理2K長度文本内容僅需3G顯存,可跑在消費級終端上——比如手機、電腦等。

如今算力緊缺,大模型的訓練和推理成本都居高不下,超大規模參數的大模型隻能在雲上部署。為了能讓大模型可以跑在更多終端上,近期包括大模型、手機、電腦等廠商都在探索更小尺寸規模的模型。

最直接的效果就是,1.8B體量的大模型,就能離線在手機、電腦等終端上運作。阿裡雲CTO周靖人在會後專訪中表示,對文檔、圖像等輕度處理的工作,1.8B體量的模型已經完全能夠勝任。

另外,阿裡雲也首次開源了音頻了解大模型Qwen-Audio,這是在多模态領域的一次探索。

Qwen-Audio能夠感覺和了解人聲、自然聲、動物聲、音樂聲等各類語音信号。使用者可以輸入一段音頻,要求模型給出對音頻的了解,甚至基于音頻進行文學創作、邏輯推理、故事續寫等等。音頻了解能夠賦予大模型接近人類的聽覺能力。

簡單來說,現在通義千問不僅能“看”,也能“聽”了,而且更加耳聰目明。此前8月,通義千問就開源了視覺了解大模型Qwen-VL,這次釋出中也有不少提升:通用OCR、視覺推理、中文文本了解基礎能力都有更新,還能處理各種分辨率和規格的圖像,還能“看圖做題”。

通義千問再放大招:720億大模型開源,全尺寸趕上LLaMA-2,還有移動端可用的18億模型

△通義千問開源大模型家族

可以說,本次釋出模型,對應着三個定位:72B意在對标頂尖開源模型;1.8B則是消費側落地的探索;而Qwen-Audio則是多模态的新探索——這是未來的重要方向。

目前,阿裡雲的大模型社群“魔搭”已經有超過150萬的模型下載下傳量。使用者可在魔搭社群直接體驗Qwen系列模型效果,也可通過阿裡雲靈積平台調用模型API,用阿裡雲百煉平台、阿裡雲人工智能平台PAI也可以輔助使用者定制大模型應用和深度适配,阿裡雲也配有輕量級微調、全參數微調、分布式訓練、離線推理驗證、線上服務等多種功能。

繼續閱讀