通義千問再放大招：720億大模型開源，全尺寸趕上LLaMA-2，還有移動端可用的18億模型

時隔一個月，通義千問又放大招了！

在一個月前的阿裡雲栖大會上，阿裡正式釋出通義千問2.0版本，在複雜指令了解、文學創作、通用數學、知識記憶、幻覺抵禦等能力上，都有較大提升。并且，阿裡雲還釋出了包括程式設計、AI閱讀、音視訊轉錄、AI角色生成等八大産品模型。

當時，阿裡雲就已經預告，接下來還要再發更大規模的開源模型。

12月1日，三款新模型如約而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型，通義千問大模型也更新到了2.1版本。

最受矚目的首先是Qwen-72B，參數達到720億，基于3T tokens的高品質資料訓練。阿裡雲表示，Qwen-72B在10個權威基準測評中奪得開源模型最優成績，在部分測評中超越閉源的GPT-3.5和GPT-4。

通義千問再放大招：720億大模型開源，全尺寸趕上LLaMA-2，還有移動端可用的18億模型

△來源：阿裡雲

具體來說，在英語任務上，Qwen-72B在MMLU基準測試取得開源模型最高分；中文任務上，Qwen-72B在C-Eval、CMMLU、GaokaoBench等基準得分超越GPT-4。

而在數學推理方面，Qwen-72B在GSM8K、MATH測評中也領先其他開源模型；代碼了解方面，Qwen-72B在HumanEval、MBPP等測評中的表現大幅提升，代碼能力也有質的飛躍。

△72B模型做數學題

在複雜語義了解上，72B的能力也提高了不少，比如，現在就能夠聽懂中文裡的“潛台詞”了：

△72B模型了解“職場之道”

目前，國内外大模型都分為閉源和開源兩大路線。對标國外——OpenAI已走閉源路線，開源模型的代表則是Meta旗下的Llama。Meta在今年7月釋出了Llama 2，分别有7B（70億參數）、13B（130億參數）和70B（700億參數）三個尺寸。

阿裡雲Qwen-72B的推出，也意味着國内市場又多了一個對标Llama 2-70B的頭部開源模型。目前，通義千問的大語言模型家族已經實作全尺寸開源——包括18億、70億、140億、720億7個參數。

不同規模和尺寸的模型，意味着應用場景可以拓寬更多。比如，高達720億參數的Qwen-70B推出後，大中型企業就可以基于此可開發商業應用，高校、科研院所可利用AI來輔助科研工作——這些工作都需要複雜的運算，也依賴于模型能力邊界的不斷拓展。

阿裡雲在會上也請了不少開發者、企業介紹已有的模型實踐。比如華東理工大學的X-D Lab，及基于基于開源的通義千問開源模型開發了心理健康大模型MindChat（漫談）、醫療健康大模型Sunsimiao（孫思邈）、教育/考試大模型GradChat（錦鯉）等，并為下遊客戶開發基于行業大模型的産品。

目前，已經有已有超過20萬人次用過上述的大模型，X-D Lab已經累計提供了超過100萬次的問答服務。

“當我們用同樣的方法，把同樣規模的資料應用到各個開源模型，Qwen的效果比其他模型好得多。”華東理工大學·X-DLab（心動實驗室）成員顔鑫表示，團隊隻用20萬tokens的資料微調了Qwen基座模型，就獲得了比另一家用百萬級資料微調的模型更好的效果。

阿裡雲還釋出了一款參數量更小的大模型——Qwen-1.8B。這是一款專為端側設計的模型，推理2K長度文本内容僅需3G顯存，可跑在消費級終端上——比如手機、電腦等。

如今算力緊缺，大模型的訓練和推理成本都居高不下，超大規模參數的大模型隻能在雲上部署。為了能讓大模型可以跑在更多終端上，近期包括大模型、手機、電腦等廠商都在探索更小尺寸規模的模型。

最直接的效果就是，1.8B體量的大模型，就能離線在手機、電腦等終端上運作。阿裡雲CTO周靖人在會後專訪中表示，對文檔、圖像等輕度處理的工作，1.8B體量的模型已經完全能夠勝任。

另外，阿裡雲也首次開源了音頻了解大模型Qwen-Audio，這是在多模态領域的一次探索。

Qwen-Audio能夠感覺和了解人聲、自然聲、動物聲、音樂聲等各類語音信号。使用者可以輸入一段音頻，要求模型給出對音頻的了解，甚至基于音頻進行文學創作、邏輯推理、故事續寫等等。音頻了解能夠賦予大模型接近人類的聽覺能力。

簡單來說，現在通義千問不僅能“看”，也能“聽”了，而且更加耳聰目明。此前8月，通義千問就開源了視覺了解大模型Qwen-VL，這次釋出中也有不少提升：通用OCR、視覺推理、中文文本了解基礎能力都有更新，還能處理各種分辨率和規格的圖像，還能“看圖做題”。

△通義千問開源大模型家族

可以說，本次釋出模型，對應着三個定位：72B意在對标頂尖開源模型；1.8B則是消費側落地的探索；而Qwen-Audio則是多模态的新探索——這是未來的重要方向。

目前，阿裡雲的大模型社群“魔搭”已經有超過150萬的模型下載下傳量。使用者可在魔搭社群直接體驗Qwen系列模型效果，也可通過阿裡雲靈積平台調用模型API，用阿裡雲百煉平台、阿裡雲人工智能平台PAI也可以輔助使用者定制大模型應用和深度适配，阿裡雲也配有輕量級微調、全參數微調、分布式訓練、離線推理驗證、線上服務等多種功能。

通義千問再放大招：720億大模型開源，全尺寸趕上LLaMA-2，還有移動端可用的18億模型

繼續閱讀

一條吐槽中國移動服務的文章，評論高達兩萬條，中國移動這是咋了

南韓又來偷東西了！南韓漫畫将聯通logo都偷走了，笑死[我想靜靜][淚奔]是我中國移動不配嗎？怎麼不偷移動的哈哈哈哈哈。

出租房必備？無需安裝？移動空調，其實并不好用

10款國産大模型大戰弱智吧——中文了解能力測評

最全解讀MoE混合專家模型：揭秘關鍵技術與挑戰

本月見！moto X50 Ultra AI手機入網，搭載第三代骁龍8s移動平台

全面超越！開源！百度最強SOTA：基于擴散模型的3DGS！

Android篇丨震坤行移動端元件化演進之路

Flutter在震坤行移動應用的實踐之路

約1200萬移動使用者攜号轉網，移動面臨信任危機！網友：自作孽！

沖刺2024“半年紅” | 六成AI企業實作盈利增長，大模型企業賺錢了？

宮崎駿的魔法：如何通過《哈爾的移動城堡》治愈你的年齡焦慮？

近1200萬移動使用者攜号轉網，移動被大衆遺棄！網友：自作自受！

對話優必選焦繼超：大模型加速人形機器人“進廠打工”

田曦薇亮相《哈爾的移動城堡》首映，完美诠釋公主氣質！

通信巨頭之争：揭秘中國電信、移動、聯通的背後戰鬥！