盤點國内大模型現狀

12月23日，國内首個官方“大模型标準符合性評測”結果公布，該測試由工信部中國電子技術标準化研究院發起，據了解，首批僅360、百度、騰訊、阿裡通過。

國内大模型發展，從2月開始，不過10個月，衆多模型已經公測。

1.百度--文心一言

1）2023 年 8 月 31 日，文心一言率先向全社會全面開放。

2）底層 AI 晶片：昆侖晶片，前身為百度智能晶片及架構部門，後 2021 年完成獨立融資，目前有昆侖芯 1/2 兩代量産産品。

3）深度學習架構：飛槳平台，集核心架構、基礎模型庫、端到端開發套件于一體。飛槳平台開發者數已達 800 萬、模型數超 80 萬。

4）9 月 1 日，文心一言插件生态“靈境矩陣”開啟内測邀請，首批已有近百家企業入駐，如攜程、WPSAI、愛奇藝、汽車之家、貓眼電影、懂球帝等。

5）文心一言 PC 端已正式開放 3 個插件，為說圖解圖（基于圖檔進行文字創作）、E 言易圖（基于資料提供洞察及圖表制作）、覽卷文檔（基于文檔的摘要與問答）。

2. 科大訊飛--星火認知2.0

1）2023 年 8 月 15 日，科大訊飛釋出星火認知大模型 2.0 版本。

2）大模型同步到多個産品和業務中，包括iFlycode 智能程式設計助手、訊飛星火語伴 2.0、星火教師助手等。

3）星火大模型 2.0 提升了代碼編寫過程中代碼生成、代碼補全、代碼糾錯和單元測試生成功能。

4）程式設計助手iFlyCode1.0，根據訊飛内部研發效能平台對 2000 餘名員工在 1 個月内測試使用iFlyCode1.0 的成效資料統計，代碼采納率達 30%，編碼效率提升 30%，綜合效率提升15%。

3.360--智腦大模型4.0

1)6月13日，360集團正式召開“360智腦大模型”應用釋出會。

2）360 智腦是全國首個原生安全的大模型，官方聲稱其擁有自研千億參數規模，核心能力位居國内第一梯隊。該大模型預訓練超萬億 tokens，具備生成創作、多輪對話、邏輯推理等十大核心能力、數百項細分功能，能夠覆寫大模型應用的所有場景。

3）基于 360 智腦的企業級垂直大模型，已在金融、醫療、教育等近 20 個行業陸續落地。

4）360 智腦為上網體驗引入更強的智能助手，可一鍵對浏覽網頁進行總結摘要、翻譯、改寫，結合圖形化效率工具。

5）大模型數字人結合 360 搜尋多年積累的垂直知識庫，可智能優化使用者輸入 prompt，識别使用者意圖，AI 問答生成結果更加專業、優質。

4.阿裡--通義千問

1）2022 年 9 月，阿裡釋出最新“通義”大模型系列。

2）通用模型層包含通義-M6、通義-AliceMind 和通義- CV 三類模型，覆寫多模态、自然語言處理、計算機視覺，專業模型層深入電商、醫療、法律、金融、娛樂等行業。

3）阿裡内部，阿裡所有産品将接入通義千問大模型全面更新。目前，釘釘、天貓精靈等産品已接入通義千問測試。

4）對于開發者和企業，通義提供多種模型接入和調入方式，基于靈駿平台，其支援各種模型一鍵部署雲上服務，靈活 API 調用、支援模型微調和定制化。

5.騰訊--混元大模型

1）2023 年 9 月 15 日，騰訊混元大模型首批通過備案。

2）騰訊混元大模型是由騰訊全鍊路自研的實用級大模型，擁有超千億參數規模、預訓練語料超 2 萬億 tokens，已深度應用到多個業務場景中，包括騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ 浏覽器等在内的超百個業務和産品，已經接入騰訊混元大模型測試。

3）混元大模型背靠騰訊，擁有衆多潛在的應用場景，落地的場景越多，使用者産生的商業價值、資料也就越多，通用大模型的訓練成本及推理成本随之降低，但模型能力卻會更強，進而形成飛輪效應。

6.華為--盤古大模型

1）2023年7月7日，盤古大模型在華為開發者大會上釋出。

2）盤古3.0為客戶提供100億參數、380億參數、710億參數和1000億參數的系列化基礎大模型，比對客戶不同場景、不同時延、不同響應速度的行業多樣化需求。

3）L0層：包括自然語言、視覺、多模态、預測、科學計算五個基礎大模型，提供滿足行業場景中的多種技能需求。

4）L1層：是N個行業大模型，華為雲既可以提供使用行業公開資料訓練的行業通用大模型，包括政務，金融，制造，礦山，氣象等大模型；也可以基于行業客戶的自有資料，在盤古大模型的L0和L1層上，為客戶訓練自己的專有大模型。

5）L2層：是為客戶提供更多細化場景的模型，更加專注于某個具體的應用場景或特定業務，為客戶提供“開箱即用”的模型服務。

7.位元組跳動--豆包

1）2023 年 8 月 17 日，位元組跳動公測基于雲雀大模型開發的 AI 對話産品“豆包”，有網頁端、iOS 和安卓用戶端，預置了英語學習助手和寫作助手兩個功能。

2）雲雀大模型的定位是一個自然語言内容生成和内容了解的 AI 大模型，該模型基于位元組機器學習平台開發，它可以通過自然語言處理技術與使用者進行對話，回答使用者的問題，提供相關的資訊和建議。

3）位元組研究團隊還曾公布一個多模态大模型的學術研究項目BuboGPT，該模型能夠處理包括文本、圖像和音頻在内的多模态輸入，即不僅可以了解圖像、音頻和文本，并将這些了解與文本輸入和輸出相結合，還可以定位和描述圖像中的物體以及聲音的來源。

4）應用場景更偏生活化，主要圍繞情感陪伴、旅行規劃、日常寫作等，應用場景少于文心一言、訊飛星火。

5）為生成的事實性内容提供索引，提高可信度.根據使用者需求，若生成的内容對真實性要求較高，豆包會在生成結果末尾附帶引用連結，以便使用者确認資訊真實性，如專業術語、現實世界的事件或地理位置等。

8.商湯--日日新大模型

1）2023 年 4 月 10 日，商湯釋出“日日新”大模型體系。

2）商湯舉行技術交流日，釋出“日日新 SenseNova”大模型體系，展示了問答、代碼生成、2D/3D 數字人生成、3D 場景/物體生成等 AI 模型應用能力。

3）在落地場景方面，商湯語言大模型在專業文本了解、代碼生成和輔助初步醫療問診領域展現出較強的能力，生成式 AI 在電商、廣告、文旅等領域潛力較大。

9.百川智能大模型

1）2023 年 9 月 6 日，百川智能正式釋出微調後的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 與其 4bit 量化版本，均為免費可商用的開源大模型。

2）目前在主流中英文通用榜單上，Baichuan2 性能領先于 Meta 于 7 月 19 日釋出的 Llama2，其在中文對話了解方面表現優異，且在開源商用上更加徹底。

3）國内首發開源模型，文本能力表現較好今年 6-8 月内，百川相繼釋出了 3 個參數級别的通用大模型，其中 70 億、130 億參數模型開源可商用，為國内首家開源模型。

4）百川智能創始人兼CEO是王小川，曾任搜狗公司CEO。

不作為證券推薦或投資建議，旨在提供更多資訊，作者不保證其内容準确性。

盤點國内大模型現狀

繼續閱讀

CNCC | 大模型下的多模态情感計算未來

“伏羲慧眼”大模型重磅釋出！擁有全球規模最大的眼科圖像資料庫

新車 | AI大模型上車，13項新增/27項優化，極氪009光輝OTA更新

AI日報：複旦、百度新模型可生成1小時長視訊；全新ChatGPT Windows版本上線；NotebookLM又上2個新功能

測繪通報 | 任萍：基于LOD1城市模型的噪聲資料可視化

終端AI分級标準落地，手機大模型“戰火”燒到了智能體

J Clin Invest丨楊偉莉/李世華/李曉江團隊利用猴模型揭示帕金森疾病新病理機制

大模型訓練遭投毒損失千萬美元？Anthropic發現LLM代碼庫暗藏bug

全市近千名青少年齊聚中海博，在航海、航空、建築三大模型競賽中一展身手

DeepMind聯合MIT開發Fluid，讓自回歸模型實作文生圖的大規模擴充

AI周報 | 位元組跳動大模型訓練被“投毒”；微軟将終止中國個人Azure OpenAI服務

位元組跳動回應大模型訓練被實習生攻擊：已被辭退，不影響線上業務

中醫藥領域卷出多個大模型，“AI老中醫”來了？

出手即王炸？照片級真實度生成式世界模型，還獲得皮克斯投資

騰訊、華為等接入DeepSeek每月虧損超4億，MaaS模型即服務将要被颠覆了？｜钛媒體AGI

性趣機器人意外獲大模型賦能，成人用品概念股集體上漲，逆天了？