天天看點

盤點國内大模型現狀

作者:智投運籌帷幄

12月23日,國内首個官方“大模型标準符合性評測”結果公布,該測試由工信部中國電子技術标準化研究院發起,據了解,首批僅360、百度、騰訊、阿裡通過。

國内大模型發展,從2月開始,不過10個月,衆多模型已經公測。

盤點國内大模型現狀

1.百度--文心一言

1)2023 年 8 月 31 日,文心一言率先向全社會全面開放。

2)底層 AI 晶片:昆侖晶片,前身為百度智能晶片及架構部門, 後 2021 年完成獨立融資,目前有昆侖芯 1/2 兩代量産産品。

3)深度學習架構:飛槳平台,集核心架構、 基礎模型庫、端到端開發套件于一體。飛槳平台開發者數已達 800 萬、模型數超 80 萬。

4)9 月 1 日,文心一言插件生态“靈境矩陣”開啟内測邀請,首批已有近百家企業入駐,如攜程、WPSAI、 愛奇藝、汽車之家、貓眼電影、懂球帝等。

5)文心一言 PC 端已正式開放 3 個插件,為說圖解圖(基于圖檔進行文字創作)、E 言易圖(基于資料提供洞察及圖表制作)、覽卷文檔(基于文檔的摘要與問答)。

2. 科大訊飛--星火認知2.0

1)2023 年 8 月 15 日,科大訊飛釋出星火認知大模型 2.0 版本。

2)大模型同步到多個産品和業務中,包括iFlycode 智能程式設計助手、訊飛星火語伴 2.0、星火教師助手等。

3)星火大模型 2.0 提升了代碼編寫過程中代碼生成、代碼補全、代碼糾錯和單元測試生成功能。

4)程式設計助手iFlyCode1.0, 根據訊飛内部研發效能平台對 2000 餘名員工在 1 個月内測試使用iFlyCode1.0 的成效資料統計,代碼采納率達 30%,編碼效率提升 30%,綜合效率提升15%。

3.360--智腦大模型4.0

1)6月13日,360集團正式召開“360智腦大模型”應用釋出會。

2)360 智腦是全國首個原生安全的大模型,官方聲稱其擁有自研千億參數規模,核心能力位居國内第一梯隊。該大模型預訓練超萬億 tokens,具備生成創作、多輪對話、邏輯推理等十大核心能力、數百項細分功能,能夠覆寫大模型應用的所有場景。

3)基于 360 智腦的企業級垂直大模型,已在金融、醫療、教育等近 20 個行業陸續落地。

4)360 智腦為上網體驗引入更強的智能助手,可一鍵對浏覽網頁進行總結摘要、翻譯、改寫,結合圖形化效率工具。

5)大模型數字人結合 360 搜尋多年積累的垂直知識庫,可智能優化使用者輸入 prompt,識别使用者意圖,AI 問答生成結果更加專業、優質。

盤點國内大模型現狀

4.阿裡--通義千問

1)2022 年 9 月,阿裡釋出最新“通義”大模型系列。

2)通用模型層包含通義-M6、通義-AliceMind 和通義- CV 三類模型,覆寫多模态、自然語言處理、計算機視覺,專業模型層深入電商、醫療、法律、金融、 娛樂等行業。

3)阿裡内部,阿裡所有産品将接入通義千問大模型全面更新。目前, 釘釘、天貓精靈等産品已接入通義千問測試。

4)對于開發者和企業,通義提供多種模型接入和調入方式,基于靈駿平台,其支援各種模型一鍵部署雲上服務,靈活 API 調用、支援模型微調和定制化。

5.騰訊--混元大模型

1)2023 年 9 月 15 日,騰訊混元大模型首批通過備案。

2)騰訊混元大模型是由騰訊全鍊路自研的實用級大模型,擁有超千億參數規模、預訓練語料超 2 萬億 tokens,已深度應用到多個業務場景中,包括騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、 騰訊文檔、微信搜一搜、QQ 浏覽器等在内的超百個業務和産品,已經接入騰訊混元大模型測試。

3)混元大模型背靠騰訊,擁有衆多潛在的應用場景,落地的場景越多,使用者産生的商業價值、 資料也就越多,通用大模型的訓練成本及推理成本随之降低,但模型能力卻會更強,進而形成飛輪效應。

6.華為--盤古大模型

1)2023年7月7日,盤古大模型在華為開發者大會上釋出。

2)盤古3.0為客戶提供100億參數、380億參數、710億參數和1000億參數的系列化基礎大模型,比對客戶不同場景、不同時延、不同響應速度的行業多樣化需求。

3)L0層:包括自然語言、視覺、多模态、預測、科學計算五個基礎大模型,提供滿足行業場景中的多種技能需求。

4)L1層:是N個行業大模型,華為雲既可以提供使用行業公開資料訓練的行業通用大模型,包括政務,金融,制造,礦山,氣象等大模型;也可以基于行業客戶的自有資料,在盤古大模型的L0和L1層上,為客戶訓練自己的專有大模型。

5)L2層:是為客戶提供更多細化場景的模型,更加專注于某個具體的應用場景或特定業務,為客戶提供“開箱即用”的模型服務。

盤點國内大模型現狀

7.位元組跳動--豆包

1)2023 年 8 月 17 日,位元組跳動公測基于雲雀大模型開發的 AI 對話産品“豆包”,有網頁端、iOS 和安卓用戶端,預置了英語學習助手和寫作助手兩個功能。

2)雲雀大模型的定位是一個自然語言内容生成和内容了解的 AI 大模型,該模型基于位元組機器學習平台開 發,它可以通過自然語言處理技術與使用者進行對話,回答使用者的問題,提供相關的資訊和建議。

3)位元組研究團隊還曾公布一個多模态大模型的學術研究項目BuboGPT,該模型能夠處理包括文本、圖像和音頻在内的多模态輸入,即不僅可以了解圖像、音頻和文本,并将這些了解與文本輸入和輸出相結合,還可以定位和描述圖像中的物體以及聲音的來源。

4)應用場景更偏生活化,主要圍繞情感陪伴、旅行規劃、日常寫作等,應用場 景少于文心一言、訊飛星火。

5)為生成的事實性内容提供索引,提高可信度.根據使用者需求,若生成的内容對真實性要求較高,豆包會在生成結果末尾附帶引用連結,以便使用者确認資訊真實性,如專業術語、現實世界的事件或地理位置等。

8.商湯--日日新大模型

1)2023 年 4 月 10 日,商湯釋出“日日新”大模型體系。

2)商湯舉行技術交流日,釋出“日日新 SenseNova”大模型體系,展示了問答、代碼生成、2D/3D 數字人生成、3D 場景/物體生成等 AI 模型應用能力。

3)在落地場景方面,商湯語言大模型在專業文本了解、代碼生成和輔助初步醫療問診領域展現出較強的能力,生成式 AI 在電商、廣告、文旅 等領域潛力較大。

9.百川智能大模型

1)2023 年 9 月 6 日,百川智能正式釋出微調後的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 與其 4bit 量化版本,均為免費可商用的開源大模型。

2)目前在主流中英文通用榜單上,Baichuan2 性能領 先于 Meta 于 7 月 19 日釋出的 Llama2,其在中文對話了解方面表現優異,且在開源商用上更加徹底。

3)國内首發開源模型,文本能力表現較好 今年 6-8 月内,百川相繼釋出了 3 個參數級别的通用大模型,其中 70 億、130 億參數模型開源可商用, 為國内首家開源模型。

4)百川智能創始人兼CEO是王小川,曾任搜狗公司CEO。

盤點國内大模型現狀

不作為證券推薦或投資建議,旨在提供更多資訊,作者不保證其内容準确性。

繼續閱讀