天天看點

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

近年來,人工智能技術迎來了新一輪大變革,其中由OpenAI開發的ChatGPT在推出短短2個月後便成為了月活破億的應用。随着海外科技巨頭微軟、谷歌、Meta等加大投入,國内科技企業如百度、華為、阿裡等紛紛布局,人工智能大模型的發展日新月異。

新華社研究院中國企業發展研究中心于今年4月啟動了人工智能産業創新活力研究,并設定了使用者體驗項目,通過抓取5月22日—5月26日資料,以人機互動提問等形式,對國内主流大模型進行了詳細的使用體驗評測。

下面就讓我們通過資料來直覺感受一下目前主流科技企業所推出的大模型産品的現狀、優勢和特點。

主流大模型綜合指數

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

基礎能力

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

智商測試

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

情商測試

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

工作提效

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

GPT-4

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

ChatGPT

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

文心一言

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

通義千問

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

星火

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

商量

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

ChatGLM

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

Vicuna-13B

AI大模型評分出爐:文心一言1112分第三,ChatGPT僅排第二

從這一次的評測可以看出,OpenAI推出的GPT-4和ChatGPT在整體體驗上令人驚豔,但以百度文心一言為代表的國産AI大模型也在奮起直追,相信在未來的一段時間,國産AI大模型會通過不斷疊代,帶給我們更多的驚喜。

歡迎關注「新數潮」公衆号,和我們一起了解數字經濟!

一周資訊 | 北京釋出兩份政策大力支援人工智能

一周資訊 | 深圳出台人工智能行動方案 設立1000億元基金群

繼續閱讀