AI大模型評分出爐：文心一言1112分第三，ChatGPT僅排第二

2023-06-19 10:23:00

近年來，人工智能技術迎來了新一輪大變革，其中由OpenAI開發的ChatGPT在推出短短2個月後便成為了月活破億的應用。随着海外科技巨頭微軟、谷歌、Meta等加大投入，國内科技企業如百度、華為、阿裡等紛紛布局，人工智能大模型的發展日新月異。

新華社研究院中國企業發展研究中心于今年4月啟動了人工智能産業創新活力研究，并設定了使用者體驗項目，通過抓取5月22日—5月26日資料，以人機互動提問等形式，對國内主流大模型進行了詳細的使用體驗評測。

下面就讓我們通過資料來直覺感受一下目前主流科技企業所推出的大模型産品的現狀、優勢和特點。

主流大模型綜合指數

基礎能力

智商測試

情商測試

工作提效

GPT-4

ChatGPT

文心一言

通義千問

星火

商量

ChatGLM

Vicuna-13B

從這一次的評測可以看出，OpenAI推出的GPT-4和ChatGPT在整體體驗上令人驚豔，但以百度文心一言為代表的國産AI大模型也在奮起直追，相信在未來的一段時間，國産AI大模型會通過不斷疊代，帶給我們更多的驚喜。

歡迎關注「新數潮」公衆号，和我們一起了解數字經濟！

一周資訊 | 北京釋出兩份政策大力支援人工智能

一周資訊 | 深圳出台人工智能行動方案設立1000億元基金群

AI大模型評分出爐：文心一言1112分第三，ChatGPT僅排第二

主流大模型綜合指數

基礎能力

智商測試

情商測試

工作提效

GPT-4

ChatGPT

文心一言

通義千問

星火

商量

ChatGLM

Vicuna-13B

繼續閱讀

OpenAI推出ChatGPT全新界面canvas 寫作編碼更高效 AI協作新紀元！

楊順｜ChatGPT等生成式人工智能對學術誠信的挑戰及應對

AI日報：海螺AI上線圖生視訊功能；天工AI搜尋新增彩頁，還打算帶你賺錢；ChatGPT新版灰測

ChatGPT幕後大佬、o1推理模型作者官宣離職！OpenAI大洗牌

諾貝爾文學獎要頒給ChatGPT？奧特曼得獎呼聲高，Hinton怒斥不配

看完諾貝爾化學獎，我開始幻想ChatGPT能拿文學獎

ChatGPT新能力要做Copilot？

諾貝爾實體學獎頒給AI大佬引熱議，生成式AI之父怒斥：他們不配拿獎！網友：ChatGPT有望拿文學獎？

ChatGPT預測：2026年梅西蟬聯世界杯，2034年姆巴佩有望再奪一冠

ChatGPT聯合大資料分析中國胚胎幹細胞的研究熱點

特斯拉的ChatGPT時刻來了？

38歲老Mac“複工”，被改造上網！僅400B/s的速度，能和ChatGPT聊天、用Claude編碼

李開複回應AI六小虎困境：有資金訓練模型，融資、晶片都不是問題；阿裡稱新AI翻譯工具擊敗谷歌和ChatGPT丨AI情報局

ChatGPT背後的AI背景、技術門道和商業應用(萬字長文，建議收藏)

AI日報：複旦、百度新模型可生成1小時長視訊；全新ChatGPT Windows版本上線；NotebookLM又上2個新功能

京東金融回應擠兌傳聞；餘承東談FSD入華；ChatGPT登陸Windows | 晚報