大模型评测:对比人类答案,AI差异一览
新华社研究院
国内大模型整体评测2.0
综合指数排名:
讯飞-星火
百度-文心一言
商汤-商量
智谱-ChatGLM
360-360智脑
昆仑万维-天工
阿里-通义千问
澜舟科技-Mchat
细分维度指数评述:
基础能力:文心一言在基础能力方面表现最为抢眼。
智商能力:讯飞星火和智谱AI-ChatGLM并列第一。
情商能力:商汤商量、文心一言、澜舟科技Mchat、智谱AI-ChatGLM表现优良。
工具提效能力:讯飞星火表现最为突出。
#人工智能##aigc##大模型##涨知识##职场干货#