大模型評測:對比人類答案,AI差異一覽
新華社研究院
國内大模型整體評測2.0
綜合指數排名:
訊飛-星火
百度-文心一言
商湯-商量
智譜-ChatGLM
360-360智腦
昆侖萬維-天工
阿裡-通義千問
瀾舟科技-Mchat
細分次元指數評述:
基礎能力:文心一言在基礎能力方面表現最為搶眼。
智商能力:訊飛星火和智譜AI-ChatGLM并列第一。
情商能力:商湯商量、文心一言、瀾舟科技Mchat、智譜AI-ChatGLM表現優良。
工具提效能力:訊飛星火表現最為突出。
#人工智能##aigc##大模型##漲知識##職場幹貨#