清华大学自主研发的大语言模型GLM2超过了GPT4。端午节假期后，清华大学的研究人员在AI界发布了一个惊人的消息，开源了

作者：DSP道视频 2023-06-29 12:30:00

清华大学自主研发的大语言模型GLM2超过了GPT4。端午节假期后，清华大学的研究人员在AI界发布了一个惊人的消息，开源了他们自主研发的第二代拆GLM大语言模型。这意味着GLM2比GPT4更擅长中文。今天，我测试了GPT、GPT3.5和GPT4，以了解它们在中文方面的表现。

第一道题是逻辑推理题。为什么爸爸妈妈的结婚照上没有我？GLM2回答说：“可能是你当时还没有出生，这个没有问题。”但是，如果第二个可能的原因是在照片中还没有成年，还没有达到拍摄结婚照的年龄呢？这有点牵强，不是很令人满意。GPT3.5和GPT4都能明确回答拍摄结婚照是在你出生之前，所以你不在场。

端午节假期后，清华大学的研究人员在AI界发布了一个惊人的消息，开源了他们自主研发的第二代拆GLM大语言模型。其中最值得关注的是，在CEVO评测中，拆GLM2超过了长期霸榜的GPT4，位列全球第一。

首先了解一下CL报，这是一套专门评价大语言模型中文能力的中文题库，包括理工类、社会类、人文类和其他类等四大类题目。

今天，我测试了GPT、GPT3.5和GPT4，以了解它们在中文方面的表现。

第二道题是考察中文的常识知识，我故意问了一个有迷惑性的问题。

鲁智深为什么智取威虎山？很遗憾，三个大模型都未能识别出我这个问题里面的陷阱，全部都虚构了一个水浒传中鲁智深智取威虎山的故事，所以都不能得分。

最后一道题，我给AI的角色是一名公务员，让他以推进中国特色社会主义为主题。

继续阅读