天天看点

清华大学自主研发的大语言模型GLM2超过了GPT4。端午节假期后,清华大学的研究人员在AI界发布了一个惊人的消息,开源了

作者:DSP道视频

清华大学自主研发的大语言模型GLM2超过了GPT4。端午节假期后,清华大学的研究人员在AI界发布了一个惊人的消息,开源了他们自主研发的第二代拆GLM大语言模型。这意味着GLM2比GPT4更擅长中文。今天,我测试了GPT、GPT3.5和GPT4,以了解它们在中文方面的表现。

第一道题是逻辑推理题。为什么爸爸妈妈的结婚照上没有我?GLM2回答说:“可能是你当时还没有出生,这个没有问题。”但是,如果第二个可能的原因是在照片中还没有成年,还没有达到拍摄结婚照的年龄呢?这有点牵强,不是很令人满意。GPT3.5和GPT4都能明确回答拍摄结婚照是在你出生之前,所以你不在场。

端午节假期后,清华大学的研究人员在AI界发布了一个惊人的消息,开源了他们自主研发的第二代拆GLM大语言模型。其中最值得关注的是,在CEVO评测中,拆GLM2超过了长期霸榜的GPT4,位列全球第一。

首先了解一下CL报,这是一套专门评价大语言模型中文能力的中文题库,包括理工类、社会类、人文类和其他类等四大类题目。

今天,我测试了GPT、GPT3.5和GPT4,以了解它们在中文方面的表现。

第一道题是逻辑推理题。为什么爸爸妈妈的结婚照上没有我?GLM2回答说:“可能是你当时还没有出生,这个没有问题。”但是,如果第二个可能的原因是在照片中还没有成年,还没有达到拍摄结婚照的年龄呢?这有点牵强,不是很令人满意。GPT3.5和GPT4都能明确回答拍摄结婚照是在你出生之前,所以你不在场。

第二道题是考察中文的常识知识,我故意问了一个有迷惑性的问题。

鲁智深为什么智取威虎山?很遗憾,三个大模型都未能识别出我这个问题里面的陷阱,全部都虚构了一个水浒传中鲁智深智取威虎山的故事,所以都不能得分。

最后一道题,我给AI的角色是一名公务员,让他以推进中国特色社会主义为主题。

清华大学自主研发的大语言模型GLM2超过了GPT4。端午节假期后,清华大学的研究人员在AI界发布了一个惊人的消息,开源了
清华大学自主研发的大语言模型GLM2超过了GPT4。端午节假期后,清华大学的研究人员在AI界发布了一个惊人的消息,开源了
清华大学自主研发的大语言模型GLM2超过了GPT4。端午节假期后,清华大学的研究人员在AI界发布了一个惊人的消息,开源了
清华大学自主研发的大语言模型GLM2超过了GPT4。端午节假期后,清华大学的研究人员在AI界发布了一个惊人的消息,开源了

继续阅读