天天看点

斯坦福研究发现GPT-4“变笨”;美团再次出手大模型 | 图灵周报

作者:思想开放的湖泊 n
图灵周报:精选AI行业一周大事件,从良莠不齐的行业资讯中挑选出最有价值的信息,配上专业点评,值得你细读、品味

01斯坦福研究证实GPT-4变笨了

斯坦福研究发现GPT-4“变笨”;美团再次出手大模型 | 图灵周报

图源:arxiv论文截图

来自斯坦福、UC Berkeley 的一项研究比较了六月份和三月份的GPT-4版本在解决数学问题和生成代码等任务时的表现,结果显示准确率急剧下降,解决数学问题的成功率从97.6%降到了2.4%,生成代码的成功率从52%降到了10%。

点评:近期有不少用户抱怨GPT-4的回答质量大幅下降,这份最新研究为这些抱怨提供了数据依据。而OpenAI也承认:GPT-4确实在某些任务上的性能变差了。

02Meta推出首个开源大模型商业版本

斯坦福研究发现GPT-4“变笨”;美团再次出手大模型 | 图灵周报

图源:unsplash

7月18日,Facebook母公司Meta在其官网上宣布开源下一代AI大语言模型 Llama 2,并将其技术免费用于研究和商业用途。即日起,人们可以直接下载 Llama 2的模型系列(包括 Llama 2 和 Llama 2-Chat),也可以通过微软云平台 Azure、亚马逊网络服务(AWS)和 Hugging Face 等平台使用。

点评:Llama 2将通过微软云Azure分发,并将在Windows操作系统上运行。微软是OpenAI的最大支持者,并一直致力于在Azure中提供OpenAI技术。一边是一马当先的OpenAI的支持者,另一边是积极探索商用的合作方。在这波的人工智能浪潮中,微软应该算是绝对的赢家了。

03美国科技巨头承诺为人工智能生成内容“打水印”

斯坦福研究发现GPT-4“变笨”;美团再次出手大模型 | 图灵周报

图源:Pexels

当地时间21号,美国白宫发布公告称,已与大型科技公司达成协议,将为人工智能的开发设置更多“护栏”,包括开发水印系统等,以防范虚假信息的传播和其他风险。这些公司还承诺,随着人工智能技术的发展,它们将重点保护用户隐私,并确保该技术不带偏见,不会被用于歧视弱势群体。

点评:伴随着ChatGPT的爆火,AI安全和隐私保护也逐渐引发关注。不论是美国、中国,还是欧洲,在这一次由ChatGPT所引发的人工智能技术面前,都在快速的思考与响应,借助于立法来规范与确保这项技术能够更好的服务于人类社会。

04“科学探索奖”2023年获奖名单公布

斯坦福研究发现GPT-4“变笨”;美团再次出手大模型 | 图灵周报

图源:科学探索奖公众号

7月17日,第五届“科学探索奖”获奖名单正式揭晓,48位青年科学家榜上有名。“科学探索奖”面向基础科学和前沿技术十个领域,支持在中国内地及港澳地区全职工作、45周岁及以下的杰出青年科学家,每位获奖人将在5年内获得总计300万元人民币奖金,并且可以自由支配奖金的使用。

点评:随着新一届获奖名单揭晓,“科学探索奖”5年共资助248位青年科学家。“科学探索奖”设立于2018年。由杨振宁、饶毅、施一公、潘建伟、谢晓亮等14位知名科学家,与腾讯基金会发起人马化腾共同发起。这是一项由新基石科学基金会出资、科学家主导的公益奖项,也是目前国内金额最高的青年科技人才资助项目之一。奖项秉持“面向未来、奖励潜力、鼓励探索”的宗旨,鼓励青年科技人才探索科学“无人区”,探索社会支持基础研究人才持续稳定的投入机制。

05美团入股大模型公司智谱AI

斯坦福研究发现GPT-4“变笨”;美团再次出手大模型 | 图灵周报

图源:美团

天眼查App显示,近日,中文认知大模型平台智谱AI关联公司北京智谱华章科技有限公司发生工商变更,股东新增美团旗下天津三快科技有限公司,注册资本由约1480.69万人民币增至约1652.86万人民币。

点评:这也是近期少有的一笔数额破亿美金的融资。此前拿到融资的AI创业公司,数额大都在百亿、千亿美金级别,能够拿出自研模型的几家距离亿元俱乐部仍有一步之遥。能拿到上亿美金的创业公司,需要兼具顶级团队和自研大模型的技术,且有成功的落地经验——而这样的公司,国内目前一只手都数得过来。牵手智谱,美团则是给自己找到了一个技术和业务更为成熟的盟友。

06微软清华提出媲美Transformer的新架构

斯坦福研究发现GPT-4“变笨”;美团再次出手大模型 | 图灵周报

图源:论文截图

来自微软研究院、清华大学的研究人员7月17日发表一篇论文,提出retentive网络(RetNet)。RetNet同时实现了低成本推理、高效长序列建模、媲美Transformer的性能和并行模型训练,打破了“不可能三角”。

点评:RetNet的推理延迟对批大小不敏感,从而实现了巨大的吞吐量。不少研究者惊呼“好得不可思议”,甚至有人将其比作“M1芯片”登场时的变革意义。也有研究者提出疑问:这么优秀的表现是否意味着RetNet要在某些方面有所权衡,以及它能否扩展到视觉领域。