斯坦福研究发现GPT-4“变笨”；美团再次出手大模型

图灵周报：精选AI行业一周大事件，从良莠不齐的行业资讯中挑选出最有价值的信息，配上专业点评，值得你细读、品味

01斯坦福研究证实GPT-4变笨了

图源：arxiv论文截图

来自斯坦福、UC Berkeley 的一项研究比较了六月份和三月份的GPT-4版本在解决数学问题和生成代码等任务时的表现，结果显示准确率急剧下降，解决数学问题的成功率从97.6%降到了2.4%，生成代码的成功率从52%降到了10%。

点评：近期有不少用户抱怨GPT-4的回答质量大幅下降，这份最新研究为这些抱怨提供了数据依据。而OpenAI也承认：GPT-4确实在某些任务上的性能变差了。

02Meta推出首个开源大模型商业版本

图源：unsplash

7月18日，Facebook母公司Meta在其官网上宣布开源下一代AI大语言模型 Llama 2，并将其技术免费用于研究和商业用途。即日起，人们可以直接下载 Llama 2的模型系列（包括 Llama 2 和 Llama 2-Chat），也可以通过微软云平台 Azure、亚马逊网络服务（AWS）和 Hugging Face 等平台使用。

点评：Llama 2将通过微软云Azure分发，并将在Windows操作系统上运行。微软是OpenAI的最大支持者，并一直致力于在Azure中提供OpenAI技术。一边是一马当先的OpenAI的支持者，另一边是积极探索商用的合作方。在这波的人工智能浪潮中，微软应该算是绝对的赢家了。

03美国科技巨头承诺为人工智能生成内容“打水印”

图源：Pexels

当地时间21号，美国白宫发布公告称，已与大型科技公司达成协议，将为人工智能的开发设置更多“护栏”，包括开发水印系统等，以防范虚假信息的传播和其他风险。这些公司还承诺，随着人工智能技术的发展，它们将重点保护用户隐私，并确保该技术不带偏见，不会被用于歧视弱势群体。

点评：伴随着ChatGPT的爆火，AI安全和隐私保护也逐渐引发关注。不论是美国、中国，还是欧洲，在这一次由ChatGPT所引发的人工智能技术面前，都在快速的思考与响应，借助于立法来规范与确保这项技术能够更好的服务于人类社会。

04“科学探索奖”2023年获奖名单公布

图源：科学探索奖公众号

7月17日，第五届“科学探索奖”获奖名单正式揭晓，48位青年科学家榜上有名。“科学探索奖”面向基础科学和前沿技术十个领域，支持在中国内地及港澳地区全职工作、45周岁及以下的杰出青年科学家，每位获奖人将在5年内获得总计300万元人民币奖金，并且可以自由支配奖金的使用。

点评：随着新一届获奖名单揭晓，“科学探索奖”5年共资助248位青年科学家。“科学探索奖”设立于2018年。由杨振宁、饶毅、施一公、潘建伟、谢晓亮等14位知名科学家，与腾讯基金会发起人马化腾共同发起。这是一项由新基石科学基金会出资、科学家主导的公益奖项，也是目前国内金额最高的青年科技人才资助项目之一。奖项秉持“面向未来、奖励潜力、鼓励探索”的宗旨，鼓励青年科技人才探索科学“无人区”，探索社会支持基础研究人才持续稳定的投入机制。

05美团入股大模型公司智谱AI

图源：美团

天眼查App显示，近日，中文认知大模型平台智谱AI关联公司北京智谱华章科技有限公司发生工商变更，股东新增美团旗下天津三快科技有限公司，注册资本由约1480.69万人民币增至约1652.86万人民币。

点评：这也是近期少有的一笔数额破亿美金的融资。此前拿到融资的AI创业公司，数额大都在百亿、千亿美金级别，能够拿出自研模型的几家距离亿元俱乐部仍有一步之遥。能拿到上亿美金的创业公司，需要兼具顶级团队和自研大模型的技术，且有成功的落地经验——而这样的公司，国内目前一只手都数得过来。牵手智谱，美团则是给自己找到了一个技术和业务更为成熟的盟友。

06微软清华提出媲美Transformer的新架构

图源:论文截图

来自微软研究院、清华大学的研究人员7月17日发表一篇论文，提出retentive网络（RetNet）。RetNet同时实现了低成本推理、高效长序列建模、媲美Transformer的性能和并行模型训练，打破了“不可能三角”。

点评：RetNet的推理延迟对批大小不敏感，从而实现了巨大的吞吐量。不少研究者惊呼“好得不可思议”，甚至有人将其比作“M1芯片”登场时的变革意义。也有研究者提出疑问：这么优秀的表现是否意味着RetNet要在某些方面有所权衡，以及它能否扩展到视觉领域。

斯坦福研究发现GPT-4“变笨”；美团再次出手大模型 | 图灵周报