机器人“接管”亚运会，AI算力70年增长6.8亿

本周热点

1、机器人“接管”亚运会

2、AI算力70年增长6.8亿倍，未来AI各方面能力将全面超越人类

3、研究称GPT-4审稿意见与人类评审一致性超50%

4、GPT-4V亮相：支持图片和语音输入

5、Meta发布Llama 2 Long，支持3.2万Tokens

6、百度发布首个量子领域大模型及两大AI原生应用

大家好，欢迎来到我们的人工智能一周热点推文！在这里，我们将为您呈现最前沿、最热门的人工智能资讯，涵盖了机器学习、深度学习、自然语言处理等多个领域。我们的目标是让您能够及时了解人工智能领域的最新动态，掌握行业发展趋势，为自己的职业发展和科技创新提供有益的参考。欢迎点赞关注与分享，让我们携手共进，探索人工智能的无限可能！

人工智能行业动态

1、机器人“接管”亚运会

第19届亚运会在杭州举办，约1.2万名运动员和数千名媒体人员、技术官员齐聚杭城。从自动灭蚊器到仿真机器人钢琴师和无人驾驶冰淇淋车，机器接管世界——至少是在中国举行的亚运会上。杭州是中国科技行业重镇，机器人和其他令人大开眼界的装置将为访客提供服务、娱乐和安保。

人工智能研究动态

1、AI算力70年增长6.8亿倍

AI算力70年增长6.8亿倍，未来AI各方面能力将全面超越人类。电子计算机诞生后的10年内，人类历史上的第一个AI应用就出现了。70多年过去了，AI模型现在不仅能写诗，还能根据文本提示生成图像，甚至是帮助人类发现未知的蛋白质结构。计算能力、可用的训练数据和算法是AI进步的三大要素。AI发展的三个时代分别是：人工学习时代、深度学习时代和大规模AI模型时代。未来AI技术的进展将取决于计算能力和可用数据的增长。AI行业的初创公司融资规模达到了140亿美元，生成式AI领域的发展势头良好。

2、研究称GPT-4审稿意见与人类评审一致性超50%

斯坦福大学等机构的研究者发布论文称，GPT-4对于Nature、ICLR等顶会的近5000篇论文给出的审稿意见与人类审稿人的意见有超过50%的相似性，且超过82.4%的作者表示，GPT-4给出的意见相当有帮助。论文作者James Zou总结道：我们仍然需要高质量的人工反馈，但LLM可以帮助作者在正式的同行评审之前，改进自己的论文初稿。

3、中美多家机构联合发布大模型可解释性技术综述

中美多家机构（新泽西理工学院、约翰斯·霍普金斯大学、维克森林大学、佐治亚大学、上海交大、百度等）联合发布了大模型可解释性技术的综述，分别对传统的Fine-tuning模型和基于Prompting的超大模型的可解释性技术进行了全面的梳理，并探讨了模型解释的评估标准和未来的研究挑战。

4、斯坦福等开源高效内存管理机制PagedAttention

来自加州大学伯克利分校、斯坦福大学、加州大学圣迭戈分校的研究人员基于操作系统中经典的虚拟内存和分页技术，提出了一个新的注意力算法PagedAttention，并打造了一个LLM服务系统vLLM。据介绍，vLLM在KV缓存上实现了几乎零浪费，并且可以在“请求内部”和“请求之间”灵活共享KV高速缓存，进一步减少了内存的使用量。评估结果表明，vLLM可以将常用的LLM吞吐量提高了2-4倍，在延迟水平上与最先进的系统（如FasterTransformer和Orca）相当，并且在更长序列、更大模型和更复杂的解码算法时，提升更明显。

5、研究团队提出提升开源数学模型的推理能力的新方法

来自滑铁卢大学和俄亥俄州立大学的研究团队提出了一种新的数学指令微调方法，可以增强开源数学模型的推理能力。他们创建了一个多样化的混合指令微调数据集MathInstruct，涵盖了不同的数学领域和复杂程度，并将思维链和思维程序两种方法结合起来。通过在MathInstruct上微调，他们得到了不同大小的模型，并发现这些新模型在领域外数据集上的性能优于之前的模型。这项研究为提升开源数学模型的能力提供了新的思路。

6、中国研究人员推出名为“FreeMan”的大规模真实多视角数据集

中国研究人员推出了一种名为“FreeMan”的新型大规模多视角数据集，旨在解决现有数据集在真实场景下进行3D人体姿势估计时的限制。该数据集包含8000个序列的1100万帧，使用8台同步智能手机在各种场景下拍摄。研究人员通过自动化注释流程生成了精确的3D注释，该数据集对于多个任务具有价值，包括单目3D估计、2D到3D转换、多视角3D估计和人体主题的神经渲染。研究人员还通过与现有数据集的比较，展示了FreeMan在真实场景中的优越泛化能力。这一研究成果有望推动人体建模、计算机视觉和人机交互领域的进展，弥合了受控实验室条件和真实场景之间的差距。

人工智能企业动态

1、GPT-4V亮相：支持图片和语音输入

OpenAI宣布推出新版ChatGPT，增加了两项新功能：语音输入和图像输入。使用语音输入功能时，用户只需按下一个按钮，说出自己的问题，ChatGPT就会将其转换为文本，然后生成答案，再将答案转换为语音，播放给用户。使用图像输入功能时，用户可以拍摄自己感兴趣的事物，并上传到ChatGPT中。ChatGPT会尝试识别用户想要询问的内容，并给出相应的回答。用户还可以用应用中的绘图工具来帮助表达自己的问题，或者配合语音或文本输入来进行交流。

2、Meta发布Llama 2 Long，支持3.2万Tokens

Meta发布Llama 2 Long，上下文长度达3.2万Tokens，与GPT-4持平。性能上全面超越Llama 2，在指令微调MMLU（5-shot）等测试集上表现超过ChatGPT，在人类评估上优于10万Tokens的Claude 2。据介绍，与Llama 2相比，Llama 2 Long的变化主要有两个方面。一是训练参数上，采用了高达4000亿Tokens的数据源，而Llama 2最多的版本也只有700亿。二是架构上，与Llama 2保持不变，但对位置编码进行了一个非常小的必要修改，以此完成高达3.2亿Tokens的上下文窗口支持。

3、阿里云通义千问140亿参数Qwen-14B发布

阿里云举办通义千问开源发布会，正式发布通义千问140亿参数模型Qwen-14B及对话模型Qwen-14B-Chat，开源、免费。据介绍，Qwen-14B在众多同尺寸20B以内开源模型中突出重围，在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评集上都取得了最优成绩，超越所有测评中的SOTA大模型。此外，通义千问团队升级了Qwen模型对接外部系统的能力，开发者可以通过简单的操作实现复杂的插件调用，也可以基于Qwen系列基座模型快速开发Agent等AI系统，利用Qwen的理解和规划能力完成复杂的任务。同时，Qwen-7B也实现了全面升级，核心指标最高提升22.5%。

4、百川智能发布Baichuan2-53B闭源大模型

百川智能发布Baichuan2-53B闭源大模型，全面升级了Baichuan1-53B的各项能力。据介绍，Baichuan2-53B的数学和逻辑推理能力显著提升，并通过高质量数据体系和搜索增强大幅降低了模型幻觉，是目前国内幻觉问题最低的大模型。百川智能此次还开放了Baichuan2-53B API接口，宣布正式进军To B领域。

5、开源可商用的中文版Llama 2发布

现在，15小时、几千块钱、85亿Tokens数据，即可训出中文版Llama 2。Colossal-LLaMA-2近期把大模型门槛打下来了，同时开源团队还提供了一个完整的评估体系框架ColossalEval，以实现低成本的可复现性。这一模型综合性能达到开源社区同规模从头预训练SOTA模型水平。方案完全开源，包括全套训练流程、代码及权重；而且无商业限制，还可迁移应用到任意垂类领域和从头预训练大模型的低成本构建。

6、恒生电子大模型LightGPT开启内测

恒生大模型产品已面向20家金融机构开启内测。据悉，恒生金融行业大模型LightGPT是专为金融领域打造的大语言模型，它通过训练海量金融数据，对金融相关问题有更好的理解能力。光子是基于LightGPT的智能应用服务，可以为金融机构的各个业务系统注入AI能力，包括投资合规、投顾、客服、运营、投研和交易等。

7、百度发布首个量子领域大模型及两大AI原生应用

2023量子产业大会在安徽合肥召开。会上，百度量子计算研究所所长段润尧发布首个量子领域大模型，及百度量子助手和量子写作助手两大AI原生应用。他还发布了量子领域大模型白皮书，展望量子领域大模型的未来发展趋势和技术潜力。据段润尧介绍，该量子领域大模型是在文心一言基础上，使用量子领域高质量数据进行更有针对性的训练和优化而构建的量子领域大模型，能更好地理解量子知识，专业执行量子任务。

8、中国电信发布“启明”网络大模型

中国电信网络大模型技术研讨论坛在北京召开。论坛上，中国电信发布信息通信领域首个网络大模型“启明”。据介绍，该模型系中国电信自主研发，目前已在企业内部成熟应用。中国电信将在基础研究、算力环境、应用部署等重要环节联合攻坚，提供多种形式的MaaS服务，重点推动基础通用大模型向垂直行业大模型的纵深演进，为上层行业应用开发和开源生态提供技术支撑。

9、电力行业首个自主可控电力大模型发布

由南方电网公司主办的电力行业人工智能创新平台及自主可控电力大模型发布会在广州召开。会上，南方电网公司发布了自主研发的电力行业人工智能创新平台，以及电力行业首个自主可控电力大模型。据介绍，本次发布的人工智能平台，既提供模型即服务（MaaS）解决方案，也支持模型快速迭代开发，并向全社会开放共享，平台建设有算力中心、样本中心、模型中心，一体集成并能灵活调度华为、百度、商汤等算力资源，全面支持多种主流深度学习框架，能够实现按需调用算力资源和快速微调。

10、商汤科技49篇论文入选ICCV 2023

国际人工智能顶级国际会议ICCV（International Conference on Computer Vision）在法国巴黎举行。本届ICCV投稿总数达8068篇，其中2160篇被接收，录用率为26.8%，略高于上一届ICCV 2021录用率25.9%。商汤科技及联合实验室共49篇论文入选ICCV 2023，涵盖文生图、3D数字人、自动驾驶、目标检测、视频分割等多个与大模型和生成式AI相关的热点方向。

11、特斯拉Optimus人形机器人再进化：可依靠视觉自主分类物体，还能做瑜伽

特斯拉Optimus的官方推特账号上传了一段新视频：这种人形机器人已经获得进化，现在能够仅依靠视觉来对物体进行分类，还能完成瑜伽动作了。视频内容显示，Optimus人形机器人采用了类似于特斯拉自动驾驶技术FSD 12的端到端神经网络控制：视频输入，控制输出，并由此来控制各个部件和关节的移动。Optimus完成了一个简单的按颜色分类物体的任务，将不同颜色的积木块分别放入对应颜色的盒子中去。

机器人“接管”亚运会，AI算力70年增长6.8亿

继续阅读

618装修完刚好要买家电？千万别盲目选择，认准这四款准没错，吃土也要入！最近新房装修总算是即将完工了，虽然很累，但是为了

2024协作焊接机器人在智能焊接中的应用报告

机器人肾输尿管切除术

全球军事与科技动态：机器人技术最新进展全球首款芯片式3D打印机

马斯克向股东“讨薪”4000亿成功，预测：人形机器人和人类人口比至少将达1:1

特斯拉人形机器人Optimus最新进展（附股）

为亚运会卖房卖车一年开百余场演唱会，赚钱全部捐出回港后被封杀

560亿美元天价年薪获批！马斯克：人形机器人将为特斯拉创造30万亿美元市场

顶尖龙头+算力+人工智能+存储+机器人+半导体+短剧+预制菜

未来已来！特斯拉人形机器人横空出世，市值或将颠覆想象

机器人概念，6月14日主力资金大幅流入详情

小米扫地机器人自燃引发火灾：全屋熏黑！小米仅愿提供3万多赔偿

#小米扫地机器人自燃#6月15日，张女士发帖称5月26日上午，她家的扫地机器人自燃引起火灾，经消防勘查，初步认定为电器短

5000 字长文写作挑战：智能机器人的情感与温度探索

小米扫地机器人自燃，3万赔偿够吗？

酒店地毯清洁新范式！科沃斯商用清洁机器人新品助力酒店清洁设备升级！