天天看点

OpenAI被曝秘密训练 GPT-5,国内11家大模型产品通过备案,“360智脑” 大模型已创收近2000万元|36氪GPT周报

作者:36氪

作者:子渝

编辑:沈筱

OpenAI 发布 ChatGPT 企业版,提供更高的安全和隐私保障

8月28日,OpenAI宣布将推出ChatGPT企业版,专门针对企业用户的需求,可提供更高级别的安全和隐私,对话数据不会用于模型训练,其执行速度将是普通版GPT-4的两倍。OpenAI 表示,ChatGPT 企业版不仅可以无限制地快速访问强大的 GPT-4模型,还可以进行更深入的数据分析,帮助企业快速理解信息,并且可以向 ChatGPT 提出更复杂的问题。

https://www.ithome.com/0/715/406.htm

GitHub Copilot更新三大功能

8月28日,GitHub Copilot迎来三大更新,这些新功能有的只在Visual Studio中享有,有的则只支持VScode。全新交互体验,代码行中直接提问,无需切换聊天窗口,用户可直接在代码编辑器中使用Copilot Chat来优化代码;官方已正式为所有代码完成请求推出8k上下文窗口;斜杠命令改进、上下文扩展到终端,界面新加了对话历史记录,并支持快捷的斜杠命令。

https://www.qbitai.com/2023/08/80132.html

英伟达推出DLSS 3.5,利用全新AI模型创建更高质量光追图像

8月28日,英伟达推出了NVIDIA DLSS 3.5,再次推动了渲染技术的发展。其创新之处在于,运用了一个增强版AI驱动的神经渲染器。即采用全新的AI模型,利用了光线重建(Ray Reconstruction)技术,为密集型光追游戏和应用程序,创建更高质量的光追图像。而且,因为其中的光线重建技术本身不依赖硬件,所以之前的RTX系列显卡也能享受该项技术升级。

https://36kr.com/p/2408488309203971

英伟达和Meta访问SK海力士寻求AI服务器

8月29日消息,Meta高层日前访问SK海力士韩国利川总部,视察利川园区的DDR5、HBM生产设施及EUV设备,并对DDR5进行质量审核。Meta是SK海力士的主要客户之一,如今已在AI服务器上投入巨资,要求SK海力士也额外供应高性能、高效率的DDR服务器DRAM。此外,英伟达有望在本周访问SK海力士的利川园区,预计将审查SK海力士的第五代HBM(即HBM3E)产线。报道指出,鉴于英伟达已考虑大幅提高AI芯片H100的产量,双方或将讨论HBM的供应问题。

https://finance.ifeng.com/c/8Sdy5LrLHN2

谷歌在TPUv5上训练下一代大模型Gemini

8月29日消息,据称,谷歌大模型Gemini的训练规模已达GPT-4的5倍。Gemini初代版本可能是在TPUv4上训练,使用14个pod,训练FLOPS达1e26,而GPT-4的FLOPS仅2e25左右。Gemini的下一代版本已经开始在TPUv5上训练,算力高达1e26FLOPS,是GPT-4的5倍。Gemini一直在TPU上快速迭代,先是TPUv4,现已升级到TPUv5,性能表现也优于GPT-4。

https://www.chinaz.com/2023/0829/1554861.shtml

谷歌推出新超级计算机,搭载英伟达H100“Hopper”GPU

8月29日消息,谷歌云在云Next大会上宣布,将于下月上线A3虚拟机实例。这款实例最大的亮点是配备了英伟达H100 Tensor Core GPU,以满足生成式AI和大语言模型的需求。 A3实例采用了第4代英特尔至强可扩展处理器、2TB DDR5-4800内存,以及8张英伟达H100“Hopper”GPU,通过NVLink 4.0和NVSwitch实现了3.6TBps的对分带宽。这款超级计算机“专门用于训练和服务要求最苛刻的人工智能模型,这些模型为当今的生成人工智能和大型语言模型创新提供动力”。

https://techcrunch.com/2023/08/29/googles-new-a3-gpu-supercomputer-with-nvidia-h100-gpus-will-be-generally-available-next-month/

华为云将与同方知网共建知识服务行业AI大模型

8月30日,在华为云盘古大模型主题论坛上,同方知网数字出版技术股份有限公司(以下简称“同方知网”)与华为云计算技术有限公司(以下简称“华为云”)正式签署中华知识大模型(以下简称“华知大模型”)及人工智能联合创新实验室合作协议。双方将基于华为云盘古大模型打造知识服务行业的AI大模型。

https://news.sina.com.cn/sx/2023-08-30/detail-imziyppc7320069.shtml

360发布2023年半年报,“360智脑”大模型已创收近2000万元

8月30日消息,360发布2023年半年报,总营收45.03亿元,其中安全业务实现营收9.08亿元。360安全大模型已在360内部及自有产品落地应用,并创造近2000万元相关业务收入。360安全大模型是360自研的认知型通用人工智能大模型,具备多项核心能力,已推出企业级 AI 大模型解决方案,并与合作伙伴推出行业大模型,推动大模型产业发展。

https://finance.sina.com.cn/jjxw/2023-08-30/doc-imziytuz7224758.shtml

前谷歌CEO发起AI+Science登月计划,以OpenAI为蓝本

8月30日消息,谷歌前CEO Eric Schmidt正在建立一家大型的AI+Science非营利性创业公司,期望通过AI来应对科学研究中的挑战。Schmidt聘请了弗朗西斯•克里克研究所应用生物技术实验室的创始人Samuel Rodriques,以及罗切斯特大学教授、在化学中使用AI的先驱Andrew White。知情人士透露,这项工作以OpenAI为蓝本。Rodriques表示,公司将需要由核心AI研究人员和核心科学家组成的团队一起工作,并采用快速迭代周期,以构建能够利用前沿技术并为科学家带来实际价值的工具。

https://36kr.com/p/2410198303040258

谷歌与通用汽车合作,将对话式 AI 引入旗下车机领域

8月30日消息,通用汽车在官网宣布,公司与科技巨头谷歌展开合作,探索在汽车中使用 AI 的机会。据了解,通用汽车将与谷歌云围绕生成式 AI 进行“更广泛的合作”,此前双方已经针对通用汽车的 OnStar IVA通用汽车表示,IVA 系统将由谷歌提供的“意图识别演算法”(intent-recognition algorithms)提供支持,从而为 OnStar 用户提供常见查询的响应,以及路线和导航帮助。

https://www.ithome.com/0/715/870.htm

谷歌推出 SynthID,在 AI 生成的图像中嵌入隐形水印

8月30日消息,为了应对日益增长的 AI 生成图像的问题,谷歌 DeepMind 团队今日推出了一款名为 SynthID 的工具,可以在 AI 生成的图像中嵌入人眼不可见的水印,但可以用专门的人工智能检测工具检测出来,以便于区分真实和虚假的内容。该工具已经在谷歌云平台上向部分客户开放。

https://www.ithome.com/0/715/671.htm

谷歌计划将在印度和日本推广人工智能搜索

8月31日消息,谷歌计划在印度和日本市场推广其人工智能驱动的搜索生成体验(SGE)计划,该功能目前仍处于邀请加入的阶段。SGE 旨在为用户提供策划的答案,而不是传统的网页列表。谷歌的系统与微软的不同之处在于,它将人工智能直接整合到现有的搜索栏中。该功能将提供多语言版本和语音输入功能,并在搜索结果页面上继续显示广告。

https://www.chinaz.com/2023/0831/1555322.shtml

谷歌推出AlloyDB AI,帮助开发者创建生成式AI应用

8月31日消息,谷歌发布新闻稿,宣布推出 AlloyDB AI 服务,允许开发者结合大语言模型的功能和实时操作数据,为向量嵌入提供全面支持。AlloyDB AI 使用简单的 SQL 函数将数据转换为向量嵌入,并且它可以执行向量查询,速度比标准 PostgreSQL 快十倍。

https://www.ithome.com/0/715/950.htm

百度、商汤等国内11家大模型产品通过备案,将陆续开放上线

8月31日,国内11家通过《生成式人工智能服务管理暂行办法》备案的AI大模型产品将陆续上线,面向全社会开放。首批名单中,包括百度的“文心一言”、抖音的“云雀”、百川智能的“百川大模型”、智谱华章的“智谱清言”、中科院的“紫东太初”、商汤的“商量SenseChat”、MiniMax的“ABAB大模型”和上海人工智能实验室的“书生通用大模型”。此外,华为、腾讯、科大讯飞也即将开放其大模型产品。阿里的“通义千问”已完成备案,等待上线。

https://36kr.com/p/2411653492204549

华为盘古大模型版小艺开启众测招募

8月31日消息,华为开始招募全新小艺众测体验官。首批支持众测的机型包括 Mate60/P60系列。全新小艺能够更好地理解用户并提供更精准的反馈,包括本机数字内容搜索、对话识别屏幕内容、帮助用户快速摘要、文案内容辅助、图片二次创作等功能。

https://www.chinaz.com/2023/0831/1555383.shtml

“商量SenseChat”12项性能位列第一,疑接近GPT-4

8月31日,商汤科技日日新大模型旗下自然语言应用“商量SenseChat”正式面向广大用户开放服务。其基模型为商汤联合多家国内顶级科研机构发布的书生·浦语InternLM-123B,在全球51个知名评测集(包括MMLU, AGIEVAL, ARC, CEval, Race, GSM8K等)共计30万道问题集合上测试成绩整体排名全球第二,超过GPT-3.5-turbo以及Meta新发布的LLaMA2-70B等模型,在主要评测中12项成绩超越GPT-4,排名第一。

https://www.sensetime.com/cn/news-detail/51167247?categoryId=72

Meta可能正开发Llama 3,据称比GPT-4强大、免费开源

8月31日消息,OpenAI 工程师、前 Google Brain 工程师 Jason Wei 在 Meta 组织的 Generative AI Group 社交活动中了解到,Meta可能正在开发比GPT-4更强大的AI大模型Llama3,并且保持开源免费。从 Llama2升级到 Llama3可能比简单地通过更多训练进行扩展更具挑战性,并且可能比从 Llama1跳到 Llama2需要更长的时间。Llama2在某些应用程序中达到了GPT-3.5的水平,同时正在由开源社区通过微调和附加功能进行优化。

https://tech.ifeng.com/c/8ShQFq6NXdN

Meta发布AI基准测试工具FACET ,用于评估 AI 模型的“公平性”

8月31日消息,Meta发布了一个新的AI基准测试,名为FACET,旨在评估在照片和视频中对人和物体进行分类和检测的AI模型的“公平性”。FACET由32,000张包含50,000个人标签的图像组成,这些标签由人类注释者标注。除了与职业和活动相关的类别,如“篮球运动员”、“DJ”和“医生”,还包括人口统计和身体属性,使Meta能够对针对这些类别的偏见进行“深度”评估。

https://techcrunch.com/2023/08/31/meta-releases-a-data-set-to-probe-computer-vision-models-for-biases/

百家云发布一站式 AIGC 场景化平台——百问大模型

8月31日,百家云在战略发布会上发布了一站式 AIGC 场景化平台「百问大模型」。该平台基于百家云的技术积淀和研发实力,保证企业数据安全的同时,能够低成本接入各类 AIGC 服务,解决企业应用模型技术的困难。该平台提供多种数据安全审计方式,支持零代码快速生成应用,集中管控企业知识库,满足信创要求,并支持私有化部署自主可控。百家云还展示了该平台在智能大模型 AI 客服、公文写作、个人 AI 助理、数字人互动直播和营销文案辅助等场景的应用案例。

https://baijiahao.baidu.com/s?id=1775736573951503811

英伟达推出FlexiCubes,利用生成式AI创建高质量3D网格

9月1日消息,Nvidia推出了一种全新使用AI生成3D网格的方式FlexiCubes,它可以为广泛的3D应用生成3D网格。FlexiCubes可以与物理学引擎集成,并且可以轻松地在3D模型中创建柔软的物体。这种网格生成的创新方法有望改变人工智能流水线,为各种应用提供高质量的网格。

https://www.chinaz.com/2023/0901/1555781.shtml

X(推特)调整隐私政策,可拿用户发布的信息训练 AI 模型

9月1日消息,埃隆・马斯克旗下社交平台 X(推特)日前调整了隐私政策,允许 X 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于9月29日生效。新政策规定,X 可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 X 的机器学习或人工智能模型。

https://www.ithome.com/0/716/397.htm

OpenAI发布AI教学指南

9月1日消息,OpenAI发布了一份名为“人工智能教学(Teaching with AI)”的官方指南,旨在帮助教师更有效地在课堂上使用ChatGPT。OpenAI的“人工智能教学”指南主要阐释了ChatGPT的工作原理、局限性,并提出了检测器的作用以及如何避免偏见,还提供了实用的指令集,方便教师与学生良好互动。

https://www.chinaz.com/2023/0901/1555747.shtml

港中文、清华等七所顶尖高校提出全新CSV方法,GPT-4 MATH准确率最高涨至84.3%

近期,GPT-4和PaLM-2等模型在数学推理上展现了卓越的性能。为了深入研究代码生成对语言模型推理的影响,来自港中文、清华等七所顶尖高校的研究人员联合发表了一篇论文,探讨了代码使用频率(Code Usage Frequency)对模型性能的影响。研究发现,GPT-4 Code Interpreter的成功部分归功于其在代码生成、评估和纠正方面的能力。基于此,研究者提出了基于代码的自我验证(CSV)方法,进一步提升了GPT-4的数学推理性能。通过结合Code Interpreter和CSV方法,GPT-4在MATH数据集上的准确率从53.9%提高到了84.3%。

https://36kr.com/p/2413040960136198

腾讯9月初将发布混元大模型,腾讯文档、腾讯游戏已接入测试

9月2日消息,日前,中国证券报从腾讯方面获悉,腾讯将在9月初举行的2023年腾讯全球数字生态大会上正式发布混元大模型,但并未提及是否面向公众开放。腾讯此前表示,混元大模型已经进入公司内部应用测试阶段,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档等多个腾讯内部业务和产品,已经接入腾讯混元大模型测试并取得初步效果。

https://www.ithome.com/0/716/485.htm

国产中英双语语音对话大模型曝光,李开复零一万物参与研究

9月2日消息,一篇关于语音-文本多模态大模型的论文出现在arXiv上,这篇论文提出了一个中英双语可商用对话模型LLaSM,同时支持录音和文本输入。这项研究来自LinkSoul.AI、北大和零一万物,目前已经开源。LinkSoul.AI是一家AI初创公司,之前推出过首个开源Llama 2的中文语言大模型。据研究人员表示,LLaSM是第一个支持中英文双语语音-文本多模态对话的开源可商用对话模型。

https://www.qbitai.com/2023/09/80972.html

百度输入法上线“超会写”AI 助手,基于文心一言大模型打造

9月3日消息,百度输入法近日发布了11.7.19.9 安卓版本,这是继百度宣布“文心一言”首批获批向全社会开放之后的重要更新。这次更新的亮点是百度输入法新增了全场景 AI 创作助手“超会写”,该功能基于文心大模型打造,可以帮助用户在各种场合下进行高效、高质、高情商的文本创作。

https://k.sina.com.cn/article_6678407719_18e106a27001012ld8.html

DeepMind 联合创始人称 OpenAI 正秘密训练 GPT-5

9月3日消息,DeepMind 联合创始人 Mustafa Suleyman,现 Inflection AI 的 CEO 在采访时透露,OpenAI 正在秘密训练 GPT-5,比当前模型大100倍。而他的公司Inflection AI 正在建造世界上最大的超级计算机之一,并且他认为在接下来的18个月内,他们可能会进行一次比制造 GPT-4的语言模型训练运行大10倍或100倍的训练运行。

https://www.ithome.com/0/716/586.htm

继续阅读