天天看点

OpenAI与谷歌,或许都未亮明底牌

OpenAI与谷歌,或许都未亮明底牌

图片来源:视觉中国

最近一周,全球AI领域迎来了交锋时刻。

当地时间5月13日,OpenAI通过直播发布了GPT-4系列新模型GPT-4o,以及ChatGPT的桌面版本。未亲临直播现场的OpenAI首席执行官山姆·奥特曼在X上发帖称:“我们的新模型:GPT-4o,是我们目前最好的模型,它智能且快速,还是原生多模态模型。”

OpenAI首席技术官米拉·穆拉蒂介绍道,GPT-4o将面向包括免费用户在内的所有用户,它较上一代产品更快,改进了文本、视频和语音功能,提高50种不同语言ChatGPT的服务质量。GPT-4o还将通过OpenAI的API提供支持,开发者可以使用新模型构建应用程序。

直播时,穆拉蒂与两位技术人员对GPT-4o进行了现场测试。新模型减少了人机对话的迟滞感,在过程中,人们可以随时打断GPT-4o的输出,情绪传达实现进步,再结合视频功能,让机器更像一个能看能听的真实存在的人。

如果说之前的GPT是基于数据,在理性分析层面给人以技术跨越的震撼,那么这次GPT-4o呈现出与人类相似的感性层面的补充,让人感叹科幻电影情节已经发生。

OpenAI在这次迭代中,没有满足外界对GPT-4.5或GPT-5的期待,但“o”相较数字,更直接地表达了一种进化。据OpenAI官网介绍,这里的“o”代表“omni”,意为“全能”,源自拉丁语。而在英语中,它常被用作词根,可以联想到“全知全能”和“无处不在”。

值得注意的是,GPT-4o发布时间点卡在了谷歌I/O开发者大会的前一天。而在往后的一个月中,微软Build年度开发者大会和苹果WWDC也即将先后召开。

当地时间5月14日,谷歌在I/O开发者大会中公布AI新进展,在前一天OpenAI的铺垫下,市场自然会以更高的眼光审视这家老牌巨头的新产品。

OpenAI确实通过这次布景简单且短暂的直播成功向谷歌施压——开发者现场的实时对话展示,让人不禁联想到谷歌大模型Gemini此前发布的展示视频被指剪辑、夸大宣传。该模型在实际应用中,并未达到其宣传中的效果。对此,谷歌承认道,演示视频经过编辑,为简洁起见,延迟已减少,Gemini输出也已缩短。2024年的I/O开发者大会成为谷歌的关键挽尊机会。

其实,谷歌首席执行官桑达尔·皮查伊早在七八年前就在I/O开发者大会上表态,要从“移动优先”转为“AI优先”,但在提前看清方向的条件下,谷歌并没有延续领先优势。在上一代互联网时代习惯处在领先地位的谷歌,经历过去一年围绕AI的挑战后,似乎变成了追赶者。它需要向外界释放有关最新技术的积极信号。

这次I/O开发者大会上,谷歌亮出了能与GPT-4o相抗衡的Project Astra,该项目展示了多模态理解和实时对话能力。通过演示能够看出,Astra的延迟较GPT-4o更长,且情感多样性还有待提高。

同时,谷歌还推出了对标Sora的视频生成模型Veo。今年2月,与Gemini 1.5 Pro被几乎同时推出的Sora抢尽风头。

在搜索引擎方面,谷歌主动实现自我革命,在搜索功能中推出AI概览(AI Overviews),归纳总结搜索结果。谷歌称,搜索将具备多步骤推理能力,并支持视频形式的解决方案搜索。与此同时,谷歌将拥有100万tokens长的上下文窗口的Gemini 1.5 Pro扩展至200万tokens级别,这意味着大模型能够处理更多信息,拥有更全面的理解能力。

由于ChatGPT自2022年末走入大众视野后,就对搜索领域形成了直接威胁,因此市场曾推测,OpenAI会在这次发布会上推出基于ChatGPT的搜索引擎。但该公司目前并未宣布迈出这一步。

OpenAI和谷歌的研发竞赛陷入胶着,这对包括苹果和亚马逊在内的公司形成了威胁。它们需要跟上日益加快的步伐,至少不能落后太多,否则Siri和Alexa都会陷入尴尬。由于苹果的AI研发进度并不明朗,已经有传言称其正在与OpenAI谈判,以求在短期内获得技术许可,将最先进的AI技术应用于苹果产品。

AI竞争已经从基建向应用与生态搭建蔓延。

谷歌在企业应用和消费者应用方面的积累,为其建立AI生态圈提供了天然优势。或许OpenAI注意到了这一点。今年1月,OpenAI推出个性化AI应用商店GPT Store,用户可以通过其发现和构建GPT。目前GPT Store主要针对付费版本开放。这一功能被认为可能成为下一个Apple Store。从去年年底宣布,到今年年初问世,历时两个月,期间经历了奥特曼被意外罢免再复职的风波。

截至目前,GPT Store还只是一个渠道,距离大众通过OpenAI潜力所构想的生态建立还有很大差距。但随着GPT-4o的技术迭代,对于AI应用的想象得以进一步丰富,不能排除OpenAI正在为生态搭建架构的可能。

在OpenAI此次发布会的最后,穆拉蒂说道:“今天我们专注于免费用户、新模式,和新产品,但我们也非常关心下一个前沿领域。很快,我们将向大家更新下一个大事件的进展。”

这不得不使人猜测,OpenAI对于实际进展有所保留。在激烈竞争之下,保留底牌或许已经成为各大巨头的习惯。OpenAI的“下一个大事件”的官宣时间,或许在后续微软和苹果的发布会之后,或许会找另外一个时间节点。毕竟奥特曼一直擅长在正确的时间释放正确的信息。OpenAI此前的技术曝光节奏都取得了不错的效果。(财富中文网)

《财富》杂志今年首度推出“《财富》中国科技50强”榜单,试图找到这些出生在中国,正在影响世界的科技公司。它们的成功不仅在于技术和产品,更在于它们代表的创新精神和全球化视野。我们期待这些中国公司在科技创新和全球化拓展中取得更卓越的成就,为技术和商业的进步做出更大的贡献。

OpenAI与谷歌,或许都未亮明底牌

在财富Plus,网友们对这篇文章发表了许多有深度和思想的观点。一起来看看吧。也欢迎你加入我们,谈谈你的想法。今日其他热议话题:

查看《欧盟称中国车企提供信息不足,将抬高关税》的精彩观点

查看《微软准备推出自研AI大模型》的精彩观点

OpenAI与谷歌,或许都未亮明底牌

继续阅读