天天看点

OpenAI重磅更新,发布GPT-4o多模态大模型

OpenAI重磅更新,发布GPT-4o多模态大模型

万大叔

2024-05-17 20:11发布于黑龙江科技领域创作者

OpenAI举行春季发布会,推出重磅更新,国内大模型能跟上吗?

在刚刚的发布会上,OpenAI发布了最新的GPT-4o多模态大模型,可实时跨文本、音频、视觉(图像与视频)进行推理,GPT-4o的o代表omni,也就是全能的意思。

同时,与之前的GPT-4 Trubo相比,GPT-4o不仅相应速度更快,并且价格也更便宜。

OpenAI重磅更新,发布GPT-4o多模态大模型

例如,过去的语音模式需要调用三个模型,也就是转写、智能和文生语音功能,所以会有延迟,一般都是一问一答的状态,在交流中需要等待好几秒。而GPT-4o的表现就比较惊艳了,在现场的演示过程中,GPT-4o已经可以达到“实时”响应的状态,也就是类似人与人的聊天,可以打断对话,不用等待回答完成便提出新问题,还可以提出各种各样的要求。

因为GPT-4o具有情绪感知能力,所以可以生成不同情绪风格的语音,例如轻缓的讲睡前故事等等,效果可谓是非常震撼。

价格方面,相较于GPT-4 Turbo,GPT-4o便宜50%,速率限制高出5倍。正是因为效率方面的提升,所以OpenAI决定向所有用户提供GPT-4。

也就是,免费用户也将可以使用GPT-4o。具体是,Plus用户的消息限制数量将是免费用户的5倍,Team和Enterprise用户的可用消息数量会更高一些。不过,免费也是有限制的,当额度消耗完以后,会自动切换到 GPT-3.5。

功能方面,免费用户也可以上传图片、进行分析、使用“浏览器”搜索实时信息等等。

另外,GPT-4o也开放了API,开发人员可以基于此进行AI应用的开发及部署,所以免费开放GPT-4o将会更好的推动GPTs开发者的数量。

除此之外,OpenAI还发布了ChatGPT桌面版,但目前只有macOS版。用户可以通过快捷键“拍摄”桌面并向ChatGPT提问,也就是可以识别分析电脑桌面的内容。

例如,对于桌面出现的代码,它能够分析出这段代码用于获取日常天气数据,并详细说明了其对天气数据进行了哪些后续处理。运行代码后,让ChatGPT分析,其不仅准确给出了7、8月的时间区间,还描述了这段时间的最高温度达到了多少。

不过,Windows用户也不用着急,Windows版本将在今年晚些时候推出。

OpenAI重磅更新,发布GPT-4o多模态大模型
OpenAI重磅更新,发布GPT-4o多模态大模型
OpenAI重磅更新,发布GPT-4o多模态大模型

另外,在多种测试中,GPT-4o的得分均超越GPT-4 Turbo、Claude 3 Opus(哦普士)、Gemini(摘摸耐) Pro 1.5等模型。 可见,GPT-4o的能力已经是行业翘楚。

OpenAI重磅更新,发布GPT-4o多模态大模型

那么,面对GPT-4o,我们的国产大模型会有怎样的表现呢?

说实话,因为GPT-4o刚刚发布,所以国产大模型可能还需要一点时间跟进。整体来说,目前国产大模型已经逼近GPT-4。

例如,商汤科技的书生·浦语,拥有1230亿个参数,全球51个知名评测集共计30万道问题集合上,测试成绩排名全球第二,并在综合考试agieval、知识问答commonsenseqa、阅读理解和推理的十项评测中位列第一,分数超过了GPT-4。

OpenAI重磅更新,发布GPT-4o多模态大模型

再例如,科大讯飞表示,其星火认知大模型V3.5的语言理解、数学能力已经超过GPT-4 Turbo,代码能力达到GPT-4 Turbo 96%,多模态理解达到GPT-4的91%。

OpenAI重磅更新,发布GPT-4o多模态大模型

再然后就是阿里云刚刚发布的通义千问2.5,根据媒体报道中的说法:模型性能全面赶超GPT-4-Turbo,成为“地表最强”中文大模型;通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。

OpenAI重磅更新,发布GPT-4o多模态大模型

还有百度的文心大模型4.0版本,李彦宏表示,其综合水平与GPT-4相比毫不逊色。尤其是在中文方面,文心一言的表现可能更好。

OpenAI重磅更新,发布GPT-4o多模态大模型

所以说,虽然GPT-4o拥有强大的性能,但国内AI大模型会很快跟上。

其实,我之前用过文心一言很长一段时间,在实际的体验过程中,感觉还是很ok的,极大的提高了工作效率,也达到了我的要求。而且我用的还免费版本,相信付费版本的效果一定会更好。

换句话说,现在的国产大模型,已经可以满足实际需求了。

或许在性能方面,与GPT-4o还存在一定的差距,但这个落后的原因中,硬件因素的占比可能更大一些,毕竟AI的根基是算力,而美国一直在限制出口先进AI芯片给我们,这点大家都知道。

而且成本也很高,据了解,ChatGPT每生成大约1000个单词,就要花掉12美分左右。而这种大模型对我们当下而言,并不是重要到无法替代的地步,无需投入大量资金进去。其作为一种生产力工具,可以满足日常使用其实就够了,千万不能掉入恶性竞争的圈套中,类似于美苏当年的星球大战那样,最终被拖垮的是自己。

另外,我们的AI发展战略跟别人也不同,我们主要是要在工业方面实现智能化,提供生产效率和产品质量、降低生产成本。而问个问题,帮忙写个文档,生成语音视频啥的,对于国家战略来说,暂时没有那么大的意义,现有的国产大模型够用就行了。这个逻辑,非常简单,相信大家都能理解。

总之,在大模型方面,我们无需妄自菲薄。相反,在老美的极致封锁和打压之下,国产大模型已经达到了世界先进水平,这就是最好的证明。相信随着国产半导体产业链的不断发展和完善,AI芯片的产能和性能也会逐步提高,追上ChatGPT是早晚的事儿,因为我们有着海量的需求市场和实践环境,是其他国家不能相提并论的,就好比移动支付、短视频、电商、智能驾驶等领域,能在中国获得极速发展,也是因为我们自己就是全世界最大最好的需求市场。所以,中国人工智能发展的脚步绝对不会停止,将会越来越快。

查看原图 56K

  • OpenAI重磅更新,发布GPT-4o多模态大模型
  • OpenAI重磅更新,发布GPT-4o多模态大模型
  • OpenAI重磅更新,发布GPT-4o多模态大模型
  • OpenAI重磅更新,发布GPT-4o多模态大模型
  • OpenAI重磅更新,发布GPT-4o多模态大模型
  • OpenAI重磅更新,发布GPT-4o多模态大模型
  • OpenAI重磅更新,发布GPT-4o多模态大模型
  • OpenAI重磅更新,发布GPT-4o多模态大模型
  • OpenAI重磅更新,发布GPT-4o多模态大模型

继续阅读