ChatGPT的突然爆红,一直被冠以“iPhone时刻”。那么,作为“iPhone本Phone”的苹果又在干什么呢?
根据The Information的一份报告,苹果近期正在加大对对话式人工智能、自动化和多模态系统的投入,并且每天在人工智能上投资数百万美元。
在AI大模型打得火热的背景下,沉默许久的苹果终于要有所动作了。
这几年里,苹果在AI竞赛中的表现始终差点“火候”,让人感觉不温不火,风头全被OpenAI、微软、谷歌啥的占了。
究其原因,或许是出于对AI安全性必要的谨慎。毕竟库克曾多次提到,“以负责任的方式推动产品的发展,以提升人们的生活质量”。
不过,苹果并没有忽视产品与生成式AI工具的融合,一直密切关注着AI行业的动向。
早在去年,苹果公司就已经开发了类似于ChatGPT、微软的必应和谷歌的Bard等大型语言模型的框架“Ajax”。该系统基于谷歌的Jax机器学习框架构建,且能在谷歌云上运行。此举显然给苹果加入生成式AI赛道打下了重要的基础。
根据The Information的报道,目前,苹果从事对话式AI的部门被称为“基础模型”,它有“大约16名”成员,其中包括几名前谷歌工程师。该部门由苹果人工智能主管约翰·詹南德雷亚(John Giannandrea)掌舵,他于2018年受雇帮助改进Siri。
除了对话式AI,苹果的其他团队也在研究人工智能的其他方面。一个视觉智能部门正在开发一个图像生成模型,另一个小组正在研究“多模态人工智能”,它可以识别和生成图像或视频以及文本。
不过,在苹果大模型发展势头渐起的当下,人们首先想到的是,Siri终于有救了!
01
“hi! Siri”
从惊艳四座到满身槽点
随着一声“嗨,Siri”,人工智能语音助手的新时代被唤醒了。
Siri成立于2007年,最开始其并非苹果独立开发的原创服务。但由于被苹果创始人乔布斯相中,2010年,Siri以2亿美元的价格被苹果收购,并在之后作为一款APP在苹果应用商店上架。
在原初的设计中,Siri仅仅支持文字聊天服务,也就是问一句答一句的那种。但在乔布斯接手后,便开始了改造,增加了语音对话的功能,并在之后集成到了IOS系统当中,与轰动一时的iPhone4S一同发布。
这个超前的AI概念,在那个时代可谓是遥遥领先,也成了苹果引以为傲的一块招牌。
在2011年iPhone4S的新闻发布会上,人们问苹果新CEO库克,iPhone4S的那个“S”代表什么,库克说,“它代表Siri”。由此可见Siri对于iPhone乃至苹果的重要性。
之后,Siri一步步与iPad、Mac、AppleWatch等苹果旗下的产品融合。2016年,苹果发布了iOS10,其中包括一个名为“SiriKit”的新功能,允许第三方开发者将他们的应用程序与Siri集成。这意味着用户可以使用Siri来控制和访问这些第三方应用程序。
然而,具有划时代意义的Siri在之后的发展中却有点后继乏力。随着时间的流逝,Siri的表现在逐渐走向没落。甚至,连苹果公司内部的员工们也开始对Siri进行批评和嘲笑,称其在市场上被其他竞争对手超越并落后。
Siri的后续表现究竟有多糟糕呢?
“嘿Siri,花落知多少。”
结论显而易见。
除了常识性的错误,Siri的毛病还有不少,比如时不时的“耳背”,超长的反射弧;面对稍微复杂的问题,它只会毫无歉意地说“对不起,没听懂,请再说一遍”;遇到稍紧急的情况,第一句没听懂,它就玩消失,用户只能疯狂cue“hi,Siri”,它才会出现。
可以说,毛病众多的Siri已经从苹果创新的招牌转变为拖累销量的赔钱买卖。
Siri发展到如今这种地步,原因众多。作为Siri项目发起人兼主导人的乔布斯的逝世是Siri遭受的第一次打击。
在乔布斯与Siri公司的创始人之一Dag Kittlaus交谈时,乔布斯对人工智能的未来充满憧憬,他让Siri的初创成员相信:Siri最终会在宇宙中留下自己的痕迹。
然而,在Siri正式发布的第二天,乔布斯去世了。
这意味着Siri失去了一个核心、具备异想天开思维的引领者,而Siri团队的计划也被打乱。而且在之后,支持Siri业务的前高级副总裁Scott Forstall等重要人物相继离开苹果,并带走了一部分核心的工程师,Siri未来的发展变得迷茫而不确定。
此外,由于苹果一直非常重视用户隐私,因而在用户数据上,苹果通常采用较为保守封闭的策略,这可能限制了Siri在数据收集和使用方面的能力,从而影响了Siri日后的改进工作。
诸多的原因累加在一起,使得Siri离最初成为一个真正的人工智能助手的愿景越来越远。
而到了以ChatGPT为代表的生成式AI大热的当下,姗姗来迟的苹果也将为Siri进行一次大升级。
根据最新消息与进展,苹果团队研发的模型AjaxGPT(或称AppleGPT),其参数量已经超过了2000亿个,在能力方面已经超越了GPT-3.5。
02
AI Agent
后GPT时代的新风口?
当下,AI Agent正如旭日东升,备受关注与追捧,成为继大语言模型之后人工智能圈的新宠。
什么是AI Agent?在大模型语境下,你可以理解为能自主理解、规划、执行复杂任务的系统。
AI Agent并非ChatGPT升级版,它是更为复杂的一种工具,不仅仅只是在对话上展现其智能,还会进行执行的操作,它不仅告诉你“如何做”,更会帮你去做,把它视作人类的“数字助理”更为合适。
在这种情况下,无论是学术界还是商业界,都在AI Agent相关领域展开争夺与探索。
在业界巨头中,OpenAI正将AI Agent作为新战略重点;微软通过Copilot在助理场景进行商业化尝试;NVIDIA开发出自动编程的Voyager;阿里数字化员工则是国内的探索案例。学术圈也频频对AI Agent进行Concept测试,比如让数十个AI Agent在模拟小镇中互动、合作。
尽管仍处于早期阶段,但AI Agent已经成为资方的新宠。它被视为大语言模型商业化的有效路径,也是通往更强大通用AI的重要一步。
对苹果来说,其代表性的智能助手Siri也面临新的发展契机。
Siri作为首批进入主流的语音助手,这些年来一直处于领先地位,能够理解语音指令、回答查询、完成简单任务,虽然伴随着ChatGPT的横空出世,Siri遇冷,但如今AI Agent概念的出现为Siri提供了加强自身的机遇,当AjaxGPT诞生之时,苹果凭借其终端设备领域的优势,Siri或许也即将迎来属于它的“飞升时刻”。
根据目前的消息,预计在iOS 18中,Siri将以全新的面貌向公众发布。Siri能否在苹果的大模型加持下实现王者归来,大家不妨期待一下。
作者:西瓜 排版:黄蕾卉
图片源于Q仔互联网冲浪所得,若有侵权,后台联系,Q仔滑跪删除~