天天看點

蘋果搭載大模型的Siri,可能和你想的不太一樣

蘋果搭載大模型的Siri,可能和你想的不太一樣

蘋果搭載大模型的Siri,可能和你想的不太一樣

蘋果的 AI,雖遲但到。

根據華爾街日報消息,蘋果正與百度商讨,關于國内市場的 iPhone 以及其他裝置中整合生成式 AI 的業務。

盡管目前還沒有得到官方的确認,不過有兩件事至此可以确定:

  • 1

    iPhone 16、iOS 18 和 MacOS 将會搭載 AI 功能

  • 2

    蘋果裝置上的大模型,在國内外将由不同的廠商提供

蘋果搭載大模型的Siri,可能和你想的不太一樣

比起早已搭載 AI 助手的國内品牌,蘋果這回又不出意外地晚了大半年,慢人一步似乎一直都是蘋果的标簽,隻是它們總能在穩步前行中帶來一些驚喜。

然而,AI 大模型的進步速度正以周、甚至以天計數,蘋果的遲到,究竟是再一次後發先至,還是在新時代掉隊的開始。

01 略顯妥協的方案,先上車才是重點

上個月的最後一天,蘋果用 12 分鐘的短會宣布:放棄造車,All in AI,汽車團隊的衆多成員将被調往 AI 部門。

蟄伏十年的泰坦計劃,倒在了入局新能源汽車的最後一年,對于未來百家争鳴的汽車市場而言,會有些許遺憾,但從一家科技公司長遠的發展來看,這莫過于是一個長遠且正确的選擇。

蘋果搭載大模型的Siri,可能和你想的不太一樣

AI 是基礎性的應用,在所有大公司都主動或被動擁抱 AI 的當下,蘋果的「斷舍離」˙順應着時代,而如何擁抱 AI?怎樣的人工智能才能在逐漸被瓜分的市場裡占得一席之地?是它們最先要解決的難題。

針對國外市場,蘋果正在與 Google 積極談判,以便在 iOS 18 中加入 AI 大模型,實作其他品牌早就有的 AI 功能。

蘋果搭載大模型的Siri,可能和你想的不太一樣

雖然目前「雙方尚未決定人工智能協定的條款或品牌,也沒有最終确定如何實施」,但在衆多備選合作商(OpenAI 和 Anthropic)中,Google 和 Gemini,應該是最适合蘋果和 iPhone 的那一個。

今年二月發售的三星 Galaxy S24 系列機型以 AI 功能出圈,通話翻譯、創意寫作等功能趕上了國内平均水準,即圈即搜縮短了搜尋路徑,也極有可能成為今後 AI 手機的主要發展路線。

蘋果搭載大模型的Siri,可能和你想的不太一樣

海外版的 S24 系列,就是通過大模型 Gemini 支援,才得以完成上述功能。

從經驗講,Google 已在全球出貨量最高的旗艦機型上,完成了初步嘗試,相比于在 PC 或 Web 端大火的廠商,它們更知道手機大模型的操作習慣、使用場景、适配應用應該怎麼做。

蘋果搭載大模型的Siri,可能和你想的不太一樣

再者,Google 本身也更渴望得到蘋果的項目。

根據國際資料公司 IDC 的統計,三星在 2023 年全球智能手機市場占有率達到了 19.4%,蘋果則成功登頂達到了 20.1%。

蘋果搭載大模型的Siri,可能和你想的不太一樣

若是拿下蘋果,Gemini 在全球範圍内手機終端的搭載率将達到 4 成,這對于一家面臨激烈競争的 AI 大模型公司,極為利好。

在夢裡笑醒的除了 Google,還有蘋果。

和其他強調「自研」的廠商不同,蘋果在一開始就以合作來達成 AI 上機,也有其自身的考量。

蘋果搭載大模型的Siri,可能和你想的不太一樣

首先,在本身起步晚進度慢的現狀下,「拿來主義」是快速争奪市場的妙手,和 Google 的合作,在減小研發成本,收取高額坑位費的同時,還能緩解兩家公司目前所面臨的監管壓力。

其次,AIGC 的技術很好,但在落地時卻因道德、隐私等方面的缺陷被大量诟病,交給成熟的第三方,特别是已經在三星機型上試水成功的 Google,省力省心,且減小了輿論和責任風險。

蘋果搭載大模型的Siri,可能和你想的不太一樣

這當中的另一道坎,是技術本地化。每個國家和地區對 AI 大模型的監管和相關法規都有着不同的要求,合法合規的落地才是争奪市場和發展技術的前提,是以才催生出了「國内+國際」雙管齊下的路線。

按照三星與百度初見成效的合作,蘋果才會選擇這條已經被「驗證為真」的路線。

國行版三星 S24 系列上的 AI 功能,實際上有多個廠家旗下的技術組成:即圈即搜功能由百度和京東提供;智能修圖由美圖秀秀的大模型 MiracleVision 完成;文章摘要、智能寫作則采用了百度的文心一言大模型。

蘋果是否也會與多家廠商合作,還要等待後續的消息,不過和百度的合作,已然闆上釘釘。

最後,蘋果要做的并非一個智能語音助手,而是整套 AI 終端。但根據 Macrumor 的爆料,以目前的自研進度和技術成果,蘋果的大模型還遠達不到 Google、OpenAI 等公司水準。

與其趕鴨子上架一個智能聊天機器人,不如先拿成熟的方案做過渡,為自研大模型争取更多的研究時間和進步空間。

02 當下的市場很重要,但未來的核心技術才是根本

合作,是蘋果 AI 全球化的第一步,而最終的目标,是為了擁有全路自研的 AI 大模型。

蘋果搭載大模型的Siri,可能和你想的不太一樣

這是一項燒錢且耗神的工程,别說退步,稍微進步的慢一點,都有可能在下周被淘汰。一個有競争力的大模型,往往代表着今後在市場上的主導權與議價權。

庫克認為:

生成式 AI 方面開辟新天地,我們相信這項技術可以重新定義未來。

而蘋果對于大模型的探索,其實一直都在日程表上。

本月 15 日,蘋果工程師悄悄釋出的一篇研究論文,當中詳細介紹了一種名為 MM1 的新型生成式 AI 模型的開發過程。

蘋果搭載大模型的Siri,可能和你想的不太一樣

MM1 是一個具有最高 30B(300 億)參數的多模态 LLM 系列,這是蘋果在多模态大模型的最新研究成果。

總的來說,蘋果的自研模型在測試效果上,與 Gemini 和 GPT4V 還有一定的差距,也沒有在生成結果上表現出如 Sora 一樣驚人的效果,更沒有探索出一條全新的技術路線。

蘋果搭載大模型的Siri,可能和你想的不太一樣

但是,它能通過控制各種資料變量,在對比中找出影響模型生成效果最關鍵的那幾個因素,簡單來說,它天生不強大,不過善于觀察、實踐和總結,在一次次的嘗試中,也能取得不錯的成績。

MM1 由密集模型和 MoE(混合專家)變體組成,當指令進入 MoE 後,究竟應該去「東市買駿馬」還是「西市買鞍鞯」,都會被這個指令中心安排的明明白白的。

問題被細化和分類的同時,也提升了計算效率,節約了運作能耗。

蘋果搭載大模型的Siri,可能和你想的不太一樣

這篇論文的釋出,代表的是蘋果在 AI 領域探索的階段性成果,雖然 MM1 沒有颠覆行業更沒有驚豔世界,但在晦澀難懂的專業術語裡還是能看出它們的進步:

我們的工作模式一直是先做工作,然後再談論工作,而不是在自己面前出言不遜。—— Tim Cook

沒有透露過多技術細節的蘋果,其實還在盤算着另一步棋:端側大模型。

蘋果搭載大模型的Siri,可能和你想的不太一樣

早在去年底,蘋果在名為《閃存中的大型語言模型:在有限記憶體下高效的大型語言模型推理》的論文中,就提出了大模型落地 iPhone 等「記憶體有限」裝置的方法。

研究人員稱,他們通過最新的閃存技術,在 iPhone 和其他記憶體受限的裝置上成功部署了 LLM(大語言模型)。

蘋果搭載大模型的Siri,可能和你想的不太一樣

這個項目被稱為 Apple GPT,最大的作用是将 LLM 資料直接存儲在閃存中,比如整合在 Siri 内部,相較于傳統的運作方法,新技術使 CPU 和 GPU 的推理速度,最大提升了 5 倍和 25 倍。

研究人員稱:「我們開發的這些效率型方法使得人工智能模型能夠在 iPhone 目前記憶體的兩倍範圍内運作。」

也就是說,側端搭載大模型有了可行性,通過減少閃存傳輸的資料量、提高每次傳輸的吞吐量,讓 LLM 的資料直接儲存在閃存中。

03 撇開技術,Siri是我們和AI的橋梁

進度緩,消息少,布局大。這是蘋果探索 AI 的概況。

蘋果搭載大模型的Siri,可能和你想的不太一樣

每每看到蘋果的某項技術落後于市場和競争對手,都會給人一種「起步太晚」的錯覺,實際上在翻看相關新聞和專利檔案的時候,又會發現它往往是最早布局的那一批,甚至那一個。

截止到 2023 年,蘋果總共收購了 32 家 AI 公司,位列科技巨頭中收購榜第一。而收購 Siri,應該可以算作蘋果入局 AI 的開端。

蘋果搭載大模型的Siri,可能和你想的不太一樣

2010 年的喬布斯打給「Siri 之父」Dag Kittlaus 的一通電話,讓 Siri 以超過 2 億美元的身價,加入蘋果,走上 iPhone。

Siri 最初的定位是一個快速準确擷取資訊的助手,或是處理複雜任務的助理。

蘋果搭載大模型的Siri,可能和你想的不太一樣

在最原始的版本裡,Siri 可以與 42 個網絡服務相連接配接——從餐館點評網站 Yelp、售票網站 StubHub,到電影點評網站 Rotten Tomatoes 和數學計算網站 Wolfram Alpha。

根據提示,Siri 會将各種資訊整合,并回複使用者。無需打開其他的應用軟體,Siri 就可以幫助使用者買票、訂餐館或叫計程車。

這些如今被 AI Pin 和其他智慧助手大力宣揚的「AI 功能」,似乎隻是十多年前 Siri 的「基礎操作」。

但 Siri 的實際體驗,已經在 AI 大模型爆炸式發展的當下,被拉開了不小差距。

蘋果搭載大模型的Siri,可能和你想的不太一樣

智能助手,是對人的被動模仿,有問必答,有求必應。

而 AI 終端,則是對人的主動接近。根據使用者的個人習慣、喜愛偏好,總結以往、推理以後,在不同的時間地點給予你最合适的建議和答案,并且能夠不斷地學習優化,成為「私人專屬」。

蘋果搭載大模型的Siri,可能和你想的不太一樣

▲ 圖檔來自:x.com

從整體上看,蘋果的遲到隻是相對的晚,因為 AI 手機,還處于發展的早期階段。

的确,大部分國産品牌已經在 AI 終端的階段發力,功能大體相同,特長各有側重,但各家大模型的可用性隻能算達到及格線,除了像 OPPO 相冊的 AI 消除、三星通話的實時翻譯、小愛同學的 AI 通話等細分功能,大部分的體驗目前還是與獨立的 AI 應用有些差距。

蘋果搭載大模型的Siri,可能和你想的不太一樣

這當中,除了廠家的技術突破,也和 App 開放的接口有關,比如不支援微信語音通話摘要的模型,在日常生活中,就少了一大塊的應用空間。

是以,大模型和系統、App 的整合,以及對全新互動方式的探索,還有很長的路要走。在此之前,AI 功能還沒能達到影響消費者購機決策的程度。

蘋果搭載大模型的Siri,可能和你想的不太一樣

在 AI 上機的元年,Siri 的目标是和其他 AI 助手抹平這半年多的差距;而作為蘋果布局未來的重要部分,我們更期待 6 月份的 Siri,會帶來怎樣的「One more thing」。

繼續閱讀