OpenAI的“雙重挑戰”：谷歌全面反擊，首席科學家出走

OpenAI剛釋出新旗艦模型GPT-4o沒多久，風頭很快就被谷歌蓋過去了。

當地時間5月14日，谷歌I/O開發者大會正式召開，并釋出了一系列AI應用在内的“全家桶”，其中多款産品被認為是正面對标OpenAI。谷歌CEO皮查伊表示，當天的釋出會一共提到了121次AI，足以顯示谷歌對AI的重視程度。

反觀被“針對”的OpenAI，一場人事變動正在上演。當地時間5月14日，OpenAI聯合創始人、首席科學家伊爾亞·蘇茨克維（Ilya Sutskever）宣布決定離開OpenAI。幾個月前，圍繞着OpenAI聯合創始人兼首席執行官山姆·奧特曼（Sam Altman）的罷免事件中，這位科學家曾被視為關鍵人物，而随着Sam Altman的回歸和董事會改組，OpenAI的權力鬥争落幕，也使得Sutskever如今的出走顯得沒有那麼“意料之外”。

關鍵人物離開OpenAI

包括Sam Altman在内的一衆OpenAI高管和Ilya Sutskever上演了一場體面的“分手”。

作為聯合創始人和首席科學家，在加入OpenAI近十年後，Ilya Sutskever決定離開。他在社交平台上發文稱，OpenAI的發展軌迹堪稱奇迹，并提及到了OpenAI的現任管理層，表示在他們的上司下，OpenAI将打造出安全有益的AGI。

Sam Altman很快作出回應，稱Ilya Sutskever是“我們這一代最傑出的思想家之一，是我們領域的引路人，沒有他，OpenAI不會有今天的成就”。在肯定了Ilya Sutskever的能力和表達感謝之後，Sam Altman對外公布了首席科學家這個職位的繼任者：Jakub Pachocki。從其履曆來看，這位科學家自2017年加入OpenAI，曾擔任OpenAI研究總監，Sam Altman曾盛贊他在GPT-4開發中的上司力和技術能力。

值得一提的是，在去年11月轟轟烈烈的高層動蕩中，OpenAI CEO Sam Altman和總裁Greg Brockman離開公司後不久，有三名OpenAI進階研究人員也宣布辭職，其中之一便是Jakub Pachocki。

如今再回過頭看，幾個月前的所謂“宮鬥”事件發展及後續處理也為如今Ilya Sutskever的出走埋下了伏筆。

去年11月中旬，Sam Altman被宣布解除CEO職位并離開董事會，Greg Brockman随後也主動宣布辭去總裁職務，一時間輿論嘩然。随後幾天内，在外部投資者和内部員工的雙重施壓之下，這兩位高管風光回歸OpenAI并複職。

在這場“鬥争”中，Ilya Sutskever曾聯合董事會成員反對Sam Altman，進而被外界認為是“話事人”，在Sam Altman回歸之後，Ilya Sutskever表示對參與董事會行動而深感後悔。權力鬥争落幕之後，OpenAI董事會進行了改組，由原先的6人縮減為3人，Ilya Sutskever也由此不再在董事會任職。

伴随着這起高層動蕩，外界對OpenAI内部的人工智能技術路線之争進行了一場持久而全面的讨論。作為機器學習領域的頂尖學者，Ilya Sutskever主張謹慎、重視風險與安全問題，被認為是“科學保守”的那一派。此外，OpenAI内部的一個意在解決超級智能的對齊問題的超級對齊Superalignment團隊中，Ilya Sutskever亦是上司者之一。

Ilya Sutskever暫時沒有透露其“下家”的具體細節，僅提及“這個項目對我個人意義重大”。而對Sam Altman和OpenAI來說，随着谷歌等商業公司對AI的持續加碼，不斷推出具有強大競争力的工具和應用，作為非營利機構的OpenAI如何處理創立初衷和商業化發展，仍是其需要持續面對的問題。

谷歌來勢洶洶

如果說首席科學家的出走是意料之中的正常人事變動，那麼外部商業巨頭的快速發展對OpenAI帶來的挑戰或許更加嚴峻。

當地時間5月13日，OpenAI舉行了一場線上直播，沒有GPT-5，也沒有搜尋引擎，OpenAI釋出了GPT-4o，“o”意為“omni”，也就是“全能”的意思。根據官方介紹來看，GPT-4o是朝着更自然的人機互動邁出的一步——它接受文本、音頻、圖像和視訊的任何組合作為輸入，并生成文本、音頻和圖像輸出的任何組合。

與現有模型相比，GPT-4o在視覺和音頻了解方面尤為更好。在反應速度上，GPT-4o可以在短短232毫秒内響應音頻輸入，平均響應時長320毫秒，類似于對話中的人類響應時間。在GPT-4o之前，使用者使用語音模式和ChatGPT通話時，延遲時間平均為2.8秒（GPT-3.5）和5.4秒（GPT-4），可見其跨越性的發展。而且，GPT-4o的價格還便宜50%。

一天之後，谷歌在開發者大會上釋出了一系列基于Gemini的AI功能及産品。這不免讓外界聯想到，今年2月15日，谷歌釋出多模态大模型Gemini 1.5 Pro當天，OpenAI就釋出了文生視訊模型Sora，幾乎搶走了谷歌的所有風頭。

此次，谷歌進行了全面反擊，推出了Gemini 1.5 Flash，這是谷歌Gemini系列模型中的最新成員，也是通過API提供的速度最快的Gemini模型，比1.5 Pro更輕量級，且在處理大量資訊時具有強大的多模态推理能力。谷歌還大幅改善了1.5 Pro，除了上下文視窗将從100萬token更新至200萬token，還提升了模型的代碼生成、邏輯推理與規劃、多輪對話以及音頻和圖像了解能力。如今，谷歌已經将1.5 Pro整合到Google産品中，包括Gemini Advanced和Workspace應用程式。

而對标GPT-4o，谷歌DeepMind也首次對外推出了通用AI智能體“Astra”。從谷歌官方展示的視訊來看，Astra可以通過視訊畫面接受資訊，進行識别并做出回應。不過，谷歌方面也表示：“雖然我們在開發能夠了解多模态資訊的AI系統方面取得了驚人的進步，但要将回答時間縮短到可對話的程度，仍是一項非常艱巨的工程挑戰。”

此外，谷歌宣布了一系列與圖像、音樂、視訊有關的生成式AI工具，包括文生圖工具Imagen 3、與Youtube以及音樂家合作的“AI音樂沙盒”和最新的視訊生成模型Veo，被外界認為是對标OpenAI旗下同類型的文生圖模型DALL.E3和文生視訊模型Sora。

過去一年來，谷歌在AI方面屢遭質疑，尤其是去年底的大模型Gemini 1.0造假翻車事件讓這家公司一度陷入信任危機，但谷歌對AI持續投入的步伐并未減速。從最新的季度财報來看，谷歌在搜尋、YouTube和雲業務方面都獲得了強勁的增長，而按照皮查伊的說法，公司通過廣告、雲服務和訂閱計劃等清晰的路徑來實作AI突破的盈利化。

目前來看，OpenAI與谷歌的此次AI大戰難分高下，誰帶來的驚喜更大，外界衆說紛纭，但可以确定的是，這場AI角逐的主角不僅僅是OpenAI和谷歌。

再過幾天，投資OpenAI的微軟即将舉行Build年度開發者大會，AI毫無疑問也将是重頭戲。此外，6月10日，蘋果将舉辦一年一度的全球開發者大會，Siri語音助手的更新是目前外界聚焦的重點。最近一段時間，關于蘋果牽手OpenAI、談判谷歌的傳聞不斷，硬體王者的蛋糕将被誰拿下，或許将重塑整個行業的競争格局。

OpenAI的“雙重挑戰”：谷歌全面反擊，首席科學家出走

繼續閱讀

人類文明能永存嗎？科學家：有五種威脅，随時可能滅絕人類

科學家：除地球外太陽系還有6個星球或有生命，這下太陽系熱鬧了

大新聞！李昌平領銜頂尖科學家聯名上書，誓要調查轉基因食品問題

OpenAI回應“封嘴”離職條款；滴滴程維：柳青升任永久合夥人，公司不再設總裁崗位；NetBSD禁止AI生成代碼 | 極客頭條

OpenAI員工離職遭“封口”、核心安全團隊解散，Altman下場緊急回應：确有協定，但從未實行過！

1922年，一名25歲的花季少女因為牙疼去看病，當醫生輕輕觸碰牙齒時，她的下颚骨居然像灰燼一樣全部粉碎，僅4個月後就不幸

快來看，北宋科學家看不上唐朝文人！

地球有八千米的高山，有萬米深的海溝，科學家為什麼還說地球很圓

範圍達到了18億光年，英國科學家發現宇宙冷斑，來自其他宇宙？

聊聊OpenAI最新釋出的GPT 4o

OpenAI驚變！首席科學家突然離職！王煜全獨家分析！

OpenAI官宣啟動“下一代前沿模型”訓練！訓練參數預計将得到更大提升，或整合“文生視訊”模型Sora

OpenAI前董事揭示奧特曼罷免内幕：董事會是從X上知道ChatGPT已釋出的

全是“自己人”！OpenAI緊急成立“安全委員會”，距離“超級對齊”團隊解散不到半月，90天後将迎首次安全“大考”

OpenAI陷史上最大公關危機，掌門人奧特曼捐出一半身家幫公司渡難關

吉利高管炮轟比亞迪：還是實在一點好老一輩科學家也會這麼想