天天看點

OpenAI的“雙重挑戰”:谷歌全面反擊,首席科學家出走

作者:國際金融報

OpenAI剛釋出新旗艦模型GPT-4o沒多久,風頭很快就被谷歌蓋過去了。

OpenAI的“雙重挑戰”:谷歌全面反擊,首席科學家出走

當地時間5月14日,谷歌I/O開發者大會正式召開,并釋出了一系列AI應用在内的“全家桶”,其中多款産品被認為是正面對标OpenAI。谷歌CEO皮查伊表示,當天的釋出會一共提到了121次AI,足以顯示谷歌對AI的重視程度。

反觀被“針對”的OpenAI,一場人事變動正在上演。當地時間5月14日,OpenAI聯合創始人、首席科學家伊爾亞·蘇茨克維(Ilya Sutskever)宣布決定離開OpenAI。幾個月前,圍繞着OpenAI聯合創始人兼首席執行官山姆·奧特曼(Sam Altman)的罷免事件中,這位科學家曾被視為關鍵人物,而随着Sam Altman的回歸和董事會改組,OpenAI的權力鬥争落幕,也使得Sutskever如今的出走顯得沒有那麼“意料之外”。

關鍵人物離開OpenAI

包括Sam Altman在内的一衆OpenAI高管和Ilya Sutskever上演了一場體面的“分手”。

作為聯合創始人和首席科學家,在加入OpenAI近十年後,Ilya Sutskever決定離開。他在社交平台上發文稱,OpenAI的發展軌迹堪稱奇迹,并提及到了OpenAI的現任管理層,表示在他們的上司下,OpenAI将打造出安全有益的AGI。

OpenAI的“雙重挑戰”:谷歌全面反擊,首席科學家出走

Sam Altman很快作出回應,稱Ilya Sutskever是“我們這一代最傑出的思想家之一,是我們領域的引路人,沒有他,OpenAI不會有今天的成就”。在肯定了Ilya Sutskever的能力和表達感謝之後,Sam Altman對外公布了首席科學家這個職位的繼任者:Jakub Pachocki。從其履曆來看,這位科學家自2017年加入OpenAI,曾擔任OpenAI研究總監,Sam Altman曾盛贊他在GPT-4開發中的上司力和技術能力。

OpenAI的“雙重挑戰”:谷歌全面反擊,首席科學家出走

值得一提的是,在去年11月轟轟烈烈的高層動蕩中,OpenAI CEO Sam Altman和總裁Greg Brockman離開公司後不久,有三名OpenAI進階研究人員也宣布辭職,其中之一便是Jakub Pachocki。

如今再回過頭看,幾個月前的所謂“宮鬥”事件發展及後續處理也為如今Ilya Sutskever的出走埋下了伏筆。

去年11月中旬,Sam Altman被宣布解除CEO職位并離開董事會,Greg Brockman随後也主動宣布辭去總裁職務,一時間輿論嘩然。随後幾天内,在外部投資者和内部員工的雙重施壓之下,這兩位高管風光回歸OpenAI并複職。

在這場“鬥争”中,Ilya Sutskever曾聯合董事會成員反對Sam Altman,進而被外界認為是“話事人”,在Sam Altman回歸之後,Ilya Sutskever表示對參與董事會行動而深感後悔。權力鬥争落幕之後,OpenAI董事會進行了改組,由原先的6人縮減為3人,Ilya Sutskever也由此不再在董事會任職。

伴随着這起高層動蕩,外界對OpenAI内部的人工智能技術路線之争進行了一場持久而全面的讨論。作為機器學習領域的頂尖學者,Ilya Sutskever主張謹慎、重視風險與安全問題,被認為是“科學保守”的那一派。此外,OpenAI内部的一個意在解決超級智能的對齊問題的超級對齊Superalignment團隊中,Ilya Sutskever亦是上司者之一。

Ilya Sutskever暫時沒有透露其“下家”的具體細節,僅提及“這個項目對我個人意義重大”。而對Sam Altman和OpenAI來說,随着谷歌等商業公司對AI的持續加碼,不斷推出具有強大競争力的工具和應用,作為非營利機構的OpenAI如何處理創立初衷和商業化發展,仍是其需要持續面對的問題。

谷歌來勢洶洶

如果說首席科學家的出走是意料之中的正常人事變動,那麼外部商業巨頭的快速發展對OpenAI帶來的挑戰或許更加嚴峻。

當地時間5月13日,OpenAI舉行了一場線上直播,沒有GPT-5,也沒有搜尋引擎,OpenAI釋出了GPT-4o,“o”意為“omni”,也就是“全能”的意思。根據官方介紹來看,GPT-4o是朝着更自然的人機互動邁出的一步——它接受文本、音頻、圖像和視訊的任何組合作為輸入,并生成文本、音頻和圖像輸出的任何組合。

與現有模型相比,GPT-4o在視覺和音頻了解方面尤為更好。在反應速度上,GPT-4o可以在短短232毫秒内響應音頻輸入,平均響應時長320毫秒,類似于對話中的人類響應時間。在GPT-4o之前,使用者使用語音模式和ChatGPT通話時,延遲時間平均為2.8秒(GPT-3.5)和5.4秒(GPT-4),可見其跨越性的發展。而且,GPT-4o的價格還便宜50%。

一天之後,谷歌在開發者大會上釋出了一系列基于Gemini的AI功能及産品。這不免讓外界聯想到,今年2月15日,谷歌釋出多模态大模型Gemini 1.5 Pro當天,OpenAI就釋出了文生視訊模型Sora,幾乎搶走了谷歌的所有風頭。

此次,谷歌進行了全面反擊,推出了Gemini 1.5 Flash,這是谷歌Gemini系列模型中的最新成員,也是通過API提供的速度最快的Gemini模型,比1.5 Pro更輕量級,且在處理大量資訊時具有強大的多模态推理能力。谷歌還大幅改善了1.5 Pro,除了上下文視窗将從100萬token更新至200萬token,還提升了模型的代碼生成、邏輯推理與規劃、多輪對話以及音頻和圖像了解能力。如今,谷歌已經将1.5 Pro整合到Google産品中,包括Gemini Advanced和Workspace應用程式。

OpenAI的“雙重挑戰”:谷歌全面反擊,首席科學家出走

而對标GPT-4o,谷歌DeepMind也首次對外推出了通用AI智能體“Astra”。從谷歌官方展示的視訊來看,Astra可以通過視訊畫面接受資訊,進行識别并做出回應。不過,谷歌方面也表示:“雖然我們在開發能夠了解多模态資訊的AI系統方面取得了驚人的進步,但要将回答時間縮短到可對話的程度,仍是一項非常艱巨的工程挑戰。”

此外,谷歌宣布了一系列與圖像、音樂、視訊有關的生成式AI工具,包括文生圖工具Imagen 3、與Youtube以及音樂家合作的“AI音樂沙盒”和最新的視訊生成模型Veo,被外界認為是對标OpenAI旗下同類型的文生圖模型DALL.E3和文生視訊模型Sora。

過去一年來,谷歌在AI方面屢遭質疑,尤其是去年底的大模型Gemini 1.0造假翻車事件讓這家公司一度陷入信任危機,但谷歌對AI持續投入的步伐并未減速。從最新的季度财報來看,谷歌在搜尋、YouTube和雲業務方面都獲得了強勁的增長,而按照皮查伊的說法,公司通過廣告、雲服務和訂閱計劃等清晰的路徑來實作AI突破的盈利化。

目前來看,OpenAI與谷歌的此次AI大戰難分高下,誰帶來的驚喜更大,外界衆說紛纭,但可以确定的是,這場AI角逐的主角不僅僅是OpenAI和谷歌。

再過幾天,投資OpenAI的微軟即将舉行Build年度開發者大會,AI毫無疑問也将是重頭戲。此外,6月10日,蘋果将舉辦一年一度的全球開發者大會,Siri語音助手的更新是目前外界聚焦的重點。最近一段時間,關于蘋果牽手OpenAI、談判谷歌的傳聞不斷,硬體王者的蛋糕将被誰拿下,或許将重塑整個行業的競争格局。

繼續閱讀