天天看點

谷歌對壘OpenAI

谷歌對壘OpenAI

全天候科技

2024-05-17 17:06釋出于上海全天候科技官方賬号

近幾天,科技圈最大的新聞莫過于OpenAI和谷歌這兩場釋出會。

24小時之内,OpenAI、谷歌這兩家AI巨頭相繼亮劍。

5月14日,OpenAI CEO Sam Altman親自下場造勢,在20多分鐘的釋出會中,用全新的多模态模型GPT-4o喚醒了人們對電影《Her》中人工智能系統“薩曼莎”的幻想。

次日,谷歌宣布更新Gemini,推出“AI全家桶”,推出內建AI的搜尋引擎,用AI重塑Android。它試圖借此重振旗鼓,搶回AI賽道上的主動權。過去一年多裡,OpenAI多次截胡谷歌,搶在谷歌之前釋出新技術、産品。

無論是雙方在技術上的比拼,還是OpenAI牽手蘋果,都表明,OpenAI這家AI屆的當紅明星都對谷歌造成了前所未有威脅。

當然,手握搜尋入口、安卓生态王牌的谷歌的護城河在短期内難以攻破。然而在颠覆産業格局的AI時代裡,面對後浪的追趕,谷歌等科技巨頭不能松懈,否者,便是一個時代的遠去。

交戰

盡管被OpenAI搶占了先機,但谷歌顯然是有備而來。

OpenAI推出能說會道的GPT-4o,谷歌也有自己的薩曼莎——Project Astra。

“我腦海中已經有這個願景很長一段時間了。”谷歌DeepMind的負責人、谷歌人工智能工作負責人Demis Hassabis說。這些年,他一直在思考和研究人工智能,思考如何讓機器更像人。

在他的設想中,一個人工智能Agent必須能像人一樣了解并對複雜靈活的世界做出回報。它要能看到文本并且有所反應,并且必須有主動性、可被教育的而且有個性,是以能自然地,沒有延遲地和它交談。最終,這些所有的想象就成了Project Astra。“就是那個幫手,”Hassabis說,“它很有用,你已經習慣它在你需要的時候一直在那裡。”

從示範視訊來看,Project Astra與Hassabis的設想顯然還有距離。甚至與GPT-4o相比,延遲也更高,交流仍然不夠自然。但當Project Astra準确說出“眼鏡在書桌上,紅色蘋果旁邊”時,還是獲得了在場觀衆的驚呼聲。

Project Astra的出現,也被視作是對GPT-4o的正面回應。

這并非是OpenAI和谷歌的第一次正面交戰。今年2月,在谷歌釋出會一周後,OpenAI悄無聲息抛出重磅炸彈,推出了首款文本轉視訊模型——Sora。盡管Sora至今未曾開放使用,仍然給整個科技圈帶來了震撼。

對于OpenAI扔下的這顆炸彈,谷歌同樣在開發者大會上給出反擊,釋出了AI媒體創作模型Veo。據介紹,Veo能夠生成高品質的1080p視訊,并且依托于Imagen 3這一最新的文本到圖像架構。這些AI生成的視訊可以持續超過一分鐘,Veo還能夠了解電影制作和視覺技術的專業概念,如延時拍攝等。

不僅如此,谷歌将Gemini內建到了旗下幾乎所有産品之中,尤其是其優勢業務——搜尋,将搜尋能力變得更為強大。

盡管兩場釋出會,一個僅有20多分鐘,一個長達2小時,對兩家公司而言,卻是一次技術上的巅峰對決。

焦慮

兩大AI巨頭貼身肉搏背後,是AI廠商的商業化焦慮。

2015年,名不見經傳的OpenAI在矽谷成立。彼時,它還是一家非營利機構。依靠着微軟的10億美元投資,過着掃地僧的生活。

自2022年11月,ChatGPT問世後,OpenAI一炮打響,商業化程序也不斷加速。2024年4月,OpenAI的COO稱,目前企業版ChatGPT的注冊使用者超過60萬,而今年1月這一數字為15萬多。

受惠于企業對AI技術的需求,消息稱,OpenAI2023年年收入已過20億美元。

在這場由ChatGPT引發的AI熱浪下,國内外科技大廠紛紛坐上牌桌。

2023年2月6日,谷歌宣布推出對話式生成人工智能聊天機器人Bard,這是谷歌旗下大模型Gemini的前身;Meta則官宣釋出Llama;同年3月,美國公司Anthropic推出Claude;國内公司也立馬跟上,百度釋出文心一言,阿裡推出通義千問,華為旗下則是盤古,商湯也上新日日新。

科技大廠紛至沓來,OpenAI想要走通商業化之路,搶占先機,就必須保證其技術上的領先,不斷推出新的更強大的模型。不過,目前看來,這一路徑變得更加艱難。

經過一年多的發展,各廠商相繼推出了對标GPT-4的大模型。

更具挑戰的是,OpenAI疊代的速度開始變慢了。從第一代ChatGPT到ChatGPT的釋出,OpenAI隻用了4個多月。但距離ChatGPT-4釋出已經過去1年多,衆人期待的ChatGPT-5仍未現身。GPT-4o的确令人印象深刻,但還不足以給整個行業帶來足夠的驚豔。

當然,OpenAI變慢,主要受制于大模型疊代的客觀規律。越大越強的模型,資料和算力需求就更高。最終,這些都轉化成OpenAI的成本壓力。

相比于OpenAI龐大的研發成本,超20億美元的年收入依舊是杯水車薪。Sam Altman表示,由于建構和運作其模型的成本高昂,OpenAI仍然處于虧損狀态。随着OpenAI開發更複雜的模型,預計支出将繼續超過收入增長。OpenAI可能還需要籌集數百億美元才能滿足這些成本。

除了外部競争,OpenAI還要面臨“内憂”。5月15日,自去年年底“宮鬥”事件之後就未曾露面的Ilya Sutskever官宣離開,表示自己已經有了下一個計劃,但目前還不能透露細節。

作為OpenAI的聯合創始人和首席科學家,Ilya Sutskever主導了GPT系列大模型以及DALLE系列模型的研發。盡管不曾出席GPT-4o的釋出會,但在GPT-4o首頁上,Ilya的名字出現在“額外上司者”一欄。Ilya Sutskever的離開,對OpenAI商業化的影響,仍然難以判斷。

追趕

當技術之間的差距逐漸縮小,AI廠商之間的競争也步入下半場。

在兩場釋出會上,OpenAI和谷歌默契地開始關注端側。GPT-4o推出Mac版本應用,谷歌則用Gemini重塑Android。

中國銀河證券分析認為,GPT-4o釋出預示着AI Agent新一輪競争序幕即将拉開,疊加macOS桌面版ChatGPT內建,端側AI革命在即,此外B端企業服務市場可能會因為GPT-4o的易用性和普惠性而迎來新的增長機遇。

新的商機下,誰能搶得先機,占領更多終端,誰就能先行占有市場。

在這方面,谷歌擁有天然的優勢。谷歌旗下擁有谷歌搜尋、Gmail、Youtube、Chrome浏覽器等一系列應用,建構了強大的生态。

相較之下,作為第一個推出大模型的公司,盡管OpenAI在AI紅利之下,創下了一系列記錄。其使用者體量和谷歌相比,仍然有着不小差距。

Similarweb統計資料顯示,ChatGPT今年4月全球通路量為18億次,相比3月有所上升。與此同時,盡管谷歌4月的通路量相比3月有所減少,但仍達到了834.9億次。

更不用說,谷歌還擁有Android。在今年開發者大會上,谷歌對Android Studio進行了更新,內建了更多AI功能,友善開發者調用Gemini API進行軟體開發。

英偉達人工智能工作室負責人Jim Fan表示,谷歌做對了一件事,他們終于努力将人工智能整合到搜尋框中。在他看來,分發是谷歌的護城河。在這一背景之下,Gemini不一定要做世界上最好的模型,就可以成為世界上使用量最多的模型。

在OpenAI和谷歌的這場戰争中,谷歌擁有Android等一系列産品,而OpenAI缺一個蘋果。

作為2023年手機出貨量一哥,去年一年裡,iPhone出貨量達到了2.346億台,市場佔有率為20.1%。如果OpenAI旗下大模型真能取代“Siri”,成為搭載在數億蘋果裝置上的AI 智能助手,在搜尋體驗、效率提升上颠覆現有生态,對于OpenAI而言,或許一切将變得不同。

繼續閱讀