天天看點

谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」

谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」

雷科技

2024-05-15 20:13釋出于廣東科技領域創作者

一年一度的Google I/O開發者大會如期而至,在本場釋出會中,谷歌一口氣交出數個AI新品,輪番轟炸我們的視覺神經。

首先是真正意義上的全新産品——Google AI Overviews,這是一項基于大模型技術開發的全新搜尋引擎,旨在以聊天的方式為使用者提供精準、高效的搜尋結果。沒錯,傳聞中OpenAI正集全力要打造的就是這玩意兒。

谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」

(圖源:Google)

同樣與搜尋有關的還有「Ask Photos」,相比起AI Overviews,它更專注于圖像了解與圖像資訊捕捉,這意味着現在你可以通過文字描述的方式,找到藏在相冊裡的那些被遺忘已久的照片。

還記得前天晚上OpenAI釋出的GPT-4o在視覺與聽覺上的巨大提升嗎?谷歌也整了一個相似的AI工具——Project Astra。定位上,Project Astra和GPT-4o都是多模态AI項目,使用者可以利用手機攝像頭和麥克風與現實世界進行互動,例如幫助失明人士識别路上的風景等。

谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」

(圖源:Google)

以上提到的,隻是本場I/O開發者大會上谷歌公布衆多AI新技術的冰山一角,還有更多新玩意值得我們深入探讨。難怪,在這場釋出會後,不少媒體都表示認為谷歌像是要用海量新品「圍剿」OpenAI,重樹谷歌在AI市場的地位。

對轟GPT,谷歌怒發數款AI新品

很顯然,Google I/O 2024最大主角就是「AI」,從硬體到軟體,從服務到功能,幾乎沒有任何一部分離得了AI這個關鍵詞。據不完全統計,這場釋出會上,谷歌至少提了121次「AI」。

既然聊到AI大模型,那還是先看看Gemini又有了哪些新變化。

Gemini Pro從前代的100萬Tokens更新到了200萬Tokens,與月之暗面的Kimi Chat長度相近,但這個模式并非面向所有使用者開放,需要單獨申請。Gemini 1.5推出了Flash版本,支援100萬Tokens,主打一個便宜量大,1M Tokens輸入僅0.35美元、1M Tokens輸出也僅需0.53美元。

谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」

(圖源:Google)

另外,谷歌還宣布Gemini Nano進入手機端,目前它能實作的功能是幫助使用者接打電話、識别電話詐騙和騷擾電話。實話說,Gemini Nano的手機端實用性還是略顯寒酸,甚至連文字處理都不支援,還不如小愛同學來得簡單粗暴。

假如你對Gemini Nano的功能表現不太滿意,也能試試谷歌即将推出的Gemini手機用戶端,它與前天釋出的GPT-4o一樣,都是AI多模态應用,能聽、會讀,還能提供情緒價值。隻是從示範視訊來看,Gemini還不是太「拟人化」。

Gemma2也在這場釋出會上正式登場,作為谷歌下一代開源模型,它更新到了27B規模,和Meta的Llama 3相近,但體積更小些。值得注意的是,Gemma2能夠在NVIDIA的GPU或Vertex AI的單個TPU主機上高效運作。Gemma還迎來了一位新成員:PaliGemma,這是一個開源的圖像輸入模型。

除了Gemini和Gemma的更新之外,基于大模型技術,谷歌還推出了三款全新的AI大模型應用:Imagen 3、Music AI Sandbox、Veo。

谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」

(圖源:Google)

Imagen 3是谷歌最新的畫圖模型,你可以了解為谷歌版本的stable diffusion,即文生圖模型。按照谷歌的說法,Imagen 3相比起前代,在生成速度、生成品質和了解能力上均有較大的提升。

Music AI Sandbox是一款音樂創作大模型,和之前火遍全網的suno差不多,而它的優勢在于創作完成後能夠一鍵上傳至Youtube,這何嘗不是一種生态優勢呢?至于Veo,這是谷歌首款文生視訊模型,對标GPT的Sora,但它時長支援到最高1分鐘、分辨率也支援到1080P,還支援更多濾鏡和電影風格,無論是哪一方面,看起來都比Sora靠譜得多。

不難看出,谷歌目前在AI領域的戰略還是相對穩健,例如模型性能更新,僅從100萬Tokens提升到200萬Tokens,和早前大衆的預期有些差距;而新的AI大模型應用部分,無論是新更新的文生圖模型,還是全新的音樂創作模型、文生視訊模型,都是「守擂」型産品,少了些創意和想象力。但谷歌天然的優勢在于生态,這才是其與OpenAI叫闆的底氣。

AI加入谷歌全家桶

作為目前的網際網路巨頭之一,谷歌的軟體生态、服務生态自然是相當全面的,比如谷歌擁有目前最大使用者數量的浏覽器Chrome,也擁有最完善的Google辦公套件,以及目前最大的移動作業系統生态。現如今,谷歌也正式将AI引入到「谷歌全家桶」中,徹底梭哈AI。

首先,谷歌釋出了全新側欄應用Side Panel,這是一項綜合了谷歌旗下服務的「側邊欄」,當你在Gmail中收到重要資訊時,可以直接在Side Panel中呼出谷歌雲盤存儲資訊,又或是啟動Google Map進行導航,還可以使用谷歌月曆記錄日程等。在谷歌的計劃中,Gmail很快會擁有自動處理重要資訊的能力。

Gmail還加入了智能對話的特性,簡單來說,現在你能夠以對話的方式在郵箱中找到所需要的資訊及相關郵件,還能讓Gemini幫你總結這些郵件說了什麼,甚至還可以讓它幫你智能回複對方,并保持郵件所需的正式用語和語氣。

谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」

(圖源:Google)

其次,前面提到了Gemini将推出手機用戶端,除了能夠和使用者進行普通的對話、文章總結、文字生成等,Gemini還擁有Gemini Live功能,即通過攝像頭和你直接對話。

最後,也是最重磅的——AI Overviews。作為搜尋引擎巨頭,谷歌要如何将大模型融入到搜尋上,這一直是我們所好奇的,就在這場釋出會上,谷歌終于推出了首款AI搜尋大模型AI Overviews。

與Perplexity或Arc Search相比,AI Overviews的優勢在于綜合搜尋能力有了長足的進步,且得益于Gemini的推理能力提升,其獲得的搜尋結果也會更符合使用者的需求。AI Overviews還支援Plan Ahead,即「為你計劃」,盡管AI搜尋隻能幫使用者做搜尋結果的總結,但基于推理能力和決策能力的更新,Plan Ahead能夠為使用者生成各種計劃,例如飲食計劃、健身計劃、旅行計劃等。

谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」

(圖源:Google)

AI Overviews不僅支援文字搜尋,還能通過語音和圖檔進行搜尋,例如當你遇到不認識的植物,那麼僅需拍攝、上傳,就能讓谷歌幫你找出這種植物的相關資料。而這項功能也會與Pixel上的「劃圈即搜」功能相結合,在未來幾個月内上線。

可以說,AI已經成為谷歌幾乎所有業務的核心,除了我們熟悉的大模型應用之外,還在辦公、娛樂領域提供基于Gemini大模型的AI功能,并互相之間有所串聯,提升綜合工作的效率。

One More Thing:神秘AI眼鏡曝光

在示範Project Astra的過程中,除了像OpenAI一樣使用iPhone進行功能展示,還使用了一款智能眼鏡。但與我們之前見到的Google Project Galass不同,這可能是一款全新的智能眼鏡産品。

谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」

(圖源:Google)

初代Google Project Galass誕生于2012年,在那個智能手機還不算普及的年代裡,谷歌就将智能穿戴裝置打造成平民化的消費級産品。但事實上,Google Project Galass受限于産品形态和産品性能,以及相對高昂的售價,一直都不受市場的歡迎,而谷歌也在前幾年宣告這個項目被取消。

Project Astra可能是最适合Google Project Galass的AI形态,一方面,它的互動簡單,無需太多傳感器進行輔助識别;另一方面,它利用大模型的學習、了解、推理能力,能夠簡單地幫助使用者判斷現實世界的物體、景色以及突發事件。

當然,谷歌并沒有真正釋出這款産品,但結合Apple Vision Pro重新帶動虛拟現實(空間計算)市場的熱議來看,谷歌極有可能搶先于蘋果,将AI大模型帶入到穿戴裝置,以快速搶占AR/VR市場。

眼花缭亂的I/O,谷歌真慌了神?

整場釋出會下來,谷歌釋出了非常多的AI新品,涉及到大模型技術的疊代、新AI應用的落地以及開源模型再一次進化。但長達數小時的釋出會加體驗環節,谷歌缺少了一款真正意義上的「爆品」來引起市場的高度關注。

比如,谷歌釋出了一款對标OpenAI Sora的Veo,無論是輸入内容的支援、生成視訊時長還是生成視訊的清晰度,都可以說是「吊打」Sora的存在,但Sora已經搶先于谷歌,引發了市場對文生視訊應用的讨論,這就導緻盡管Veo很牛,可讨論度明顯不足。

谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」

(圖源:Google)

又或者說,谷歌似乎不太懂如何抓住大家的眼球,這從其頻頻翻車的示範也能看出些端倪。還記得Bard首次出現時回答問題錯誤的情況嗎?是的,在這一次AI Overviews的示範上,又一次給使用者錯誤的建議,引起不小的争議。

而谷歌在會上強調了Gemini的「優惠價格」,試圖想要以低價與頭部企業們競争。但現實狀況是,百度文心一言、阿裡通義千問早就開放了長文本閱讀、月之暗面的Kimi也加入了200萬Tokens的免費大戰,就連有些晚來的豆包,也在今日舉行的釋出會上公開了超低價的政策。

創意欠缺、低價拼不過,這就是谷歌在I/O開發者大會上給大家的印象。不過,谷歌最重要的殺手锏仍然是它的AI搜尋,而這項功能是否會讓谷歌實作逆風翻盤,或許還要等到AI Overviews正式上線後才能解答。

檢視原圖 299K

  • 谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」
  • 谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」
  • 谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」
  • 谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」
  • 谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」
  • 谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」
  • 谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」
  • 谷歌怒發十幾款AI新品,但最出圈的話題還是「翻車」

繼續閱讀