天天看點

OpenAI大招要來了!AI語音助手狙擊谷歌蘋果,GPT-5年前見

作者:智東西
OpenAI大招要來了!AI語音助手狙擊谷歌蘋果,GPT-5年前見

作者 | 香草

編輯 | 李水青

智東西5月11日消息,今天淩晨,OpenAI宣布将于美國時間13日上午10點(中原標準時間14日淩晨1點)在官網直播,示範ChatGPT、GPT-4的更新内容。

據外媒The Information今日報道,OpenAI正在建構具備音頻和視覺了解能力的AI語音助手,其中一些功能已經開始向客戶展示,可能在下周的釋出活動中預覽。

知情人士消息透露,OpenAI可能會在今年内完成GPT-5的開發并公開釋出。此外,OpenAI還計劃推出一種新的定價模式,客戶通過預付費預定Token,最高可以享受50%的折扣。

此前有多家外媒和部落客曝料,稱OpenAI将在近日釋出AI搜尋引擎。其CEO阿爾特曼對此回應道:“不是GPT-5,也不是搜尋引擎,但我們一直在努力開發一些我們認為會得到喜歡的新東西。”

OpenAI大招要來了!AI語音助手狙擊谷歌蘋果,GPT-5年前見

▲阿爾特曼回應新品示範(圖源:X)

值得注意的是,其競争對手谷歌的I/O開發者大會時間定在美國時間14日上午10點(中原標準時間15日淩晨1點),預計可能釋出Gemini大模型的重要更新。OpenAI此次釋出時間沒有定在之前外媒曝料的5月9日,而是“恰好”卡在I/O大會的前一天,火藥味可謂濃厚。

要知道,這已經不是OpenAI第一次“卡點”狙擊谷歌新品。今年2月,谷歌放出Gemini 1.5 Pro大招,結果沒過幾個小時,OpenAI就掏出文生視訊“王炸”模型Sora,狠狠搶了Gemini 1.5 Pro的風頭。

直播釋出位址:http://openai.com

一、AI語音助手仍存在“幻覺”問題,或将內建至ChatGPT免費版

據The Information報道,阿爾特曼的終極目标是開發出類似電影《她》(Her)中,可高度響應的虛拟助手,提升蘋果Siri等現有語音助手的可用程度。

OpenAI大招要來了!AI語音助手狙擊谷歌蘋果,GPT-5年前見

▲電影《她》劇照

OpenAI認為,具有視覺和音頻功能的AI語音助手具有像智能手機一樣的變革性潛力,理論上其可以做到一系列現在的AI助手無法做到的事,例如充當論文、數學問題指導老師,或是翻譯交通辨別、幫助解決汽車故障等。

但類似的技術目前所需硬體門檻太高,無法在個人裝置上運作,使用者可以在短期内使用基于雲的版本來擷取這些功能,例如自動化客戶服務Agent。

OpenAI目前已經推出具備音頻轉錄、文本轉語音等功能的軟體,不過這些功能是基于獨立的對話AI模型實作,而新的語音助手則将這些功能整合在一起。據知情人士透露,該AI語音助手的音頻功能能夠幫助客服人員更好地了解對方的語氣。

目前尚不清楚OpenAI何時向付費客戶提供這些新功能,但據試用過該語音助手的人士透露,OpenAI最終的計劃是将這些功能都納入ChatGPT免費版本,目标是比目前其最先進模型GPT-4 Turbo的運作成本更低。該人士還談道,AI語音助手在有些類型的問題上回答優于GPT-4 Turbo,但仍然存在幻覺問題。

對此,OpenAI發言人沒有回應置評請求。

二、與谷歌競争iPhone合作位,GPT-5或于年底前釋出

OpenAI推出AI語音助手主要目标是與谷歌競争。

谷歌的AI模型Gemini能實時響應語音指令,并識别圖像、視訊等。不過這些功能目前仍需要研究人員附以圖像和文字說明,且并不能了解許多傳統的語音指令,也不能像Siri和谷歌助手等傳統語音助手那樣與使用者對話。

OpenAI大招要來了!AI語音助手狙擊谷歌蘋果,GPT-5年前見

▲谷歌展示Gemini多模态功能(圖源:谷歌)

另一方面,提高模型的視覺、音頻能力也有助于OpenAI與蘋果達成合作。

最近幾個月,蘋果與OpenAI就下一代iPhone作業系統如何整合OpenAI的模型進行了讨論。然而,與此同時,蘋果也與谷歌進行着類似的談判。

這場競争的最新消息是,據彭博社今早報道,蘋果已接近與OpenAI達成協定,将在下一代iPhone作業系統iOS 18中使用ChatGPT;與谷歌尚未達成協定,但談判仍在進行中。

除了可能在下周推出的AI語音助手外,OpenAI還一直緻力于建構一款AI搜尋引擎,旨在與谷歌競争。此外,其也在開發一種被稱作“計算機使用Agent”的自動化軟體,用來輔助軟體開發和其他計算機任務。

阿爾特曼還在與iPhone開發者喬尼·艾維(Jony Ive)合作開發一款獨立的AI硬體。然而,最先進的AI模型體積龐大,需要在雲端運作,并需要網際網路連接配接才能工作。要使具有視覺和聽覺功能的複雜AI模型變得足夠小巧,以便在裝置上運作,可能需要幾個月甚至幾年的時間。

不過,大家最關心的可能還是GPT-5。據The Information報道,一位接近OpenAI上司人的人士稱,其可能在今年年底完成GPT-5并公開釋出。

OpenAI的新産品和AI模型開發工作進展得如火如荼,與此同時,其此前宣布的一些項目卻變得不再那麼受關注。盡管OpenAI曾向開發者承諾,會在今年第一季度推出GPT Store開發者激勵計劃,但目前仍沒有實作。

三、計劃推出預付費定價模式,最高提供50%折扣

在定價方面,據知情人士透露,OpenAI計劃推出一種新的定價模式,如果客戶通過預付費預定Token,最高可以享受50%的折扣。

這樣的優惠形式在雲計算領域比較常見,微軟Azure、谷歌雲、亞馬遜雲服務(AWS)等都提供提前預定伺服器容量折扣的方式來降低成本。

目前,按需定價提供API(應用程式接口)是OpenAI大模型的主要付費形式,通過每生成100萬Tokens,向開發者收取幾美分至一百多美分不等的費用,其中大客戶可以享受批量折扣。

此前OpenAI已經提供了一種降低開發者成本的方式,其在4月推出Batch API,如果開發者批量上傳模型查詢,并接受等待最長24小時的時間,就可以擷取更低的價格。

Together AI和Anyscale等AI伺服器經銷商曾表示,在他們的軟體上運作開源模型要比使用OpenAI的模型便宜6倍。通過更靈活的定價,OpenAI與其他模型開發商的競争将更具優勢。據透露,其今年的營收可能達到數十億美元。

結語:OpenAI谷歌相争,蘋果微軟得利?

OpenAI與谷歌之間的競争愈發激烈,二者之間的“商戰”火藥味也愈發濃厚。OpenAI又一次将新品釋出時間定在了谷歌重大釋出時間附近,似乎執着于搶奪谷歌風頭這件事。

這一邊,蘋果同時與OpenAI、谷歌商談模型內建至iPhone事宜,再次加劇了兩家公司之間的競争。雖然OpenAI被曝已與蘋果達成合作,但谷歌那邊的談判也仍在繼續。

而另一邊,微軟作為OpenAI最大的财務支援者,可以優先使用其先進技術來改進自己的語音助手。而微軟也并非“孤注一擲”,除了積極自研模型外,還投資了OpenAI有力競對Mistral AI,後者成為第二家在微軟Azure雲平台上提供商業AI模型的公司。

下周的OpenAI新品釋出和谷歌I/O大會,或許會将這場“商戰”推向新高度。究竟誰的“大招”會更厲害,我們拭目以待。

繼續閱讀