天天看點

OpenAI模型終于更新!強大視聽能力的GPT-4o将面向所有使用者

作者:漫威電影情報局

編輯 | 伊風

出品 | 51CTO技術棧(微信号:blog51cto)

春季終于如約而至!GPT系列的模型終于等到了久違的更新——GPT-4o浮出水面。

而且此前頗具神秘氣息的“im-also-a-good-gpt2-chatbot”,正是其測試版本。

本場更新并未見到奧特曼的身影,而是由OpenAI CTO 穆裡-穆拉提(Muri Murati)主持。此前她曾因為在采訪中對OpenAI的訓練資料語焉不詳而受到過一些争議。

OpenAI在春季釋出上都說了啥呢?一句話概括,GPT-4o更快、更多模态、而且更加便宜了!

OpenAI模型終于更新!強大視聽能力的GPT-4o将面向所有使用者

圖檔

1.最新模型GPT-4o

讓奧特曼直呼“amazing work”的模型更新來了!

OpenAI模型終于更新!強大視聽能力的GPT-4o将面向所有使用者

圖檔

可以看到GPT-4o的性能一騎絕塵。(題外話,通義千問大模型在這張圖的右側默默上榜了)。

新的大型語言模型是在網際網路的海量資料基礎上訓練出來的,将更擅長處理文本和音頻,并可處理 50 種語言。

OpenAI 更新的 GPT-4o 生成式人工智能模型,将在未來幾周内正式面向開發者和消費者推出。新模型将面向所有使用者,穆拉提補充說,付費使用者将繼續 "擁有五倍于免費使用者的容量限制"。

OpenAI 首席技術官穆裡-穆拉提(Muri Murati)說,GPT-4o 提供了 "GPT-4 級 "的智能,但改進了 GPT-4 在文本、視覺和音頻方面的能力。

"穆拉提在 OpenAI 辦公室舉行的主題演講中說:"GPT-4o 的優勢在于它能跨越語音、文本和視覺。"這一點非常重要,因為我們正在展望人類與機器互動的未來。

GPT-4是OpenAI之前的領先模型,它是由圖像和文本組合訓練而成的,可以分析圖像和文本,完成從圖像中提取文本甚至描述圖像内容等任務。但 GPT-4o 在此基礎上增加了語音功能。

這吻合了此前大家猜測的方向:“ChatGPT+Voice Agent”!

OpenAI模型終于更新!強大視聽能力的GPT-4o将面向所有使用者

英偉達的科學家Jim Fan在更新直播前的預測

2.GPT-4o強大的“視聽”能力

OpenAI 首席執行官山姆-阿爾特曼(Sam Altman)釋出消息稱,該模型是 "原生多模态 "的,這意味着該模型可以生成内容或了解語音、文本或圖像指令。

GPT-4o在語音方面具體可以實作什麼呢?

GPT-4o 極大地改善了 ChatGPT 的體驗--ChatGPT 是 OpenAI 的病毒式人工智能聊天機器人。ChatGPT 長期以來一直提供語音模式,使用文本到語音模型轉錄 ChatGPT 中的文本。但 GPT-4o 對此進行了改進,讓使用者可以更像使用助手一樣與 ChatGPT 互動。

例如,使用者可以向由 GPT-4o 支援的 ChatGPT 提問,并在 ChatGPT 回答時打斷它。OpenAI 表示,該模型可以提供 "實時 "響應,甚至可以捕捉使用者聲音中的情感,并生成 "一系列不同情感風格 "的語音。

GPT-4o 還提高了 ChatGPT 的視覺能力。如果給定一張照片或一個桌面螢幕,ChatGPT 現在可以快速回答相關問題,從 "這個軟體代碼是怎麼回事 "到 "這個人穿的是什麼牌子的襯衫?"

"穆拉提說:"我們知道這些模型越來越複雜,但我們希望互動體驗實際上變得更加自然、輕松,讓你完全不用關注使用者界面,而隻關注與 [GPT] 的協作。

OpenAI 聲稱,GPT-4o 的多語言性也更強,在 50 種不同語言中的性能都有所提高。Altman 在 X 上補充說,想要使用 GPT-4o 的開發者可以通路 API,其價格是 GPT-4-turbo 的一半,速度是 GPT-4-turbo 的兩倍。

3.寫在最後

OpenAI具有強大音頻能力的模型GPT-4o的推出,讓我們進一步看到了虛拟助手的未來。

有知情的科技部落客表示,此時的釋出也是OpenAI和蘋果已經達成交易的信号。這意味着Siri的未來可能是由ChatGPT進行支援的!

OpenAI模型終于更新!強大視聽能力的GPT-4o将面向所有使用者

圖檔

如果OpenAI與微軟、蘋果都牽起了手,那麼谷歌這個"AI屆汪峰"真的要陷入孤軍奮戰的尴尬中了。

明天,谷歌的開發者大會将如約而至。OpenAI 趕在此時釋出産品更新頗有些搶奪谷歌風頭的意思!

那麼,你認為谷歌釋出什麼産品才可以為自己扳回一局呢?

參考連結:

1.https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/

2.https://www.theverge.com/2024/5/13/24155493/openai-gpt-4o-launching-free-for-all-chatgpt-users?showComments=1

來源: 51CTO技術棧

繼續閱讀