天天看點

人工智能也能提供“情緒價值”了,OpenAI釋出全新大模型GPT-4o

作者:現代快報

中原標準時間5月14日淩晨,全球知名人工智能研究機構OpenAI在其春季釋出會上宣布,正式推出全新多模态大模型GPT-4o。這一革命性的産品标志着生成式AI領域的新突破,為使用者帶來了前所未有的互動體驗。GPT-4o以其強大的文本、音頻、圖像處理能力,以及快速響應和免費開放的特點,迅速引發了業界的廣泛關注。

人工智能也能提供“情緒價值”了,OpenAI釋出全新大模型GPT-4o

響應速度僅232毫秒,聊天堪比真人

GPT-4o作為OpenAI的最新旗艦産品,其名稱中的“o”代表“omni”,意為“全能的”。這款模型不僅支援文本輸入,還能接受音頻和圖像的任意組合作為輸入,并生成相應的文本、音頻和圖像輸出。這一特性使得GPT-4o在人機互動方面展現出了極高的靈活性和适應性。

在釋出會上,OpenAI展示了GPT-4o的實時互動能力。無論是語音輸入還是圖像識别,GPT-4o都能在短時間内給出準确的回應。使用者能夠像與助手互動一樣自然地使用ChatGPT,也可以在ChatGPT回答問題時中斷它。而且,新模型能夠捕捉到使用者聲音中的情感,并以不同的情感風格生成語音,如同真人一般。

特别是音頻輸入方面,GPT-4o的響應速度僅為232毫秒至320毫秒,與人類對話反應速度相當。這種近乎實時的互動體驗,使得GPT-4o在語音助手、智能客服等領域具有巨大的應用潛力。

人工智能也能提供“情緒價值”了,OpenAI釋出全新大模型GPT-4o

舉個例子,在OpenAI釋出的示範視訊中,當使用者将鏡頭對準了生日蛋糕和蠟燭,GPT-4o能快速反應出他們在過生日。而當使用者提出希望聽到生日祝福歌時,GPT-4o能夠像真人一樣唱歌,且語氣俏皮不生硬。

值得一提的是,GPT-4o将對所有使用者免費開放。這一舉措無疑将大大降低AI技術的使用門檻,使得更多的人能夠體驗到AI技術帶來的便利。同時,OpenAI還為Plus使用者提供了額外的福利,包括5倍的調用額度等。

GPT-4o的強大功能得益于其跨文本、視覺和音頻的端到端訓練方式。這意味着所有輸入和輸出都由同一個神經網絡處理,進而實作了高效的資訊整合和生成。這種訓練方式不僅提高了模型的性能,還使得GPT-4o在圖像和音頻了解方面表現尤為出色。

CEO山姆·奧特曼表示,最初的 ChatGPT展示了語言界面的雛形,而新的ChatGPT則給人截然不同的感覺。“它快速、智能、有趣、自然,且有用。”

“對我來說,與電腦交談從來沒有真的自然過,而現在卻很自然。我真的看到了一個令人興奮的未來,在這個未來,我們可以使用計算機做比以往更多的事情。”奧特曼說。

GPT-4o或引發AI應用新風口

這款多模态大模型在文字、語音和視訊方面取得了顯著突破,極大地提升了AI的應用潛力。GPT-4o的推出或将加速AI應用的落地程序,推動AI技術向更廣泛的領域滲透。同時,GPT-4o的多模态互動能力也将為AI技術帶來全新的發展機遇和挑戰。

人工智能也能提供“情緒價值”了,OpenAI釋出全新大模型GPT-4o

矽谷連續創業者、Traini創始人及CEO孫鄰家在接受第一财經記者采訪時表示,OpenAI的最新釋出将互動方式進行了更新、變革。“語音正在成為一個較穩定的接口,擴寬人類與産品互動的實體邊界。而且與GPT實時對話時,GPT能富有情感地回應,這個很酷,之前AGI是缺乏情感的。”他還表示,人工智能(AI)領域正在往AI應用方向發展,将給生活創造真實價值。

然而,也有人對GPT-4o的未來發展持謹慎态度。他們認為,雖然GPT-4o在技術上取得了重大突破,但在實際應用中仍需要解決一些問題和挑戰。例如,如何確定GPT-4o在處理使用者資料時的隐私安全、如何避免GPT-4o的誤判和誤導等。

對此,OpenAI表示,為GPT-4o“建立了新的安全系統,為語音輸出提供保護”。GPT-4o還與社會心理學、偏見和公平性以及錯誤資訊等領域的70多名專家進行了廣泛的外部評估,以确定新增加的模型會帶來或放大哪些風險。

針對可汗學院的可汗使用GPT-4o輔導他兒子做數學題的示例,人工智能軟體開發人員麥凱·瑞格利(Mckay Wrigley)在社交平台X上寫道:“這個示範太瘋狂了。學生與GPT-4o共享iPad螢幕,人工智能與他們對話,實時幫助他們學習。想象一下,如果世界上每個學生都能這樣學習,未來是如此的光明。”

有網友覺得OpenAI進一步拉開了和蘋果的差距,認為GPT-4o“功能秒殺Siri”。

不過,據外媒報道,蘋果公司已接近與OpenAI達成協定,今年将後者的部分技術引入iPhone,提供由ChatGPT支援的“聊天機器人”作為iOS 18中人工智能功能的一部分。

不過,蘋果同時還與谷歌就授權Gemini聊天機器人進行了談判。而谷歌将在OpenAI此次春季更新釋出會之後一天舉行I/O開發者大會,谷歌在大會的官方博文中曾提到“Gemini 時代”,預計将會釋出Gemini大模型的最新動态。

現代快報/現代+記者 龍秋利 綜合

繼續閱讀