天天看點

速遞|剛剛,OpenAI 釋出了進階語音模式!

OpenAI 剛剛宣布了一個令人興奮的新功能——進階語音模式(AVM),這标志着人工智能在語音互動領域的又一次進步。AVM 利用 GPT-4o 的原生音頻技術,為使用者提供更加自然和實時的對話體驗。
速遞|剛剛,OpenAI 釋出了進階語音模式!

周二,OpenAI 宣布向更多 ChatGPT 付費使用者推出“進階語音模式”(Advanced Voice Mode,簡稱 AVM )。

目前,OpenAI 提供了兩種類型的語音對話 —— 标準語音和進階語音:

1)進階語音:目前正在向 Plus 和 Team 使用者逐漸推出。該功能使用 GPT-4o 的原生音頻技術,能夠實作更加自然的實時對話,并捕捉非語言線索(例如語速),還能作出情感化的回應。

Plus 和 Team 使用者每天對進階語音的使用量有限制,包括語音輸入和輸出。企業版和教育版的使用者将在下周開始獲得該功能。

2)标準語音:适用于所有登入 ChatGPT的使用者,并可以通過 iOS、macOS 和Android 應用使用。

标準語音通過多種模型生成響應,包括将語音轉錄為文本,再傳遞給模型進行回答。

盡管标準語音不像進階語音那樣具備原生多模式功能,但它仍然使用 GPT-4o 和 GPT-4o mini。需要注意的是,标準語音中的每一次提示都會計入消息限制。

要開始語音對話,需要選擇螢幕右下角的“語音”圖示:

速遞|剛剛,OpenAI 釋出了進階語音模式!

當開始進階語音對話時,使用者将被帶到一個螢幕,螢幕中心有一個藍色球體:

速遞|剛剛,OpenAI 釋出了進階語音模式!

AVM 将在一周内逐漸向所有 Plus 和 Team 使用者推送。在等待期間,OpenAI 還增加了“自定義指令”、記憶功能、五種新語音和改進的口音支援,還可以用超過 50 種語言說“抱歉,我遲到了”。

此外,ChatGPT 還新增了五種可供使用者體驗的語音:Arbor、Maple、Sol、 Spruce 和 Vale,加上之前的 Breeze、Juniper、Cove 和 Ember,ChatGPT 語音總數達到了九種,幾乎趕上了谷歌 Gemini Live 的數量。

  1. Arbor – 随和且多功能
  2. Breeze – 生動活潑
  3. Cove – 沉着且直接
  4. Ember——自信而樂觀
  5. Juniper – 開放而樂觀
  6. Maple——開朗、坦誠
  7. Sol – 精明且放松
  8. Spruce——冷靜而肯定
  9. Vale——聰明且好奇

OpenAI 表示,自從 AVM 的有限 alpha 測試釋出以來,已經進行了多項改進。據稱ChatGPT的語音功能現在對口音的了解能力更強,且對話更加順暢和迅速。

OpenAI 還将 ChatGPT 部分定制功能擴充到了 AVM,包括“自定義指令”,允許使用者個性化 ChatGPT 的響應方式,以及“記憶功能”,讓 ChatGPT 能夠記住之前的對話以供以後參考。

本文由人人都是産品經理作者【江天 Tim】,微信公衆号:【有新Newin】,原創/授權 釋出于人人都是産品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協定。

繼續閱讀