天天看點

微軟高管稱即将釋出GPT-4,或實作文本、圖像、語音等多模态運作

據悉,近日,微軟德國首席技術官安德烈亞斯·布勞恩(Andreas Braun)對媒體表示:“我們即将推出 GPT-4,屆時我們将推出多種模态的模型,提供完全不同的可能性,例如視訊。”

即将釋出的 GPT-4,是 OpenAI 建立的預訓練生成模型(Generative Pre-trained Transformer,GPT)的最新版本。作為一種深度學習技術,該系列的模型将通過人工神經網絡實作對包括文章生成、代碼編寫等在内的諸多複雜的自然語言任務的處理。

聊天機器人 ChatGPT 基于 GPT-3.5 架構開發,自推出以來已迅速風靡全球。從理論上說,GPT-4 在技術上将會比 ChatGPT 更進一步。

在大型語言模型中,模态指的是模型能夠處理的輸入類型,包括文本、語音、圖像、視訊等多種輸入源。多模态大型語言模型,意味着其能夠從各種類型的輸入源中擷取資訊并正常運作。

圖丨(來源:Pixabay)

相較于基于文本的以 ChatGPT 為主的單模态大型語言模型,大大增加了從圖像、視訊等内容中擷取資訊的可能性。

據了解,多模态大型語言模型 GPT-4 或将支援文本、圖像、聲音和視訊等四種模态。但由于目前官方尚未公布 GPT-4 的具體細節,是以還不清楚布勞恩在活動上分享的是 GPT-4 特有的多模态,還是其他的多模态。

在微軟德國業務戰略總監霍爾格·肯恩(Holger Kenn)看來,多模态人工智能“不僅可以将文本轉換成相應的圖像,還可以将文本轉換成音樂和視訊”。

經媒體證明,GPT-4 将能夠支援基本上任何一種語言。這也就是說,那些用英語提出問題的使用者,可能會得到日本語的回答。

這聽起來似乎非常奇怪。畢竟使用英語發問的人,怎麼會希望得到日本語的回答呢?這中間的關鍵在于,該模型實作了跨越不同語言進行知識的傳播。

也就是說,如果提問者想要的答案,隻存在于某一種語言中,那麼該模型就能夠将答案自動轉換為提問者在提問時所使用的語言。

除了具有多模态功能以外,GPT-4 還能夠提供比 ChatGPT 生成答案更快的響應速度,并有望提供更加人性化的答案。

值得注意的是,作為一種基于 Web 的語言模型,ChatGPT 目前還沒有移動應用程式,但 OpenAI 可能正在開發支援 GPT-4 的移動應用。

與此同時,據布勞恩透露,GPT-4 還将為生成式人工智能開辟新的企業用例。比如,借助 GPT-4,可用文本形式記錄下語音電話内容,為客服人員等工作者節省接聽電話後再手動輸入關鍵資訊的時間。

微軟德國進階人工智能專家克萊門斯·西伯(Clemens Sieber)對媒體表示:“這可以為荷蘭的一家每天會接到 3 萬個電話的微軟客戶,每天節省 500 個小時的工作時間。”

他進一步介紹說:“有三個比較常見的使用案例,分别是回答隻有員工才能通路的公司知識問題、人工智能輔助的文檔處理,以及通過在呼叫和響應中心處理口語實作的半自動化。”

此外,另據悉,為了提升其所開發的人工智能的可靠性,微軟還正在推進“信心名額”的研究。

該舉措的意義究竟是什麼呢?

具體來說,使用者一般會将人工智能用于了解或查詢自己的資料集上,現在這類模型的準确度已經非常高。但由于模型以生成的方式輸出文本,其準确性還有待進一步探究,是以還需要不斷提高模型的可靠性。

西伯表示:“我們圍繞它建立了一個包含了贊成和反對的回報循環,這是一個疊代過程。”

最後,再來說說微軟和 OpenAI 的關系。自 2019 年以來,微軟一直是 OpenAI 的合作夥伴。前者曾向後者投資過 10 億美元,并在 2023 年初 ChatGPT 大獲成功後,又宣稱将在未來多年裡開展數十億美元的投資。

即便在 GPT-4 即将釋出之際,ChatGPT 的火爆程度依然未曾消減。上周,微軟還宣稱将把 ChatGPT 內建到其 Azure 雲平台中。

據此預測,GPT-4 在未來同樣可能會被內建到微軟的産品中,比如必應聊天機器人。

如今,越來越多的企業希望借助人工智能的蓬勃發展,可以更好地優化生産力和簡化工作流程。而多模态大型神經網絡的發展,既是人工智能發展的一個重要裡程碑,也将指引模型建構者們思考,其究竟是想建立能夠幫助人們過上更好生活的系統,還是開發一種僅用于創造利潤的工具?

是以,從長遠來看,在不斷探索人工智能強大潛力的同時,也應該在監管方面注入更多力量。

參考資料:

https://www.searchenginejournal.com/gpt-4-is-multimodal/481993/

https://www.heise.de/news/GPT-4-is-coming-next-week-and-it-will-be-multimodal-says-Microsoft-Germany-7540972.html

https://techmonitor.ai/technology/ai-and-automation/gpt-4-openai-microsoft-chatgpt

https://www.bigtechwire.com/2023/03/09/gpt-4-microsoft-germany-announces-release-date-of-fourth-generation-large-language-model/

https://www.livemint.com/

https://venturebeat.com/automation/unlocking-the-power-of-cloud-native-observability-to-transform-the-customer-experience/

https://economictimes.indiatimes.com/news/new-updates/openais-gpt-4-to-bring-multimodal-capabilities-with-ai-generated-videos-and-faster-responses-say-reports/articleshow/98579150.cms

繼續閱讀