天天看點

颠覆未來:ChatGPT 4o 如何徹底改變人機互動的規則

作者:人人都是産品經理
人機互動(HCI)是現代科技發展的核心領域之一。随着技術的不斷進步,人機互動的形式也在不斷演變。從早期的指令行界面,到圖形使用者界面(GUI),再到今天的語音互動和聊天機器人(chatbot),人機互動的方式變得越來越自然、直覺。作為一名早期的AI産品經理,我在人機互動,特别是自然語言處理(NLP)相關産品和語音互動,以及智能助手的産品設計和互動體驗設計方面有着濃厚的興趣。今天,我想圍繞剛剛釋出的ChatGPT 4o,和大家探讨一下人機互動的未來。
颠覆未來:ChatGPT 4o 如何徹底改變人機互動的規則

一、多模态互動的設計

傳統的語音助手主要依賴于單一的語音輸入和輸出。然而,随着技術的發展,多模态互動設計逐漸成為主流。這種設計結合了語音、視覺、觸控等多種輸入輸出方式,使人機互動更加自然和高效。例如,早期的多模态互動設計中,使用者可以通過語音指令控制智能家居裝置,同時通過智能手機或平闆上的應用界面進行更詳細的設定。這種方式在一定程度上提高了使用者體驗,但仍然存在不少局限性。

二、ChatGPT 4o:真正實作的多模态人機互動

今天,OpenAI剛剛釋出了ChatGPT 4o,這是一次真正意義上的多模态人機互動的突破。作為一個久未發表文章的從業者,我對這個技術進步深感振奮,迫不及待地想和大家分享我的想法。

ChatGPT 4o的示範效果令人驚歎。它不僅能夠實作無延遲的回複,還可以自然地被使用者打斷,同時處理多個任務。具體來說,ChatGPT 4o具備以下幾個顯著特點:

  • 無延遲回複:使用者在與ChatGPT 4o互動時,幾乎感覺不到任何延遲。它能夠實時處理使用者的輸入,迅速給予回報。
  • 多任務處理:ChatGPT 4o能夠同時處理多個任務,使用者可以在一個對話中切換不同的話題,系統仍能保持連貫性。
  • 視覺記憶與語言相容:ChatGPT 4o可以結合視覺和語言輸入,記憶使用者之前的互動内容,并在适當的時候引用這些資訊。
  • 情感分析與TTS輸出:ChatGPT 4o能夠分析使用者的情感狀态,并通過文本到語音(TTS)技術輸出合适的,帶有情感的語音回應。
  • 無延遲調用裝置功能:ChatGPT 4o能夠無延遲地調用手機攝像頭和電腦桌面資訊,增強了互動的實時性和靈活性。

新的人機互動設計方法

基于ChatGPT 4o的多模态效果,我認為未來的人機互動設計将徹底打破過去的設計理念。

以下是我認為的三種全新的設計方法:

1)無縫會話流:在傳統的人機互動設計中,使用者與系統的互動通常被劃分為多個獨立的會話(Session)。每次新的互動開始時,系統需要重新加載上下文資訊,這不僅增加了系統的負擔,也降低了使用者體驗的連續性和流暢性。未來的設計将注重無縫會話流,確定使用者能夠在不同的話題之間自由切換,而無需重新開始新的Session。

被重新被定義的應用包括,智能助手:使用者可以在與智能助手的對話中無縫切換話題,例如從詢問天氣轉到預定餐廳,系統能夠記住使用者之前的偏好和選擇;語音客服:使用者在與客服機器人互動時,可以中途更改問題或需求,系統仍然能夠保持連貫的上下文了解和響應;教育和教育訓練:在虛拟學習環境中,學生可以随時提出新問題或更改學習主題,而不影響學習進度和系統響應的連續性。

2)多模态記憶系統:未來的多模态人機互動設計将更加注重系統的記憶和了解能力。系統能夠記憶并了解使用者的多模态輸入(例如語音、視覺、觸控),并在後續互動中智能地使用這些記憶資訊,提升互動的個性化和精确性。

被重新被定義的應用包括,個人助理:系統能夠記住使用者的日常習慣和偏好,例如常用的通勤路線、喜愛的音樂類型等,并在适當的時候提供個性化建議;醫療保健:系統能夠記憶患者的健康資料和醫療曆史,提供更加精準的診斷和個性化的治療建議;智能家居:系統能夠記住家中每個成員的偏好和日常作息,自動調整燈光、溫度、音樂等,營造舒适的居住環境。

3)情感與上下文感覺:随着AI技術的發展,未來的系統将更加注重情感和上下文的了解。通過綜合分析使用者的語言和非語言信号(如語調、面部表情、身體姿态等),系統可以提供更加貼心和人性化的服務。

被重新被定義的應用包括,心理健康支援:系統能夠識别使用者的情感狀态,提供及時的心理支援和安慰,甚至建議專業的心理咨詢。早教/老年陪伴:系統能夠感覺孩子的情緒和學習狀态,動态調整互動内容和方式,提升學習和陪伴效果。電商助手:系統能夠分析使用者的情緒,提供更加個性化和 empathetic 的服務,提升客戶滿意度。

結語

雖然ChatGPT 4o的技術進步主要是整合現有的技術,但其互動體驗和流暢度的實作并不容易。當年的iPhone也是整合了多種技術,卻通過出色的設計和優化,帶來了革命性的使用者體驗。

在此之前,我們很少見到如此出色的多模态互動效果展示,OpenAI在這方面依然領先了一大步。我相信,這次釋出會引發的技術革命将導緻新一波AI初創公司湧現,同時也會淘汰一部分無法跟上步伐的企業。

作為一名多年深耕人機互動的的AI從業者,我将持續關注這一領域的新動态,并與大家分享我的見解和思考。

本文由@單赢 原創釋出于人人都是産品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協定。

該文觀點僅代表作者本人,人人都是産品經理平台僅提供資訊存儲空間服務。

繼續閱讀