天天看點

體驗了6款車載智能語音助手後的總結

作者:人人都是産品經理
目前智能汽車可以分為自動駕駛和智能座艙兩大塊,而智能座艙裡的一個比較核心的能力就是隻能語音助手,通過智能語音助手幫助使用者去操控整個智能座艙,為使用者提供服務。本文作者對智能座艙裡的智能語音助手進行了分析,一起來看一下吧。
體驗了6款車載智能語音助手後的總結

智能汽車可以分為兩大塊:自動駕駛和智能座艙。

自動駕駛主要研究的是怎麼從A點移動到B的點;而智能座艙主要研究的是,在移動的過程中,怎麼給車艙内的使用者創造更好的生活體驗。

現在大家提成出了一個新的概念:智能座艙是第三生活空間。即繼家庭、工作以外的另一個生活空間。

目前在智能座艙裡比較核心的一個能力就是智能語音助手,通過智能語音助手幫助使用者去操控整個智能座艙,為使用者提供服務。

本文主要讨論的是智能座艙裡的智能語音助手。

一、車載智能語音助手目前都能做些什麼?

總的來說,車載語音助手可以給車機系統的應用程式發送指令和給車機部件發送指令。可見即可說,即在中控屏上看到的功能,都可以用語音的方式發送指令控制。

主要分為兩大塊:

1. 操控娛樂資訊

操控娛樂資訊是指控制中控屏裡的娛樂資訊應用程式(非汽車部件),如播放音樂、查天氣、查股票、播放電影、播放電台等。

2.操控車機

操控車機是指操控汽車零部件,如操控空調、車窗、座椅、氛圍燈等;但通常不會控制汽車行駛移動相關的功能,如不控制汽車行駛的速度、轉向等。

小結

通常座艙内會有多個麥克風,能夠識别到使用者在哪個位置說話。比如坐在副駕駛的使用者說“打開車窗”,會打開副駕駛的車窗,不需要使用者說明要打開哪個車窗。

目前主要是通過語音呼叫方式來喚醒語音助手,類似于智能音箱的喚醒方式。

未來應該會朝着多種喚醒方式的方向發展,如通過視覺的方式,看到使用者在調座椅,助手可以主動說“可以通過說話方式來調整座椅哦”。主動地給使用者提供服務,目前更多是被動的方式。

有些廠商目前一次喚醒隻能發送一條指令,未來應該會朝着持續監控使用者意圖的方式發展。

目前了解使用者意圖基本隻會通過語音的方式,未來肯定是朝着多模态的方向發展,如通過語音+視覺+各種傳感器等多緯度的資訊了解使用者的意圖。

二、各車型智能語音助手功能總結

筆者通過線下體驗店體驗了6款車型的智能語音助手,記錄了體驗的感受。當然會有誤差或不準确,僅供大家參考。誤差的影響因素可能來自:環境網絡差、使用者操作不當、環境噪音等。

1. 比亞迪-漢

關鍵字:中規中矩、無明顯短闆也無明顯亮點

基礎的控制汽車部件、控制媒體資訊的能力都有;媒體資訊的豐富度也很多、響應速度和準确率也不錯。

缺點:

  • 不支援一次喚醒多次對話。
  • 大多數場景不支援多輪互動(如先播放周傑倫的音樂,再說:再播放他的電影,不支援)。
  • 閑聊能力幾乎沒有,如說:“你好笨啊”、“我生氣了”,助手接不了話。

2. 零跑-C01

關鍵字:基礎能力都有,但不穩定

  • 基礎的控制汽車部件、控制媒體資訊的能力都有;媒體資訊的豐富度也很多、響應速度和準确率也很高。
  • 支援一次喚醒,在一定時間内可進行多次互動。

缺點:

  • 說打開車窗、換個氛圍燈等對汽車零部件的控制指令,不穩定,有時不執行。
  • 大多數場景不支援多輪互動(如先播放周傑倫的音樂,再說:再播放他的電影,不支援)。
  • 閑聊的内容幾乎沒有,如說:“你好笨啊”、“我生氣了”,助手接不了話。

3. 問界-M5

  • 車機用的是鴻蒙系統,手機跟車機系統互聯互通(不是投屏)、響應超快。
  • 支援一次喚醒,在一定時間内可進行多次交。
  • 支援多意圖,如能識别并執行“打開車窗和打開”。
  • 有多輪互動的能力,如先說:“把主駕駛座椅調成按摩”,再說“座椅調前一點”,能了解到說的是前排座再調前一點。
  • 支援根據人臉ID,記憶使用者偏好,如座椅位置。

缺點:

  • 一系列都需要用的是華為的産品、限制比較多、應用軟體必須要在鴻蒙系。
  • 閑聊的能力幾乎沒有,如說:“你好笨啊”、“我生氣了”,助手接不了。

4. 理想-L9

1)語音助手支援語音+視覺方式結合去了解使用者的意圖。

比如,“打開這個”,邊說,邊用手指指着要操作的物體,就能識别。

暫且不說有多友善,起碼算是語音和視覺一起識别使用者意圖的一個開始,後續有很多想象的空。

2)支援一次喚醒,在一定時間内可進行多次交。(沒有找到明顯的缺點)

5. 極氪-001

1)有一定的閑聊能力。

2)支援一次喚醒,維持一段時間的互動。

缺點:

  • 一些使用頻次低的功能,意圖的識别準确度還是比較低。
  • 不支援多輪互動,如“座椅調前一點”;再說“再調前點”,就每辦法識别了。

6. 特斯拉-Model3

缺點:

  • 需要按住按鈕才能說話
  • 意圖缺乏泛化能力,基本要完全命中文案才會執行
  • 很多命中了也沒辦法執行指令

總的來說【簡約】,能減的功能都給你減了。

使用體驗評分

根據個人的體驗,做了下評分,供大家參考。

體驗了6款車載智能語音助手後的總結

三、總結智能車載語音助手待優化問題

1.喚醒問題

很多廠家的語音助手還是隻能支援一次喚醒,一次對話的形式。若使用者需要連續跟助手對話時,互動的效率和體驗會大打折扣的。

一次喚醒,一段時間内支援監測使用者多次說話,可能會引發誤了解的問題。使用者在跟其他人說話或者在唱歌,可能會給語音助手誤以為是在給它發指令,引發誤操作。

2.低頻使用的功能待完善

雖然很多廠家都标榜自己可見即可說,但實際上很多低頻操控的功能還不是很完善。比如說:調整座椅等,意圖的識别準确率偏低,意圖識别的顆粒度不夠細。

3.多模态識别問題

目前了解使用者意圖的方式還是比較單一,大多數隻能通過語音了解。

但在環境音比較嘈雜的情況下,了解的準确率度會偏低,如打開車窗後噪音比較大、車内多乘客同時說話、媒體音量比較大時,都會影響助手對使用者意圖的了解。

在這樣的環境下,如果讓語音+唇語+手勢等其他緯度結合去了解使用者的意圖,可以提升對使用者意圖了解的準确率,這也是未來大家争相要突破的方向。

4.多輪互動問題

大多廠商的語音助手在多輪互動上的能力還是比較欠缺的,甚至沒有。

比如,先說“放一首周傑倫的歌”,然後再說“放他的電影吧”,這時就識别不了是要放周傑倫的電影了。

需要實作多輪的對話能力,還需要涉及怎麼維持對話的狀态、記錄對話的槽位資訊等等。

使用者實際的對話場景是非常複雜的,如果讓語音助手看起來跟智能,有更加自然的對話效果,還是有很長的路要走的。

5.閑聊、情感陪伴問題

大多數廠商在閑聊(非執行任務或指令)的場景下,能力還是很弱的,甚至是沒有的。

比如說:“今天天氣真好”、“今天好開心啊”、“又下雨了怎麼辦呢”等等,智能助理基本是無法接話的。

處理執行任務和指令是基礎能力,但閑聊和情感陪伴是個性化和拟人化的必經之路。

比如,智能助理能夠記住跟使用者曆史的聊天記錄。若使用者之前跟助手提過自己的生日,或者提過女朋友的生日,下次聊天問“你還記得我生日嗎”,助手能回答。

甚至在記住我生日後,在生日那天主動跟我說生日快樂。這樣整個助手就會更加的有人的溫度。

本文由 @JM 原創釋出于人人都是産品經理。未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協定。

繼續閱讀