本文來自AI新媒體量子位(QbitAI)

蘋果推出Siri已經7年,傑夫·貝索斯(Jeff Bezos)受到《星際迷航》的啟發推出Alexa也已經3年。
其實,以人工智能為基礎的互動界面早在數十年前就已經出現。1966年,麻省理工學院教授Joseph Weizenbaum推出了ELIZA——這被普遍是做當今對話型人工智能的原型。
幾十年後,在《連線》的一篇報道中,Andrew Leonard聲稱“機器人将會大熱”,而且認為這種幾乎技術很快就能“幫我找到最劃算的CD,給我母親選花,讓我能報道莫三鼻克的最新進展。”由于該文發表于1996年,是以舉例時使用了早已過時的CD。
如今,Slack、星巴克、Mastercard和梅西百貨等公司都已經通過改變,在客戶服務、聯網家居和網上訂花等諸多領域使用對話型界面。
如果你懷疑這項技術的價值或前景,可以看看Gartner對2019年之前的預測,這家市場研究公司認為,虛拟個人助手“将改變使用者與裝置互動的方式,成為生活中普遍接受的一部分。”
并非所有的對話型人工智能都是平等創造的,也不應如此。對話型人工智能包括虛拟個人助手(Alexa、Siri、Cortana和Google Home)和專業助手(X.ai和Skipflag)兩類。它們可以基于一套規則引擎開發,也可以使用機器學習技術。用例範圍既包括具體而瑣碎的任務(塔可鐘的TacoBot),也涵蓋通用而廣泛的服務(Alex、Siri、Cortana、Google Home)。
很多組織也考慮在個人或職業領域部署對話界面,通常都依靠合作夥伴提供的技術。但除了技術之外,仍有很多需要考慮的問題。雖然現在稱之為“實戰指南”還有些為時尚早,但各大組織在考慮嘗試或部署對話型人工智能時還是參考以下幾點:
“重點是産品或品牌。”Slack開發者關系總監Amir Shevat說,“不應該想‘我在開發一款機器人’,而應該這麼想:‘我要提供什麼樣的服務?’”
Shevat和其他人認為,除此之外,最好的啟動點是尋找那些可以用大量資料資料緩和或解決的棘手問題。這并不是說所有成功的機器人都應該做同一件事情,但關鍵要從一個有明确答案的小領域切入,然後設計一番使用者通常不知道自己可以享受的體驗。
有的對話很适合語音互動。例如,開車的時候或者要開啟家中暖氣的時候。但在詢問銀行餘額這樣的情況下,或許就需要通過文本輸入精确的隐私資訊。但還有其他方式可以幫助使用者與機器人互動。下圖顯示了兩種成功的互動例子。
“很多人仍對機器人有一種誤解,認為隻能說話或打字。”微軟的Chris Mullins說。事實上,機器人可以通過許多方式(或形态)與人互動或傳遞資訊:
語音(Alexa、Siri、Google Home)
打字(聊天應用中的機器人)
通過鍵盤支援來提供線索,進而縮小輸入選項的範圍
展示視覺化資訊的卡片
“在最成功的情況下,”Mullins說,“我們會看到一種混合的形态勝出。在合适的時候,語音很完美。但在其他時候,打字又很完美。有的時候,你也想使用卡片或鍵盤支援。确定對話模式是一種及其難以解決的問題,還沒有人能夠完全搞定。”
如果一個顧客向零售商詢問這樣的問題:“在我附近的店裡,哪裡能找到電鑽?”開發者就必須根據客戶所在的位置考慮問題。她現在是否身處店内?她在使用手機還是家裡的電腦?開發者必須針對多重場景和體驗進行設計。
這一過程很有挑戰,因為需要在确定範圍的過程中設想不同的互動模式。“與人類互動非常複雜,确定對話模式很困難。”Mullins說。要實作最好的效果,項目團隊就必須從一開始就做出選擇。
要了解“播放碧昂斯的《Lemonade》”和“查查我的銀行餘額”這種單一指令是一回事,而要針對人類與聊天機器人之間的互動編寫程式則是另外一回事。正因如此,人類與機器人展開的多重交流(“回合”)才如此複雜和難于開發,這需要充分了解背景資訊。
下圖是一個來自Kasisto的例子,表明了簡單的支付互動過程中蘊含的複雜性。
第一回合:
使用者讓Kai(聊天機器人)向Emily支付5美元。
Kai在使用者聯系人清單裡面找到兩個名叫Emily的人,詢問究竟是哪個Emily。
第二回合:
——使用者轉換話題,詢問自己的賬戶還有多少錢。
——Kai回答後,接着說,“我們現在說到哪兒了?”然後繼續最初給Emily支付5美元的話題。
起初看來,這像是一個非常簡單的互動,但從工程角度來看,卻需要深入了解背景和語言:
首先,Kai必須認識并追蹤使用者的目标,具體到這個案例,付錢給某人。
第二,Kai必須确定支付對象。在發現使用者有兩個叫Emily的朋友時,就需要通過詢問來确定具體的支付對象。
第三,Kai必須明白“Neubig”這個獨立出現的單詞是在指代前面對話中的内容,意思是付錢給Emily Neubig。
第四,Kai必須解讀“我賬号裡有多少錢?”這句話的意思,明白這是一個全新的請求,與之前的兩個互動并不相同。
最後,它還必須回答這個新的請求,然後繼續剛才的對話,完成最初的請求:向Emily支付5美元。
這段對話證明,為什麼明确的目的、縮小回答範圍和深入的專業知識都對聊天機器人的開發至關重要——因為要在使用者通過自然的方式表達時了解其意圖是一件非常複雜的事情,但如果想要提供有效的體驗,這一點卻至關重要。
高超的智能和明确的使用者意圖并非機器人取得成功的唯一要素,探測情緒、選擇合适的文字和語調同樣是確定舒适的對話體驗的關鍵。是以,很多實驗室和創業公司都在開發一些軟體,通過圖檔、語音、文本或視訊來探測情緒狀态。。
SRI International的語音技術和研究實驗室就開發了SenSay Analytics平台,号稱可以通過語音信号感覺說話者的情緒。這樣才能知道使用者何時感到困惑,并為其提供人類互動對象,也可以判斷使用者是否善于接受,進而為其提供相關的内容。
品牌化是機器人取得成功的關鍵因素。效果不佳的機器人會破壞聲譽,而強大的品牌觸角也可以幫助機器人取得成功。“我認為,對話型界面中的品牌化機會相對較小。”Adobe的Lars Trieloff說,“是以,應該在日常互動中利用品牌。確定它能把一件事情做得很好,完全符合客戶訴求。”
目前還處在利用對話型界面的初期,還有很長的路要走。但對話型人工智能——那些能夠更好地模仿人類的方式與機器互動的程式——将會紮根于此。現在可能有些原始,但資料科學、自然語言技術、機器學習和其他科技的進步,最終會為更加流暢的人機互動創造必要的環境。
對話型互動是否會等同或好于人類之間的互動?有些類型的互動可能永遠都不容易通過機器展開。但對某些用途而言,或許可以實作這一願景:我們已經看到了很多創新,但現在隻是冰山一角。
有一件事情是确定的,正如未來學家和創意政策師Monika Bielskkyte所說:“我們正在進入一個沒有螢幕的未來。”她預計,“未來,整個世界就是我們的桌面。”
— 完 —
本文作者:李杉
原文釋出時間:2017-08-22