天天看點

秒懂人類人類語言的潛台詞,阿裡AI再創人機對話世界紀錄

近日,第七屆對話系統技術挑戰賽(DSTC7)中,阿裡AI獲得雙料冠軍,成最大赢家。

DSTC7由來自微軟研究院、卡耐基梅隆大學的科學家于2013年發起,是人工智能領域的權威學術比賽。它要求參賽的AI模型依據給定的多輪對話曆史從上萬個句子中選出正确的回複。阿裡AI在參與的2項比賽中拿下兩個世界第一,擊敗了包括麻省理工學院、約翰霍普金斯大學、IBM研究院在内的近20支國際知名大學和研究機構的參賽隊伍。

秒懂人類人類語言的潛台詞,阿裡AI再創人機對話世界紀錄

基于此次比賽所提供的公開對話回複資料集DSTC7 Ubuntu,阿裡AI将人機對話準确率的世界紀錄提升至94.1%。

一直以來,人機對話系統及其背後的認知智能,是人機互動中最複雜也最重要的技術,曾被比爾蓋茨形容為“人工智能皇冠上的明珠”。人類的語言表達複雜且多變。在多輪人機互動對話中,機器如果不能快速準确了解人類的表達,就會給出“牛頭不對馬嘴”答複的情況。

此次阿裡的參賽AI模型叫做ESIM,是一個解決多輪對話回複問題的原創模型,通過給對話機器人裝上實時搜尋并了解人類真實意圖的“雷達”系統,實作對對話曆史的實時檢索,自動去除多餘資訊的幹擾,給出人類期待的回複。

例如當人們線上購物時,提出要一件M号的黑色裙子,智能機器人通過對庫存情況的實時檢索,發現并答複使用者沒有黑色M号的裙子。使用者接着問,“那有白色的嗎?”此時傳統模型訓練出的AI客服很難判斷使用者是要問“這件裙子是否有白色款”還是“有沒有白色的M号裙子”,無法給出準确回複。 

阿裡AI通過對使用者對話上下文的檢索,明确使用者的核心在于尺寸而非顔色,很快給出有沒有白色M号裙子的準确回複。

這項技術未來将會被應用到人機互動的多個場景:智能語音點餐機能夠更準确地了解人們的真實意圖,提高點單成功率;導航軟體能更容易聽懂人們的語音請求,少走冤枉路;家裡的智能音箱能夠更快做出反應,節省等待時間。

ESIM技術最初由達摩院語音實驗室内的一位90後科學家——陳謙研發,不到兩年,這一模型已經成為業界的熱門模型和通用标準。此次DSTC7的國内外參賽隊伍中就有6支隊伍同樣使用了基于ESIM的模型。

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

繼續閱讀