天天看點

【翻譯】End-to-End Reinforcement Learning of Dialogue Agents for Information Access

本文是微軟研究軟鄧力老師的文章,建構了一種從知識圖譜中形成response的聊天機器人KB-InfoBot,并且提出了一種端到端的增強學習訓練方案。

(本文對于建構一個端到端的KB + task-oriented chatbot非常有啟發和指導意義)

introduction

一個典型的goal-oriented(就是比如query一個人演的某年電影)一般由四個部分組成:

一,language understanding(LU)子產品來預測使用者目的以及抽取相關slots;

二,一個對話狀态記錄器來記錄使用者意圖和對話曆史;

三,一個對話規則來根據目前的狀态選擇下一步的系統行動;

四,natural language generator (NLG)來把對話行動轉化為自然語言