【翻譯】End-to-End Reinforcement Learning of Dialogue Agents for Information Access

2022-07-19 12:09:09

本文是微軟研究軟鄧力老師的文章，建構了一種從知識圖譜中形成response的聊天機器人KB-InfoBot，并且提出了一種端到端的增強學習訓練方案。

（本文對于建構一個端到端的KB + task-oriented chatbot非常有啟發和指導意義）

introduction

一個典型的goal-oriented（就是比如query一個人演的某年電影）一般由四個部分組成：

一，language understanding(LU)子產品來預測使用者目的以及抽取相關slots；

二，一個對話狀态記錄器來記錄使用者意圖和對話曆史；

三，一個對話規則來根據目前的狀态選擇下一步的系統行動；

四，natural language generator (NLG)來把對話行動轉化為自然語言

paper 資料庫聊天機器人資料

上一篇: java定時器處理

下一篇: java 指定時間執行任務

繼續閱讀