論文Express | 百度最新論文：基于互動的自然語言學習

2018-05-15 23:50:00

百度研究院（Baidu Research）的部落格剛剛更新釋出了一篇關于自然語言處理的新論文，在利用互動進行自然語言學習上，提出了一些有趣的新觀點，來和文摘菌一起來看看這篇論文的主要内容。

本文提出了一種基于互動式的自然語言學習的方法，其中，學習者通過與人類互動并從回報中學習自然語言，進而在參與對話的過程中學習和提高語言技能。

與監督學習環境的條件有所不同，本文中沒有對模型（學習者）進行有标簽的直接監督學習訓練。相反，學習者為了學習說話，必須先能說話，并且人類将提供自然語言（例如，是/否）和非語言（例如，點頭/微笑）回報。

通過對話交流，AI可以可以詢問問題來積極擷取資訊，并在随後的對話中，使用剛才學到的知識。

下圖展示了訓練期間，幾種不同形式的示例對話。

最初，學習者給出毫無意義的句子，但通過這種單一的互動對話逐漸提高了學習者的對話技能。最後，學習者可以用自然語言正确回答問題。

此外，模型的泛化能力進一步證明了模型的語言學習能力。也就是，在之前從未出現在問題中的概念，通過被詢問對象的描述，模型可以通過一些已知觀點或者概念的組合來回答。

例如，在訓練期間，從未進行過{鳄梨，東}組合的問答訓練。被詢問的“老師”隻是描述了“對象是橙色”，但從未對模型進行提問。在測試過程中，模型在回答有關“鳄梨”問題時，既可以回答“正東”方向的水果是“鳄梨”，也可以回答“鳄梨”是“橙色”的問題，如上圖所示。

本文的目标之一是增加語言學習環境的複雜性以培養更複雜的語言行為。另一個目标是探索知識模組化和快速學習，使模型能夠與人類互動并有效地向現實世界學習。

原文釋出時間為：2018-05-16

本文作者：文摘菌

本文來自雲栖社群合作夥伴“

”，了解相關資訊可以關注“

”。

繼續閱讀