天天看點

LEARNING TO NAVIGATE IN COMPLEX ENVIRONMENTS

任務是地圖裡面導航,讓agent從起始點到達指定位置。

用了supervised learning + reinforcement learning + lstm

用supervised learning當做輔助訓練,加速rl訓練,用lstm當做memory。實驗表明depth construction比較有用。論文中的方法在固定地圖和随機地圖中都能用。