（深度）增強學習

如何解釋policy gradient中的baseline具有降低variance的作用
（深度）增強學習 policy gradient policy gradient中的baseline baseline降低variance
07-21
reinforcement learning，增強學習：Model-Free Prediction
（深度）增強學習 reinforcement learni 增強學習 Model-Free Predictio
06-08
《reinforcement learning：an introduction》第三章《Finite Markov Decision Processes》總結
（深度）增強學習增強學習 sutton RL reinforcement learni an introduction
06-08
增強學習中，exploration和exploitation時常用的action選擇方法
（深度）增強學習增強學習 Exploration and Expl
02-27
reinforcement learning，增強學習：Exploration and Exploitation
（深度）增強學習 reinforcement learni 增強學習 Exploration and Expl
02-27