RE-EVALUATE: Reproducibility in Evaluating Reinforcement Learning Algorithms

2021-11-08 10:16:12

發表時間：2018（2nd reproducibility in machine learning workshop at icml 2018）

文章要點：文章想說，現在這些rl算法不好複現，就是因為大家各搞各的，評估标準不一樣，計算方式不一樣等等。然後作者就提出了一個evaluation pipeline，大概意思就是說大家寫算法的時候，train可以各搞各的，test的時候要用相同的标準接口實作，然後用一個單獨設計的統一的或者說第三方的evaluation來比較，就沒了。

總結：看了這篇文章的第一反應是，這也能發？

疑問：無

RE-EVALUATE: Reproducibility in Evaluating Reinforcement Learning Algorithms

繼續閱讀

[題記]三維形體的表面積-leetcode

Justin_第1組_2009.4.2

IIS6.0架構1. 概述2. HTTP.SYS3. W3SVC

使用sysbench做oltp測試

【MySQL】sysbench壓測伺服器及結果解讀

IO端口和IO記憶體的差別轉Linux系統對IO端口和IO記憶體的管理

【算法提高班】貪婪政策

比較低功率無線技術(第3部分)---凱利訊半導體

MFC類

Lua的預設metamethod清單

Cocos、Lua遊戲記憶體釋放之我見

Lua遊戲記憶體洩漏檢查

UVA 442 Matrix Chain Multiplication

Java Spring 架構

多線程擷取随機數性能對比（C vs C++）

實訓成果