天天看點

Stochastic Bandit Problem

随機bandit問題特征是

UCB1算法

  1. 算法描述
    Stochastic Bandit Problem
  2. Bound分析
  3. 注意

UCB2算法

  1. 算法描述
  2. Bound分析
  3. 注意

/epsilon -greedy算法

  1. 算法描述
  2. Bound分析
  3. 注意

Soft-max算法

  1. 算法描述
  2. Bound分析
  3. 注意

Thompson - Sampling算法

  1. 算法描述
  2. Bound分析
  3. 注意

繼續閱讀