天天看點

tensorflow零起點快速入門(5) --強化學習摘錄截圖

tf.random_normal_initializer

tensorflow零起點快速入門(5) --強化學習摘錄截圖

tf的GraphKeys用法

tensorflow零起點快速入門(5) --強化學習摘錄截圖
tensorflow零起點快速入門(5) --強化學習摘錄截圖
tensorflow零起點快速入門(5) --強化學習摘錄截圖

tf.reduce_mean

tensorflow零起點快速入門(5) --強化學習摘錄截圖
tensorflow零起點快速入門(5) --強化學習摘錄截圖

tf.squared_difference

tensorflow零起點快速入門(5) --強化學習摘錄截圖

非tf中的zip,python的zip用法

tensorflow零起點快速入門(5) --強化學習摘錄截圖

非tf中的hstack,numpy的hstack用法

tensorflow零起點快速入門(5) --強化學習摘錄截圖

非tf中的newaxis,numpy的newaxis用法

tensorflow零起點快速入門(5) --強化學習摘錄截圖

非tf中的arange,numpy的arange用法

tensorflow零起點快速入門(5) --強化學習摘錄截圖

tf.nn.relu6

tensorflow零起點快速入門(5) --強化學習摘錄截圖

tf.nn.tanh

tensorflow零起點快速入門(5) --強化學習摘錄截圖

tf.distributions.Normal

tensorflow零起點快速入門(5) --強化學習摘錄截圖
tensorflow零起點快速入門(5) --強化學習摘錄截圖

log_prob---tf.distributions.Normal

tensorflow零起點快速入門(5) --強化學習摘錄截圖

熵的定義

tensorflow零起點快速入門(5) --強化學習摘錄截圖

tf.clip_by_value

tensorflow零起點快速入門(5) --強化學習摘錄截圖

tf.gradients

tensorflow零起點快速入門(5) --強化學習摘錄截圖

二維及以上矩陣取值運算

tensorflow零起點快速入門(5) --強化學習摘錄截圖

tf的softmax政策疊代與對應求導

tensorflow零起點快速入門(5) --強化學習摘錄截圖

非tf中的random.choice,numpy的random.choice用法

tensorflow零起點快速入門(5) --強化學習摘錄截圖

政策梯度的梯度上升問題

tensorflow零起點快速入門(5) --強化學習摘錄截圖