Reinforce learning

1.概述与基础

avatar

2.MDP

avatar

3.无模型预测与控制

avatar

4.价值函数近似

avatar

5.基于策略函数

avatar