扫码访问手机版
0 人学习
扫码访问手机版
课程目录
学员 1、什么是强化学习? (Reinforcement Learning)
03:17学员 2、强化学习方法汇总 (Reinforcement Learning)
05:54学员 3、1 why?
01:40学员 4、2 要求准备
05:06学员 5、什么是 Q Learning (Reinforcement Learning 强化学习)
06:10学员 6、2.1 简单例子
15:24学员 7、2.2 Q Learning 算法更新
11:11学员 8、2.3 Q Learning 思维决策
09:29学员 9、什么是 Sarsa (Reinforcement Learning 强化学习)
02:38学员 10、3.1 Sarsa 算法更新
05:26学员 11、3.2 Sarsa 思维决策
08:11学员 12、什么是 Sarsa(lambda) (Reinforcement Learning 强化学习)
03:36学员 13、3.3 Sarsa(lambda)
10:25学员 14、什么是 DQN (Reinforcement Learning 强化学习)
03:50学员 15、4.1 DQN 算法更新 using Tensorflow
07:03学员 16、4.2 DQN 神经网络 using Tensorflow
10:28学员 17、4.3 DQN 思维决策 using Tensorflow
21:31学员 18、4.4 OpenAI Gym using Tensorflow
12:19学员 19、4.5* Double DQN using Tensorflow
13:39学员 20、4.6* DQN with Prioritised Replay using Tensorflow
13:17学员 21、4.7* Dueling DQN using Tensorflow
07:20学员 22、什么是 策略梯度 Policy Gradients (Reinforcement Learning 强化学习)
02:12学员 23、5.1 Policy Gradients 算法更新
04:24学员 24、5.2 Policy Gradients 思维决策
10:53学员 25、什么是 Actor Critic (Reinforcement Learning 强化学习)
02:40学员 26、6.1 Actor Critic 演员评论家
09:46学员 27、什么是 Deep Deterministic Policy Gradient (DDPG) 强化学习
00:00学员 28、6.2 DDPG (Deep Deterministic Policy Gradient)
19:34学员 29、什么是 A3C (Asynchronous Advantage Actor.Critic) 强化学习
00:00学员 30、6.3 A3C (Asynchronous Advantage Actor Critic)
28:16学员 31、6.4 PPO/DPPO Proximal Policy Optimization
14:49