分享

强化学习 Reinforcement Learning (莫烦 Python 教程)

莫烦带你有趣的学习强化学习,从简单到复杂。

31课时 共43028秒 更新时间:2018-09-15 11:32:20

手机扫码访问此课程
1金币
已有 0 人学习

该讲师其它课程

  • 讲师简介
  • 课程介绍
  • 课程目录
  • 学习资料
  • 交易记录(0)

【课程介绍】

莫烦带你有趣的学习强化学习,从简单到复杂。

【课程目录】

学员 1、什么是强化学习? (Reinforcement Learning)03:17 [+]
学员 2、强化学习方法汇总 (Reinforcement Learning)05:54 [+]
学员 3、1 why?01:40 [+]
学员 4、2 要求准备05:06 [+]
学员 5、什么是 Q Learning (Reinforcement Learning 强化学习)06:10 [+]
学员 6、2.1 简单例子15:24 [+]
学员 7、2.2 Q Learning 算法更新11:11 [+]
学员 8、2.3 Q Learning 思维决策09:29 [+]
学员 9、什么是 Sarsa (Reinforcement Learning 强化学习)02:38 [+]
学员 10、3.1 Sarsa 算法更新05:26 [+]
学员 11、3.2 Sarsa 思维决策08:11 [+]
学员 12、什么是 Sarsa(lambda) (Reinforcement Learning 强化学习)03:36 [+]
学员 13、3.3 Sarsa(lambda)10:25 [+]
学员 14、什么是 DQN (Reinforcement Learning 强化学习)03:50 [+]
学员 15、4.1 DQN 算法更新 using Tensorflow07:03 [+]
学员 16、4.2 DQN 神经网络 using Tensorflow10:28 [+]
学员 17、4.3 DQN 思维决策 using Tensorflow21:31 [+]
学员 18、4.4 OpenAI Gym using Tensorflow12:19 [+]
学员 19、4.5* Double DQN using Tensorflow13:39 [+]
学员 20、4.6* DQN with Prioritised Replay using Tensorflow13:17 [+]
学员 21、4.7* Dueling DQN using Tensorflow07:20 [+]
学员 22、什么是 策略梯度 Policy Gradients (Reinforcement Learning 强化学习)02:12 [+]
学员 23、5.1 Policy Gradients 算法更新04:24 [+]
学员 24、5.2 Policy Gradients 思维决策10:53 [+]
学员 25、什么是 Actor Critic (Reinforcement Learning 强化学习)02:40 [+]
学员 26、6.1 Actor Critic 演员评论家09:46 [+]
学员 27、什么是 Deep Deterministic Policy Gradient (DDPG) 强化学习00:00 [+]
学员 28、6.2 DDPG (Deep Deterministic Policy Gradient)19:34 [+]
学员 29、什么是 A3C (Asynchronous Advantage Actor.Critic) 强化学习00:00 [+]
学员 30、6.3 A3C (Asynchronous Advantage Actor Critic)28:16 [+]
学员 31、6.4 PPO/DPPO Proximal Policy Optimization14:49 [+]

【学习资料】

所属章节 资料名称 文件大小 下载

【交易记录】

交易会员 最近购买课程 交易时间