强化学习 - 专题

投稿

强化学习

收录了8篇文章 · 10人关注

好多文章被锁请访问我的博客
还是自己搭的博客靠谱，简书把我的几乎所有的文章都锁定了。申诉根本没用！将大部分文章都整理到了自己博客，我也将会在那里更新。欢迎关注：https...

Hongtao洪滔 1 0
强化学习：自动驾驶——Carla 模拟器简介
自动驾驶是机器学习的一个重要的应用领域，作为普通学习者，我们是否可以运用自己学到的机器学习方法训练自动驾驶模型，完成自动驾驶的任务呢？是否需要一...

1.5 Hongtao洪滔 1 8

深度强化学习——Policy Gradient 玩转 CartPole 游戏
Image from unsplash.com by helloquence 前面的文章我们介绍了 Q-learning, DQN 等方法都是基...

0.6 Hongtao洪滔 0 2
AI学习笔记——Sarsa算法
上一篇文章介绍了强化学习中的Q-Learning算法，这篇文章介绍一个与Q-Learning十分类似的算法——Sarsa算法。 1. 回顾Q L...

0.1 Hongtao洪滔 0 3
AI学习笔记——强化学习之动态规划(Dynamic Programming)解决MDP(2)
求解最优MDP实际上就是找到最佳策略(Policy)π来最大化来最大化V函数(Value Function)。 1. 策略估算(Policy E...

0.1 Hongtao洪滔 0 5
AI学习笔记——强化学习之值函数近似(Value Function Approximation)(2)
前文介绍了函数近似来预测V函数，但是还没涉及到行动和控制，这篇文章就来谈谈用近似Q函数来控制和行动。 1. 控制——递增算法 Increment...

Hongtao洪滔 0 1