随着深度学习技术的流行,深度学习中的一些主流技术(如深度卷积神经网络、序列建模、记忆管理等)与强化学习在许多应用场景上出现了结合点,例如使用深度卷积网络来获取游戏画面的回放,然后结合强化学习本身的机制来训练出可以自己玩游戏的人工智能程序。强化学习技术目前仍面临训练环境与计算能力的瓶颈,相信随着科技的进一步发展,在未来十年它一定会成为人工智能领域的核心技术之一。本课程使用强化学习的经典书籍,并配套相关实验与项目,让学习者可以从最专业的角度来接触强化学习,学会使用这种先进的人工智能技术来制作实例。
课程目录
Chapter 1. RL Basis
1.RL Introduction
2.Multi-armed Bandits
3.Finite Markov Decision Processes
4.Dynamic Programming
5.Monte Carlo Methods
6.Temporal-Difference Learning
7.n-step Bootstrapping
8.Planning and Learning with Tabular Methods
Chapter 2. Approximate and Deep RL
9.On-policy Prediction with Approximation
10.On-policy Control with Approximation
11.Off-policy Methods with Approximation
12.Eligibility Traces
13.Policy Gradient Methods
Chapter 3. Deeper Research
14.Psychology
15.Neuroscience
16.Applications and Case Studies
Chapter 4. Other RL and Projects
17.Frontiers
18.Project: RL Game Agent
19.Project: Robot Agent