因为本人并非强化学习研究人员,只是尝试在科研中使用,所以只能给出一些入门策略。
严重警告:当你作为研究生还需要看“怎么入门强化学习”,这说明你的导师和你的周围环境已经派不上用场了。此时如果你还是需要强化学习,那么请把它当成一个工具,以实践为主,而不要再考虑如何研究和突破其原理,时间是宝贵的。
一:数学基础
强化学习的基础是概率论与随机过程(包括蒙特卡洛方法)。
二:基础入门课
强化学习 (Reinforcement Learning) | 莫烦Python (mofanpy.com):
https://mofanpy.com/tutorials/machine-learning/reinforcement-learning/
李宏毅:
https://www.bilibili.com/video/av24724071/?p=1&vd_source=bb71b3f47c7989c58581b14ab01151a4
三:学完这两个视频,就可以看一些经典的著作和论文了:
强化学习(第2版)强化学习领域奠基性经典著作!人工智能行业的强化学习圣经!
作者:(加)Richard S. Sutton(理查德·桑顿),(美)Andrew G. Barto(安德鲁·巴图)
四:动手实践
https://github.com/tensorlayer/RLzoo
以上的内容以乐趣为主,可以自己调教一个有趣的agent。至于科研,我有一些做自动控制理论的同学会把以前的自控系统改为用强化学习控制,然后灌几篇论文。