强化学习 – Dezeming Family-Everything is worth researching

因为本人并非强化学习研究人员，只是尝试在科研中使用，所以只能给出一些入门策略。

严重警告：当你作为研究生还需要看“怎么入门强化学习”，这说明你的导师和你的周围环境已经派不上用场了。此时如果你还是需要强化学习，那么请把它当成一个工具，以实践为主，而不要再考虑如何研究和突破其原理，时间是宝贵的。

一：数学基础
强化学习的基础是概率论与随机过程（包括蒙特卡洛方法）。
二：基础入门课
强化学习 (Reinforcement Learning) | 莫烦Python (mofanpy.com)：
https://mofanpy.com/tutorials/machine-learning/reinforcement-learning/
李宏毅：
https://www.bilibili.com/video/av24724071/?p=1&vd_source=bb71b3f47c7989c58581b14ab01151a4
三：学完这两个视频，就可以看一些经典的著作和论文了：
强化学习（第2版）强化学习领域奠基性经典著作！人工智能行业的强化学习圣经！
作者:（加）Richard S. Sutton（理查德·桑顿），（美）Andrew G. Barto（安德鲁·巴图）
四：动手实践
https://github.com/tensorlayer/RLzoo

以上的内容以乐趣为主，可以自己调教一个有趣的agent。至于科研，我有一些做自动控制理论的同学会把以前的自控系统改为用强化学习控制，然后灌几篇论文。

教程类源码github地址：
https://github.com/feimos32

感谢大家支持！

The entire series of articles and e-books by DezemingFamily are available as free electronic versions, which can be easily modified and republished. If you have obtained any of the e-books from the DezemingFamily series, you can find the latest version on our website [https://dezeming.top/]. Feedback and suggestions on the content of the articles and any errors found are also welcome via comments on the website.

为了方便读者朋友们的笔记记录与保存，同时为了我们的仪式感和足够的责任心，最重要的是网页博客容易丢失，因此DezemingFamily的知识体系结构将以电子文档-pdf的形式进行发布。如果您从其他地方获得了本站的文档，也可以来本站上免费下载到最新版本。

DezemingFamily是公益性质的知识学习和交流网站，所有电子书和小册子均可免费下载。由于网站服务器费用较高，希望大家能够给予一定的支持。也欢迎并希望大家提一些意见和建议！后期搭建公众号后可能会推出一些完整的收费项目，敬请关注。

本站的一切教程类内容都不涉及商业盈利，由于时间和精力有限，本网站中发布的文章或电子文档难免有部分内容难以查明出处，能够查明出处的内容都进行了索引，如果有内容没有附加索引或声明，希望能联系我们进行添加。受限于本人能力，本网站对知识和理论的理解和分析未必足够透彻，还请大家谨慎鉴别。

大家可以在 “交流与讨论” 对DezemingFamily的电子书进行评论，我们会在第一时间进行答复和修订。您的意见和建议将是我们不断完善和更新的重要力量！