【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

本文作者： AI研习社-译站

2018-12-19 10:57

导语：AI 研习社获得官方授权，汉化翻译伯克利大学 CS 294-112 《深度强化学习》，于本周四（2018 年 12 月 20 日）正式上线中文字幕版。

AI 研习社又有新的学习小组啦！赶快加入我们吧！

扫描二维码，即可加入小组

【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

课程开始后，小组成员可免费观看课程视频~

AI 研习社获得官方授权，汉化翻译伯克利大学 CS 294-112 《深度强化学习》，于本周四（2018 年 12 月 20 日）正式上线中文字幕版。

伯克利大学 CS 294-112 《深度强化学习》为官方开源最新版本，由伯克利大学该门课程授课讲师 Sergey Levine 授权 AI 研习社翻译。

观看网址：https://ai.yanxishe.com/page/groupDetail/30（加入小组后即可直接观看）

课程主页：http://rail.eecs.berkeley.edu/deeprlcourse/

油管链接：https://www.youtube.com/playlist?list=PLkFD6_40KJIxJMR-j5A1mkxK26gh_qg37

12 月 20 日开始正式同步更新在 AI 研习社，大约1到2周更新一次。

该课程主题选择深度增强学习，即紧跟当前人工智能研究的热点，又可作为深度学习的后续方向，值得推荐。

先修要求

想要学习伯克利大学 CS 294-112 《深度强化学习》这门课程，学生需要先学习 CS189 或者其他同等学力课程。本课程将假定学生掌握强化学习、数值优化和机器学习的相关背景知识。雷锋网雷锋网雷锋网

如果你对上述主题不是非常了解，那么需要自主学习补充以下知识点：

增强学习和马尔科夫决策过程（MDPs）

MDPs的定义

具体算法：策略迭代和价值迭代

搜索算法

数值最优化方法

梯度下降和随机梯度下降

反向传播算法

机器学习

分类和回归问题：用什么样的损失函数，如何拟合线性或非线性模型

训练/测试误差，过拟合

视频截图

【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

课程大纲

第一讲：课程介绍和概览

第二讲：监督学习和模仿学习

第三讲：TensorFlow 和神经网络简述

第四讲：强化学习简介

第五讲：策略梯度简介

第六讲：Actor-Critic 算法简介

第七讲：价值函数介绍

第八讲：高级 Q-学习算法

第九讲：高级策略梯度

第十讲：最优控制和规划

第十一讲：基于模型的强化学习

第十二讲：高级强化学习和图像处理应用

第十三讲：利用模仿优化控制器学习策略

第十四讲：概率和变分推断入门

第十五讲：推断和控制之间的联系

第十六讲：逆向强化学习

第十七讲：探索（上）

第十八讲：探索（下）

第十九讲：迁移学习与多任务学习

第二十讲：元学习

第二十一讲：平行结构和强化学习系统设计

第二十二讲：进阶模仿学习和开放性问题

第二十三讲：客座讲师：Craig Boutilier

第二十四讲：客座讲师：Gregory Kahn

第二十五讲：客座讲师：Quoc Le & Barret Zoph

第二十六讲：客座讲师：Karol Hausman

快来加入学习小组吧！

点击链接：https://ai.yanxishe.com/page/groupDetail/30 选择【加入小组】

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

9人收藏

AI研习社-译站

知情人士

AI研习社(yanxishe.com)译站频道，传播前沿人工智能知识，让语言不再成为学习知识的门槛。（原雷锋字幕组）

扫描关注作者微信

发私信

当月热门文章