0
本文作者: AI研习社-译站 | 2018-12-19 10:57 |
AI 研习社又有新的学习小组啦!赶快加入我们吧!
扫描二维码,即可加入小组
课程开始后,小组成员可免费观看课程视频~
AI 研习社获得官方授权,汉化翻译伯克利大学 CS 294-112 《深度强化学习》,于本周四(2018 年 12 月 20 日)正式上线中文字幕版。
伯克利大学 CS 294-112 《深度强化学习》为官方开源最新版本,由伯克利大学该门课程授课讲师 Sergey Levine 授权 AI 研习社翻译。
观看网址:https://ai.yanxishe.com/page/groupDetail/30(加入小组后即可直接观看)
课程主页:http://rail.eecs.berkeley.edu/deeprlcourse/
油管链接:https://www.youtube.com/playlist?list=PLkFD6_40KJIxJMR-j5A1mkxK26gh_qg37
12 月 20 日开始正式同步更新在 AI 研习社,大约1到2周更新一次。
该课程主题选择深度增强学习,即紧跟当前人工智能研究的热点,又可作为深度学习的后续方向,值得推荐。
想要学习伯克利大学 CS 294-112 《深度强化学习》这门课程,学生需要先学习 CS189 或者其他同等学力课程。本课程将假定学生掌握强化学习、数值优化和机器学习的相关背景知识。雷锋网雷锋网雷锋网
如果你对上述主题不是非常了解,那么需要自主学习补充以下知识点:
增强学习和马尔科夫决策过程(MDPs)
MDPs的定义
具体算法:策略迭代和价值迭代
搜索算法
数值最优化方法
梯度下降和随机梯度下降
反向传播算法
机器学习
分类和回归问题:用什么样的损失函数,如何拟合线性或非线性模型
训练/测试误差,过拟合
视频截图
第一讲:课程介绍和概览
第二讲:监督学习和模仿学习
第三讲:TensorFlow 和神经网络简述
第四讲:强化学习简介
第五讲:策略梯度简介
第六讲:Actor-Critic 算法简介
第七讲:价值函数介绍
第八讲:高级 Q-学习算法
第九讲:高级策略梯度
第十讲:最优控制和规划
第十一讲:基于模型的强化学习
第十二讲:高级强化学习和图像处理应用
第十三讲:利用模仿优化控制器学习策略
第十四讲:概率和变分推断入门
第十五讲:推断和控制之间的联系
第十六讲:逆向强化学习
第十七讲:探索(上)
第十八讲:探索(下)
第十九讲:迁移学习与多任务学习
第二十讲:元学习
第二十一讲:平行结构和强化学习系统设计
第二十二讲:进阶模仿学习和开放性问题
第二十三讲:客座讲师:Craig Boutilier
第二十四讲:客座讲师:Gregory Kahn
第二十五讲:客座讲师:Quoc Le & Barret Zoph
第二十六讲:客座讲师:Karol Hausman
快来加入学习小组吧!
点击链接:https://ai.yanxishe.com/page/groupDetail/30 选择【加入小组】
雷峰网原创文章,未经授权禁止转载。详情见转载须知。