您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷峰网公开课
活动中心
GAIR
专题
爱搞机
业界
人工智能
学术
开发者
智能驾驶
数智化
零售数智化
金融数智化
工业数智化
医疗数智化
城市数智化
金融科技
科技巨头
银行AI
金融云
风控与安全
//= baseUrl()?>
医疗科技
医疗AI
投融资
医疗器械
互联网医疗
生物医药
健康险
芯片
政企安全
智慧城市
智慧安防
智慧教育
智慧交通
智慧社区
智慧零售
智慧政务
智慧地产
行业云
工业互联网
工业软件
工业安全
5G工业互联网
工业转型实践
AIoT
物联网
智能硬件
机器人
智能家居
热门标签
强化学习
强化学习
本专题为雷峰网的
强化学习
专题,内容全部来自雷峰网精心选择与
强化学习
相关的最近资讯,雷峰网读懂智能与未来,拥有
强化学习
资讯的信息,在这里你能看到未来的世界。
美国罗德岛大学杨庆教授:如何把机器学习技术应用于数据存储系统? | CCF-ADL 火热报名中
南京大学俞扬博士:强化学习前沿(下)
南京大学俞扬博士万字演讲全文:强化学习前沿(上)
强化学习最新资讯
人工智能
玩转Atari能走迷宫,牛津大学的新型强化学习方法有多牛? | ICLR 2017
通过使用这种共同学习的代表,基础智能体学习更快地优化外在回报,多数情况下,在培训结束时将会实现更好的策略。
哈帝•白求恩
04月20日 14:13
ICLR 2017
强化学习
伪回报
环境特征
人工智能
被微软收购后,Maluuba着手研究多重引导强化学习机
Maluuba初创公司致力于研究多重引导强化学习机,为机器学习再添领导能力。
sunshine_lady
04月13日 16:17
微软
Maluuba
强化学习
领导能力
机器人
波士顿动力每出一款机器人你就说它要统治人类?还早着呢!
机器人涵盖的技术领域更广,波士顿动力只是在控制方面做出了逆天成绩。现在的机器人领域还有很多技术问题没有解决,所以我们暂时不可能造出科幻电影中的那种通用机器人
qqfly
03月02日 09:17
机器人
Atlas
handle
波士顿动力
人工智能
28天自制你的AlphaGo(四):结合强化学习与深度学习的Policy Gradient(左右互搏自我进化的基础)
强化学习在 AlphaGo 中究竟是怎么用的?
彭博
02月23日 13:54
Deepmind
AlphaGo
强化学习
深度学习
人工智能
人工智能的新希望——强化学习全解
很多人说,强化学习被认为是真正的人工智能的希望。本文将提供强化学习的概况,以及算法如何实际实施的。
大数据文摘
02月21日 10:40
强化学习
人工智能
Python
深度学习
人工智能
冯·诺依曼辞世60周年纪念
冯·诺依曼的影响深远,即使今天的人工智能也概莫能外。
知情人士
02月08日 11:50
强化学习
人工智能
图灵
冯·诺依曼
人工智能
从一个失败的强化学习训练说起:OpenAI 探讨应该如何设计奖励函数?
在使用强化学习进行训练的时候,奖励函数的优劣直接决定了我们训练模型的好坏,因此我们要设计合适的奖励函数。
翻山
12月29日 14:16
强化学习
奖励函数
OpenAI
人工智能
Facebook Yann LeCun一小时演讲: AI 研究的下一站是无监督学习(附完整视频)
Facebook AI 部门负责人 Yann LeCun 近日进行了一场 AI 技术核心问题与发展前景的演讲,他重申了无监督学习对下一步 AI 发展的关键作用。
三川
11月21日 18:43
Yann LeCun
Facebook
人工智能
AI
人工智能
DeepMind 黑科技!颠覆传统强化学习方法,代理学习速度提高十倍(附视频)
开发出 AlphaGo 的 DeepMind 研究团队又出黑科技,新的强化学习方法将代理学习速度提高十倍。
三川
11月18日 18:49
DeepMind
谷歌 DeepMind
非监督强化和附加学习代理
强化学习
人工智能
PRICAI 2016国际人工智能大会论文解析 | 探索强化学习中多个动作之间的关系
PRICAI 2016是环太平洋国际人工智能会议 ,每两年举行一次,大会专注于人工智能的理论,技术及其在社会领域的应用,和其对于太平洋沿岸国家经济的重要性
章敏
08月24日 15:33
强化学习
人工智能
1
...
5
6
7
8
9
相关文章
从一个失败的强化学习训练说起:OpenAI 探讨应该如何设计奖励函数?
Facebook Yann LeCun一小时演讲: AI 研究的下一站是无监督学习(附完整视频)
DeepMind 黑科技!颠覆传统强化学习方法,代理学习速度提高十倍(附视频)
PRICAI 2016国际人工智能大会论文解析 | 探索强化学习中多个动作之间的关系
Google Deepmind大神David Silver带你认识强化学习
热门搜索
智慧城市
汽车
设计
互联网金融
ImageNet
itunes
夏普
迅雷
共享单车
数据挖掘
边缘计算
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请
验证邮箱
您的邮箱还未验证,完成可获20积分哟!
重发邮箱
修改邮箱
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以
设置密码
以方便用邮箱登录
立即设置
以后再说