您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
人工智能 正文
发私信给AI研习社-译站
发送

1

DeepMind出了学习模式“SAC-X”,可以让机器人探索自我

本文作者: AI研习社-译站 2018-04-25 10:33
导语:为机器人提供一个简单目标,并在完成时提供奖励

雷锋网按:这里是,雷锋字幕组编译的Two minutes paper专栏,每周带大家用碎片时间阅览前沿技术,了解AI领域的最新研究成果。

原标题 DeepMind's AI Learns Complex Behaviors From Scratch | Two Minute Papers #239

翻译 | 徐速  廖颖    字幕 | 凡江    整理 | 李逸帆  吴璇

本期论文:Learning by Playing - Solving Sparse Reward Tasks from Scratch

前些日子,DeepMind为AI机器人创建了一种全新的强化学习模式,名为SAC-X(预定辅助控制),能够为机器人提供一个简单目标,并在完成时提供奖励。

▷每周一篇2分钟论文视频解读

论文解读视频中,我们可以看到有机器人在协助生产,但机器人没有预装任何特定程序,没有任何老师指导学习算法,也没有对环境的先验知识,只是在摸索如何达到人们的要求,并且获得相应的奖励。

SAC-X 通过给予机器人奖励反馈,让机器人从零开始学会复杂操作。这个配置有系列通用辅助任务的机器人,试图通过off-policy强化学习慢慢完成任务。过程中,研究人员不会手把手教机器人完成任务,只会开启机器配备的感测器,剩下的留给机器自己探索,直到任务完成为止。

这个方法背后的创新点在于,“预定的动作”和“辅助策略操作”能让机器人有效摸索周边环境,机器人在奖励非常稀疏的情况下,也能表现得非常好。在有挑战性的机器人操作设定演示实验中,这样的方法也能奏效。

论文原址 https://arxiv.org/abs/1802.10567 雷锋网雷锋网



雷锋字幕组正在招募中

扫描下方二维码

备注“雷锋字幕组+姓名”加入我们吧

DeepMind出了学习模式“SAC-X”,可以让机器人探索自我

雷峰网原创文章,未经授权禁止转载。详情见转载须知

DeepMind出了学习模式“SAC-X”,可以让机器人探索自我

分享:
相关文章

知情人士

AI研习社(yanxishe.com)译站频道,传播前沿人工智能知识,让语言不再成为学习知识的门槛。(原雷锋字幕组)
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说