您正在使用IE低版浏览器，为了您的雷峰网账号安全和更好的产品体验，强烈建议使用更快更安全的浏览器

此为临时链接，仅用于文章预览，将在时失效

人工智能开发者正文

发私信给汪思颖

发送

0

OpenAI 启动迁移学习比赛，一起来玩刺猬索尼克游戏吧

本文作者：汪思颖

2018-04-06 13:41

导语：OpenAI 启动一项迁移学习比赛，参赛者需要让智能体来玩风靡一时的 Sonic The Hedgehog（刺猬索尼克）游戏，目前时间轴和规则已经公布。

雷锋网 AI 研习社按：日前，OpenAI 启动一项迁移学习比赛，这一比赛为期两个月（4 月 5 日-6 月 5 日），参赛者需要让智能体来玩风靡一时的 Sonic The Hedgehog（刺猬索尼克）游戏。这一比赛将会评出三大奖项，参赛者有机会获得丰厚奖励，并与 OpenAI 共同撰写比赛技术文档。

OpenAI 启动迁移学习比赛，一起来玩刺猬索尼克游戏吧

雷锋网 AI 研习社将在下文介绍关于比赛的详细信息。

在 OpenAI 官网可以看到，这次比赛将会衡量强化学习算法基于以往经验的泛化能力。“在典型的强化学习研究中，算法是在相同环境下进行训练的，这使得算法擅长记忆，并有很多超参数。此次竞赛将会在电子游戏关卡中测试算法——参赛选手需要让智能体玩 Sonic The Hedgehog（刺猬索尼克）游戏，用于测试的游戏关卡此前从没出现过。

此次比赛基于 Gym Retro 平台。此外，为了助于大家比赛，OpenAI 也开源 retro-baselines，这一工具展示了如何在比赛任务中运行多个强化学习算法。比赛为期两个月（4 月 5 日-6 月 5 日），获胜者将得到一些很棒的奖品。

以下是参赛详情：

参赛者训练智能体（或者编写脚本）来玩 Sonic The Hedgehog 游戏；
参赛者将智能体打包到 Docker 容器提交；
OpenAI 对提交的智能体进行一套秘密测试；
排行榜上会出现智能体的得分情况。

下面的图解对这个过程进行了详细说明。

OpenAI 启动迁移学习比赛，一起来玩刺猬索尼克游戏吧

OpenAI 表示，强化学习的下一步是利用以往经验快速在新环境中学习。目前的算法很容易记忆，但不能很好地适应新的情况。虽然这次比赛的重点是电子游戏，但他们希望获胜的技术能适用于更广泛的领域。

比赛规则如下：

一个团队只能用一个帐户；
可以与其他团队分享短代码片段或指导代码，但不能分享完整或部分解决方案；
参赛选手只能隶属于一个团队。

下面是对「最佳成绩奖」（Best Score）和「最佳代码奖」（Best Writeup）的介绍。要想争夺这两类奖项，参赛者必须在比赛最后阶段将自己提交的智能体开源。每类奖项的前三名都将获得奖励。

此外，还有额外的「最佳支持奖」（Best Supporting Materials）。

所有获奖者将受邀与 OpenAI 一起完成这一比赛的技术报告。

比赛规则页面：https://contest.openai.com/details

Leaderboard 页面：https://contest.openai.com/leaderboard

Benchmark 详细描述：https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/retro-contest/gotta_learn_fast_report.pdf

雷锋网 AI 研习社编译整理。

via：https://contest.openai.com

雷峰网版权文章，未经授权禁止转载。详情见转载须知。

6人收藏

分享：

相关文章

汪思颖

编辑

关注AI学术，例如论文

发私信

当月热门文章

最新文章

热门搜索

滴滴比特币 vivo 联发科 Elon Musk Android Wear Mac 特朗普医疗AI 虚拟货币 macbook

为了您的账户安全，请验证邮箱

您的邮箱还未验证,完成可获20积分哟！

重发邮箱修改邮箱

请验证您的邮箱

立即验证

完善账号信息

您的账号已经绑定，现在您可以设置密码以方便用邮箱登录

立即设置 以后再说