0
11月21日,腾讯“开悟”平台宣布正式开放“王者荣耀AI开放研究环境”申请,迈出全面开放的第一步。面向非商业用途的机器学习算法研究,“开悟”平台将提供业界独有的高复杂度MOBA训练环境,助力相关学术领域的前沿探索。
最新开放申请的“王者荣耀AI开放研究环境”,包含了王者荣耀1v1对战环境与baseline算法模型,当前支持20位英雄的镜像对战任务以及非镜像类对战任务,尤其适合研究竞争性强化学习中的泛化性与通用性问题。
现在,研究者只需在腾讯开悟平台官网注册账号、提交资料并通过平台审核,即可免费下载王者荣耀1v1测试环境gamecore,在本地进行AI相关研究测试。
申请地址:https://aiarena.tencent.com/aiarena/zh/open-gamecore
据了解,“王者荣耀AI开放研究环境”项目发布以来受到广泛关注,今年9月以264星登上Github 月度热榜,同时,相关论文已被AI领域的顶级国际学术会议 NeurIPS 2022接收。
随着王者荣耀游戏在持续运营中成长迭代,“开悟”平台也将逐步探索并开放更多适用于AI研究的游戏测试环境,为AI业界面临的“缺乏高挑战测试环境”难题提供全新解决方案。
在王者荣耀对战中,双方玩家互为竞争关系,需要收集资源的同时干扰对方,以达到赢得游戏的目的。作为一个具备多英雄、多玩法的复杂对抗游戏,王者荣耀的状态、动作空间复杂度比围棋等游戏高很多,是学术届研究复杂控制类问题的优质环境。
2019年,腾讯AI Lab首次发布决策智能AI“王者绝悟”的研究论文,介绍在王者荣耀1v1环境中研究用深度强化学习来为智能体预测游戏动作的方法,该论文被AAAI 2020接收,之后“王者绝悟”陆续攻克5v5挑战及全英雄池,在学术领域取得多项成就同时,也为王者荣耀玩家带来了“挑战绝悟”等创新玩法。
同年,王者荣耀及腾讯AI Lab联手打造“开悟”AI开放研究平台,打造游戏AI产学研新生态。如今“开悟”正式开放王者荣耀1v1环境,并对环境进行了易用性封装,提供标准代码与训练框架,让个人用户在资源允许的情况下可以轻松上手分布式训练。
本次最新开放申请的“王者荣耀AI开放研究环境”在只考虑双方英雄选择条件下,支持400种对战子任务,如果算上召唤师技能,将会有40000种子任务,这对模型的泛化性有很大挑战,所以尤其适合研究竞争性强化学习中的泛化性与通用性问题。
进一步看,研究模型对不同任务的泛化性,对降低AI在不同领域的应用成本至关重要。例如,面对测试环境中的多个任务,如何在有限的资源和时间条件下获得最好的效果,这其中的研究方法论和成果就可以迁移到其他领域,比如机器人不同部位的控制等。
“开悟”是腾讯牵头构建的AI多智能体与复杂决策开放研究平台,依托腾讯AI Lab和“王者荣耀”在算法、算力、实验场景方面的核心优势,为学术研究人员和算法开发者开放的国内领先、国际一流研究与应用探索平台。
目前,“开悟”也正在持续助力AI学界人才培养。2019年至今,“开悟”AI 开放研究平台已成功主办两届“开悟多智能体强化学习大赛”、承办了成都大运会“世界大学生数智竞技邀请赛”AI赛道,“以赛促研”为国内外青年研究人才提供测试及提升AI在复杂游戏场景下应用水平的机会。
2021年起,“开悟”先后与北大、清华、中科大等19所国内头部高校教师团队联合发起创新课程合作项目,已于多所高校陆续落地多智能体强化学习实践课程,帮助学生通过更有趣的方式掌握机器学习、强化学习、多智能体决策等关键知识点。
基于“开悟”平台,腾讯将与学界、业界携手,共同利用游戏环境不断提升AI能力,并寻找 AI 技术解决更多问题的可能性,在机器人、医疗、工业、交通等领域发挥更大作用。
附:论文地址
论文链接:https://openreview.net/forum?id=7e6W6LEOBg3
代码链接:https://github.com/tencent-ailab/hok_env
雷峰网版权文章,未经授权禁止转载。详情见转载须知。