0
雷锋网 AI 科技评论按:今早,DeepMind 发出一篇年度总结文,盘点了 2017 年中自己在新的 AI 技术研发方面的研究成果,以及在 AI 技术的社会影响方面的所作所为。
可以说,AlphaGo 是大众眼中的 DeepMind 的重头戏,他们自撰的总结文也是以 AlphaGo 开头、以 AlphaGo Zero 结尾。不过 DeepMind 的技术成果和在社会责任方面的努力真的有很多,关注我们的读者在这一年中也看到了不少 DeepMind 的各方面研究成果,实验室地点也扩张到了加拿大蒙特利尔和美国加利福尼亚。雷锋网 AI 科技评论把这篇年度总结文编译如下(并添加了我们相关报道的链接,以便仔细查阅)。
今年 5 月时候,围棋排名世界第一的柯洁在乌镇的围棋峰会上迎战了 AlphaGo。比赛结果我们都知道了,三场全输。而仅仅 2 个月后,柯洁已经在同人类棋手的比赛中获得了 20 连胜。这时的他面对媒体说了这样一番话:「我下完(人机大战)以后对围棋有了重新的思考,现在看来这些思考对我还是有帮助的。我也希望所有的棋手都能去思考一下‘阿尔法狗’的棋理,它的思想,其实都很有意义。虽然我输了,但我发现围棋的变化量真的太大了,它还在不停地进步,我也希望自己不断地进步」。
柯洁是围棋领域的顶级人物,他的话让 DeepMind 的研究人员们倍感荣幸。这同时也是对 DeepMind 研究人员们的激励,因为这预示着一个新时代的开始。在未来,AI 可以成为帮助人类探索的工具;它可以发掘出新的知识,帮人类增进对世界的理解。具体对于 AI 辅助科研来说,DeepMind 也希望 AI 系统可以在气候变化、新药研发、到发现新型复合材料、降低现有医疗系统的运转压力等等挑战上帮助人类做出进展。
这种带来更美好的社会的可能性就是当初 DeepMind 成立的原因。而 DeepMind 也一直在持续做出进展,有些是在基础科学方面,也有一些在 AI 安全和伦理方面。
科学技术研究成果
DeepMind 的研究方法是受到神经科学启发的,神经科学领域的发现帮助 DeepMind 在想象力、推理、记忆和学习等关键要素上做出新的成果。以想象力为例,这种人类独有的能力在我们的日常生活中起着重要作用,让我们可以对未来可能发生的事情做规划和推理,但这对计算机来说就是巨大的挑战。DeepMind 持续地在这个问题上进行深入的研究,今年也研发出了带有想象力的智能体,它们可以从环境中提取出有用的信息,然后对未来应该做什么做出规划。
正是沿着在神经科学启发下做研究的思路,DeepMind 尝试训练了一个神经网络,让它在虚拟环境中控制各种简单形体的运动,得到了走路非常妖娆的智能体,这项研究的训练成果的视频也是 DeepMind 历来最热门的一次。这种复杂的运动控制是运动智能的标志,也是 DeepMind 的研究计划中的重要部分。虽然最终得到的运动姿态有点「野路子」,有时候也看起来很别扭,但它们同样走得很顺利,也很能让人们看个开心。
另一方面,DeepMind 在生成性模型方面也做出了成果。差不多一年之前 DeepMind 提出了 WaveNet,这是一个用来生成原始音频信号的深度神经网络,而它的生成质量也比当时的其它技术要高得多、真实得多。这个模型当时只是一个实验室级别的原型,需要消耗非常高的计算资源所以无法用于消费级产品。而在过去的 12 个月中,DeepMind 和谷歌的团队一起成功地开发出了一个快 1000 倍的新模型。今年 10 月,DeepMind 正式宣布这个新的并行 WaveNet(Parallel WaveNet)开始在真实世界落地商用,为 Google Assistant 提供逼真的美国英语和日语语音生成。
这是 DeepMind 把 AI 系统变得更容易构建、更容易训练、更容易优化的努力成果之一。DeepMind 在过去的一年里还研究了概率分布强化学习、基于群落的神经网络训练方法以及新的神经网络架构搜索方法,这都让 AI 系统变得更容易构建、预测更准确,优化起来也更快。DeepMind 还投入了相当的时间创造新的、有挑战性的环境用来测试他们开发出的 AI 系统,其中就包含了和暴雪合作,把星际 2 游戏开放成为研究平台。
但 DeepMind 明白科学技术不是价值中立的。当他们在基础研究上做出成果的时候,他们知道自己同样需要为研究成果的伦理和社会影响负起责任。这也让 DeepMind 的研究工作深入了解释性之类的重要领域,开发各种各样的新方法来理解以及解释他们的 AI 系统是如何工作的。基于同样的理由,DeepMind 成立了一支技术安全研究小组,他们会持续研究各种实际的办法来保证未来的 AI 系统是可信赖可依靠的,以及它们不会脱离人类的控制。
10 月的时候,DeepMind 迈出了新的一步,成立了「DeepMind 伦理&社会」研究小组,这支团队会为 DeepMind 探究以及理解 AI 对真实世界的影响,以便让 AI 真正地在社会中发挥益处。这项研究会由这个领域的知名专家们引领,比如哲学家 Nick Bostrom、气候变化专家 Christiana Figueres、优秀研究员 James Manyika 以及经济学家 Diane Coyle 和 Jeffrey Sachs。
AI 必须被整个社会的重点需求和担忧重新塑造,所以 DeepMind 和一些合作伙伴共同举办活动,试图启动全社会的讨论和对话,共同思考 AI 应该如何设计、如何应用。比如,算法正义联盟(Algorithmic Justice League)的负责人 Joy Buolamwini、Article 36 和人权观察组织(Human Rights Watch)的专家,以及英国军方都参加了一个连线直播上的活动,讨论算法的偏见性以及限制自动杀伤性武器的使用。正如 DeepMind 今年反复说起的那样,这些议题都非常重大,它们的影响也非常广阔,根本不可以忽视。
也所以,DeepMind 需要开拓新的空间,不管是在 AI 公司之间还是之外,以便探讨如何参与以及引导科学技术对世界的影响。其中一个例子是「AI 合作伙伴」(Partnership on AI),DeepMind 今年在这个组织担任联合主席,而它的目的就是把业界的竞争者们、学术机构和现代社会三者联合起来,共同讨论关键的伦理问题。在过去的一年中,「AI 合作伙伴」新增了 43 个盈利和非盈利成员,以及一位新的执行总监 Terah Lyons。在接下来的几个月中,DeepMind 期待和整个组织进一步合作,验证更多各种各样的研究主题,包括算法中的偏见和歧视、机器学习对自动化和劳动力的影响,等等。
DeepMind 同样看重如何让科学技术为社会带来实际的益处,也持续地发现着 AI 在医疗和能源方面带来巨大影响的潜力。今年,DeepMind 和 NHS 医院信托签订了两项合作伙伴协定让 DeepMind 的 Streams app 落地应用,它可以用数字化技术帮助 NHS 医院的医生们做出诊断。DeepMind 顶级研究机构的合作组织中的一员,今年他们也发起了一项开创性的研究,要确定最新的机器学习技术是否真的能够帮助提升乳腺癌的检测精度。
同时,DeepMind 也把许多精力投入了自己在保健方面的研究的监管上。DeepMind 也曾经撰文介绍,政府信息专员在 DeepMind 与皇家自由医院的合作中有一些发现,以及 DeepMind 保健的独立评审员首次对 DeepMind 的工作发布了公开年度报告,DeepMind 也从其中获得了经验教训。他们的仔细监督提高了 DeepMind 的工作质量。DeepMind 随之大幅增加了自己和病人以及公众之间的互动活动,包括与病人和看护人员的 workshop;而且 DeepMind 也在开发新的技术手段来把信任机制构建到系统中来,比如可验证的数据监督机制(verifiable data audit),DeepMind 未来也计划把它作为一个开源工具公开发布出来。
对 DeepMind 来说,2017 年的成果很让他们觉得满意,但同时他们也明白还有很长的路要走。
在击败柯洁、让 AlphaGo 从竞技比赛退役之后的 5 个月后,DeepMind 发布了第四篇《Nature》论文,介绍了 AlphaGo 系列的新版本 AlphaGo Zero,它学习围棋技能不需要任何人类的知识。在上百万局游戏中,这个系统从零开始逐渐学会了如何下围棋,在仅仅几天的时间内就积累了人类需要数千年的时间才能积累出的知识。在这个过程中,它同时也在这项古老的游戏中发现了非传统的策略、发掘出了新的知识。
DeepMind 相信 AI 在更复杂的问题上也能起到同样的作用,它可以是科学技术工具,也可以是人类创造力的倍增器。AlphaGo 团队现在已经把注意力转向了另一组宏伟的目标,DeepMind 自己也希望这些研究人员们感受到了算法灵感的时刻才是刚刚开始。
via DeepMind Blog,雷锋网 AI 科技评论编译
相关文章:
DeepMind 弹性权重巩固算法让 AI 拥有“记忆” ,将成机器高效学习的敲门砖
重磅 | DeepMind新神经网络学会关系推理,还击败了人类
DeepMind解密黑箱第一步:原来神经网络的认知原理和人类是一样的!
机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸
DeepMind提出SCAN:仅需五对样本,学会新的视觉概念!
DeepMind新论文:在复杂环境中,智能体能更聪明地进行想象和思考了
DeepMind眼中的神经科学研究:人工智能进步的另一个重要支点
DeepMind和暴雪联手发布开发工具和replay数据集,让更多AI研究者玩上星际2
Deepmind语音生成模型WaveNet正式商用:效率提高1000倍
100:0!Deepmind Nature论文揭示最强AlphaGo Zero,无需人类知识
手动调参慢,随机搜索浪费资源?Deepmind异步优化算法PBT解决神经网络痛点
生活中出现AI时我们能信任它们吗?DeepMind 已经开始探索AI安全的答案
雷峰网版权文章,未经授权禁止转载。详情见转载须知。