0
本文作者: 汪思颖 | 2018-11-03 22:52 |
雷锋网 AI 科技评论按,就在上个月,波士顿动力在 YouTube 上刷了一波 Atlas 2 的新技能。从视频中可以看到,相比今年五月在跨越障碍时还得停顿片刻,这次 Atlas 2 可以直接奔跑着跨越了。
Atlas 2 这次秀出的技能分为两段,跨越障碍+三级跳,这次的技能衔接和释放更为流畅,也受到了众多媒体的一致好评。一方面,大家感叹技术越来越成熟,另一方面,却由于报导在专业性上失实而引得相关研究人员反感。
比如如下言论:
硬件方面其实已经成熟,最难的就是算法,从机器人设计来看,每一种动作背后是一个算法,像是跑步、蹲、跳跃等,要把各种算法软件结合,进而协调双足自由度的运作,其中人工智能在此扮演了关键角色。
从这可以看到他做到了让算法快速迭代,人工智能在此显然扮演了重要角色。
波士顿动力需要用到复杂的人工智能算法,以保证机器人的平衡以及定位和导航功能。
来自意大利技术研究院(IIT),研究方向为仿人机器人的博士生任赜宇,近日就针对此言论发表了非常不同的观点。他认为,现阶段 Atlas 2 只是在极佳性能的硬件平台上使用传统的运动控制方法去实现了这一系列令人震撼的高爆发力的跑跳运动,并没有使用任何与人工智能相关的机器学习算法。
以上言论在他看来都有些「可笑」。「不知道这类信口开河的自信是从何而来」,他如是说道。他也表示,虽然一些做腿足式机器人相关的同行也都义正辞严对以上言论进行了留言和批评,但总的来说,保持头脑清晰、客观理智的人还是少数,大部分人还都在跟风鼓吹人工智能和机器学习。
他进一步谈到,大约从 17 年开始,很多研究人员尝试将机器学习的理念应用于腿足式机器人,尤其是双足机器人的行走(locomotion)控制中,取得了很好的成果。但大方向上,还是体现了当前机器学习类方法在双足机器人硬件平台上落地的局限性,包括训练周期长,可供采集的样本少,机电系统不稳定性带来的 corner case ,设置 Reward 难度大,仿真模型和实际模型相差太大等等,还有相当长的道路要走。
现在机器人界对机器学习这类新的方法和可能是非常开放的,但对于把现阶段将波士顿动力的核心定位于人工智能+机器学习,是极其不合适的。初衷也很简单:
一方面,明明是一群做机电液压系统实现+传统运动控制的硬件和控制工程师辛勤工作的成果,凭什么要被人工智能收割?
另一方面,还原事实真相,找准现阶段的差距和发展方向,我们才能尽可能缩短和别人的差距,否则只能被疯狂收「智商税」。
任赜宇进一步解释,波士顿动力创始人 Marc Raibert 已经在很多场合公开声明「目前没有使用到机器学习相关的算法,仍是基于传统的运动控制去做实现,但并不否认未来使用的可能性」。
在今年马德里 IROS 的 Planetary Talk 上,他也和朋友在会场又亲耳听 Marc Raibert 重复了一次,并且今年他的导师(Nikos G. Tsagarakis)被邀请为 Marc Raibert 的 Planetary Talk 的介绍人,和 Marc Raibert 私下聊了很多,再三确认过现阶段 Atlas 2 仍然是基于传统的运动方法。
从 Marc Raibert 在 IROS 整场 Plantary Talk 传递的观点来看,任赜宇认为波士顿动力 Atlas 2 的核心是在于其:
独一无二性能极佳的硬件平台 +「饱经锤炼」的运动控制算法(QP+RHC)
独一无二性能极佳的硬件平台
Atlas 2 相关的集成结构与液压系统
这类高能量密度、高集成紧凑度、高结构强度的液压元件与机电系统,很难在地球上找到第二家。Raibert 在今年 IROS Planetary Talk 也提及:Atlas 2 的动力源液压泵是做到了极小尺寸的高能量密度(5kw/5kg)——「You can not find it anywhere else in the world.」Raibert 相当自豪地说到。
对于「硬件方面已经成熟」这种言论,任赜宇表示,不知这样的自信从何而来。另外,更不要谈拥有硬件平台之后,后续相应的优化,维护和调试工作了。
「饱经锤炼」的运动控制算法
具体来说,Atlas 2 的运动控制大方向是基于 QP+RHC (Raibert 2018 IROS 口头叙述):
Quadratic Programming(QP)二次规划;
Receding Horizon Control(RHC)= Model Predictive Control(MPC)模型预测控制。
QP 与 RHC(MPC)是做运动控制的同行比较熟悉的,但把这类大家都熟知的控制方法应用在 Atlas 2 这个大人型上,实现最近我们看到的后空翻、三级跳与跑酷相当困难——需要一个漫长而复杂的基于实际硬件系统(考虑单个驱动器存在的超调、滞后与误差与多个驱动器误差的叠加与耦合)的调试和优化。
任赜宇举了如下两个小例子去简单阐述当前实验室中做的运动控制与波士顿动力的差距:
仿真环境中的运动控制 ≠ 实际硬件平台的运动控制;
小尺寸双足人形(诸如 Nao)的运动控制 ≠ 大尺寸仿人双足人形的运动控制。
他表示,真正好的运动控制算法需要在实际的硬件平台上花心思精力去调试,也即他所指的「饱经锤炼」!
「Marc Raibert 也再次着重提及要大胆在硬件平台上做调试的重要性——『People nowadays are afriad of breaking robots, the right way is building it, breaking it and fixing it!』也希望大家不要以讹传讹,多和国际交流,找准正确的方向,脚踏实地去追赶。」
参考:https://zhuanlan.zhihu.com/p/47984991
雷锋网雷锋网
雷峰网版权文章,未经授权禁止转载。详情见转载须知。