直播丨CVPR最佳学生论文一作王鑫，带来视觉语言导航最新工作分享！

本文作者： AI科技评论

2020-07-31 19:07

导语：2020年8月4日中午12:00点，王鑫老师亲自为大家分享他们在泛化能力问题上的最新工作进展。

视觉语言导航（Vision-Language Navigation），顾名思义，就是让智能体跟着自然语言指令进行导航，即智能体需要结合理解自然语言指令与视野中可以看到的图像信息完成线路规划，从而到达目标位置。

2019年，一篇关于视觉语言导航的论文拿下CVPR2019 最佳学生论文奖，让这一新兴研究方向，迎来高光时刻。

论文的一作王鑫，当时还是加州大学圣塔芭芭拉分校王威廉组的博士生。在拿下CVPR2019 最佳学生论文奖之后，他跟他所在的王威廉实验组仍一直在视觉语言导航这个研究方向深耕，先后在 ICCV、CVPR、ECCV 等顶会上再度发表了多篇相关的研究，包括跨语言视觉-语言导航、视觉-语言导航的泛化能力等等，成为视觉语言导航领域的一大研究主力。

其中，泛化能力问题原本就作为深度学习研究中最难以跨越的鸿沟之一，在视觉语言导航研究中尤甚。

对于这一大难点，这一年多的时间里，王鑫及其所在研究小组又提出了什么新的方法呢？

2020年8月4日中午12:00点，AI 科技评论专门邀请到了王鑫本人，亲自为大家分享他们在泛化能力问题上的最新工作进展，具体包括：