6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

本文作者：奕欣

2018-06-20 01:01

导语：盐湖城时间今天上午，雷锋网AI科技评论从前线带来了最佳论文等奖项的颁布。

第 31 届计算机视觉和模式识别大会（Conference on Computer Vision and Pattern Recognition, CVPR）在 6 月 18 日至 22 日于美国盐湖城召开。

雷锋网 AI 科技评论进行全程专题报道。我们从多方渠道了解到，截止目前，雷锋网 AI 科技评论是唯一申请了媒体通道的与会媒体。这也就意味着，雷锋网 AI 科技评论将为国内读者们带来更多独家的一手消息及报道，目前专题页面已经上线，敬请了解：CVPR 2018。

CVPR 2018 大会主席 Byran Morse 向与会者们介绍了大会的基本情况。

6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

CVPR 今年共收到 3309 篇有效投稿，共接收了 979 篇论文，比 2017 年多出了 25%，比 2016 年多出了 52%。其中包含了 70 篇口头报告论文（2.1%），224 篇亮点口头报告论文（6.6%），共计 294 篇。此外，大会还收录了 685 篇海报展示论文（20.4%）。总体而言，提交上来的工作中有 29% 的论文会被接收发表，而被接收的论文中又有 30% 的论文会被推荐作为口头报告。近年来，所有被接收的论文都会能获得海报展示的机会，包括 oral 和 spotlights 论文。

而今年的与会人数也再创新高，共有 6512 人注册了今年的 CVPR 2018。并迎来了 149 家赞助商与参展商，带来超 200 万美金的赞助经费。

6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

从图中不难看到，CVPR 的参会人数与论文录用数都在呈爆炸性增长，这也为审稿带来了不少挑战。在 3359 篇总投稿中，共有 3309 篇论文属于有效提交，方能进入评审环节。每篇论文平均有超过三位评审人进行审核。组委会原本邀请了 2385 名评审人，最终整个 CVPR 大会共产生了超过一万条论文评审意见。

6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

其中，AC（区域主席）们的努力也不可或缺。108 位 AC 与四位 PC（程序主席）及 3 位 GC（大会主席）在多伦多召开会议，最终决议通过了 979 篇录用论文的结果。

6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

在三天主会中要看完 979 篇论文显然是不可能的，因此今年的 CVPR 2018 也采用了多线程多论文并行的模式。这一点在此前雷锋网 AI 科技评论的报道中有提及，不再赘述。

由于种种原因，今年的 plenary talk 临时取消，相应地，论文海报展示与午餐时间也延长了。

6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

大会主席在感谢完 CVPR 2018 组委会成员及赞助商后，就进入了颁奖环节。CVPR 2018 共有五大奖项颁布。

最佳论文

6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

Taskonomy: Disentangling Task Transfer Learning

任务学：任务迁移学习的解耦

论文作者来自斯坦福大学和 UC 伯克利大学：Amir R. Zamir, Alexander Sax, William Shen, Leonidas J. Guibas, Jitendra Malik, Silvio Savarese

6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

论文摘要

视觉任务之间有什么联系吗？比如说，表面正交能不能简化图像深度的估计？凭直觉回答的话好像可以，这似乎表明不同的视觉任务之间有一种共通的结构。对这种结构的了解显然有着不小的价值：这正是迁移学习之中蕴含的概念，也为不同任务之间去除冗余的内容提供了一种原则化的方法，例如可以在相关的多个任务中无缝地重复利用监督信息，或者在同一个系统解决多种问题，同时却不会大幅提高复杂度。

这篇论文中作者们提出了一种完全可计算化的方法为视觉任务的空间结构进行建模。他们的方法是在一组数量为 26 个的 2D、2.5D、3D 以及语义任务中寻找（一阶和更高阶的）隐空间中的迁移学习依赖项。得到的结果是一种可计算的用于任务迁移学习的分类学映射。作者们研究了这种结构的价值，比如非平凡的合并关系，然后用它们降低对标注数据的需求。作者们也提供了一系列工具用于计算以及寻找这种分类学结构，包括一个用户可以为自己的使用需求寻找监督策略的求解器。

6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

如图为计算任务分类学学习到的一例简单的任务结构。它发现，比如通过组合一个表面正交估计器和遮挡边界检测器的学习到的特征，只需要很少的标注数据就可以为重整和点匹配任务快速学习到很好的网络。

论文地址

http://openaccess.thecvf.com/content_cvpr_2018/papers/Zamir_Taskonomy_Disentangling_Task_CVPR_2018_paper.pdf

最佳学生论文

6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

Total Capture: A 3D Deformation Model for Tracking Faces, Hands, and Bodies

完全捕捉：一个用于追踪脸、手、身体姿态的 3D 变形模型

论文作者来自卡内基梅隆大学的 Hanbyul Joo 以及 Facebook 现实实验室（Facebook Reality Labs）的 Tomas Simon, Yaser Sheikh

6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

论文摘要

论文中作者们介绍了一种用于追踪无标记的人类动作的统一变形模型，它可以在多个尺度下工作，包括面部表情、身体动作以及手部姿态。把人类身体不同部位分别的建模结果局部拼合起来就生成了一个初始模型，作者们把它称为「Frank」。这个模型就只需要一个无缝的模型就可以对身体各个部位的动作进行完全的表达，包括面部和手部。作者们创建了一个数据集，其中包含了人们穿着日常衣服的数据，并对 Frank 模型进行优化，得到「Adam」，这是一个经过校准的模型，它和最初的 Frank 模型具有一样的骨骼层次，但参数化要简单一些。最后，作者们展示了这些模型在多视角的环境设置下做完全的动作追踪的效果，它可以同时捕捉一小群人的大尺度身体动作以及微小的脸部和手部动作。

6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

如图为 Adam 重建出的完整的身体动作模型

论文地址

http://openaccess.thecvf.com/content_cvpr_2018/papers/Joo_Total_Capture_A_CVPR_2018_paper.pdf

提名论文

共四篇，分别是：

Deep Learning of Graph Matching
Andrei Zanfir, Cristian Sminchisescu
SPLATNet: Sparse Lattice Networks for Point Cloud Processing
Hang Su, Varun Jampani, Deqing Sun, Subhransu Maji, Evangelos Kalogerakis, Ming-Hsuan Yang, Jan Kautz
CodeSLAM — Learning a Compact, Optimisable Representation for Dense Visual SLAM
Michael Bloesch, Jan Czarnowski, Ronald Clark, Stefan Leutenegger, Andrew J. Davison
Efficient Optimization for Rank-Based Loss Functions
Pritish Mohapatra, Michal Rolínek, C.V. Jawahar, Vladimir Kolmogorov, M. Pawan Kumar

PAMI Longuet-Higgins Prize

6512名学者聚首CVPR 2018，斯坦福伯克利获最佳论文奖，何恺明获青年研究奖

这一「十年时间检验奖」在去年颁给了《Object Retrieval with Large Vocabularies and Fast Spatial Matching》，作者是牛津大学的 James Philbin、Ondrej Chum、Josef Sivic 和 Andrew Zisserman，以及微软研究院的 Michael Isard。今年的奖项颁给了：《A Discriminatively Trained Multiscale, Deformable Part Model》，作者 Pedro Felzenszwalb, David McAllester, Deva Ramanan.