您正在使用IE低版浏览器，为了您的雷峰网账号安全和更好的产品体验，强烈建议使用更快更安全的浏览器

此为临时链接，仅用于文章预览，将在时失效

人工智能正文

发私信给汪思颖

发送

0

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

本文作者：汪思颖

2017-12-06 10:11

导语：视觉 AI IP 输出者：腾讯优图 ICCV 2017 论文

雷锋网 AI 科技评论按，ICCV（The International Conferenceon Computer Vision）是计算机视觉领域的三大顶级会议之一，腾讯优图实验室在 ICCV 2017 中共投稿 15 篇论文，其中 12 篇被大会录用。录用论文中，被誉为「一键卸妆」的论文 Makeup-Go: Blind Reversion of Portrait Edit 在社会各界引起了强烈反响，引爆社交媒体。另一篇超分辨率的论文 Detail-revealing Deep Video Super- resolution（细节还原深度视频超分辨率）相关技术也已经在 QQ 空间成功落地，各项性能指标均超过谷歌的同类技术。

近日，雷锋网 AI 科技评论邀请到腾讯优图实验室高级研究员沈小勇，他为我们详细介绍了腾讯优图实验室和前面提到的两篇论文：「一键卸妆」（Makeup-Go: Blind Reversion of Portrait Edit）和视频超分辨率（Detail-revealing Deep Video Super- resolution）。

嘉宾简介：沈小勇，腾讯优图实验室高级研究员，浙江大学本科、硕士，香港中文大学博士、博士后。主要研究深度学习在图像视频处理理解中的应用，包括图像增强、分割、物体检测识别、运动与深度估计等，在 CVPR、ICCV、ECCV 等顶级会议和 TPAMI、TOG 等顶级 Journal 上发表论文超过 15 篇。

以下为他的分享内容：

雷锋网的网友们，大家晚上好，非常高兴能在这里进行直播，我今天分享的题目是《视觉 AI IP 输出者：腾讯优图 ICCV 2017 论文》，我是沈小勇，腾讯优图高级研究员，目前在优图主要进行人工智能的技术研究及开发工作。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

这是我的个人主页，我本科和研究生就读于浙江大学，博士就读于香港中文大学。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

下面是对腾讯优图的简介，我们主要立足于人脸识别、图像识别、音频识别三个方面的研究。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

下面是优图在基础研究、平台数据以及业务场景三方面融合的生态。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

这是优图实验室2017年最新的技术突破。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

今天我重点要跟大家分享的是腾讯优图在 ICCV 2017 上发表的其中 2 篇论文。

Makeup-Go: Blind Reversion of Portrait Edit

我分享的第一篇论文是 Makeup-Go: Blind Reversion of Portrait Edit，即一键卸妆，给你一张处理过的图片（比如经过美图秀秀把人变白、变美之后的图片），把软件处理之前的样子恢复出来。一般情况下，现在有很多图片处理 APP，我们想知道在美颜处理之前是照片是什么样。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

下面是未经过美化的图片。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

美化之后脸上的痘痘消失了，皮肤变得非常光滑。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

想要把图片恢复成处理之前的状态，难点在哪里？

简单暴力的方法是既然有输入图片和输出图片，能不能训练出一个神经网络自动学会处理图片。在这里我们做了一个简单实验，是2016年 CVPR 的一篇文章，一个非常深的网络。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

下面是输入和输出。从这里可以发现，即使用了一个那么深、学习能力那么强的网络，还是和最初的图像有很大差别，比如说皱纹和雀斑，都恢复得不是那么完美。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

为什么现在的 CNN 网络不能恢复原来的图片？图像里包含很多东西，如果只是简单用 CNN 去回归，只能回归出非常少的 component，我们在图像恢复时发现了一个非常重要的信息，叫 component domination effect，这篇文章重点针对 component domination effect 来改变一键卸妆效果。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

首先我们对 L2 loss 进行分析，可以对其进行分解，F 是神经网络的输出结果，y 是 ground truth。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

我们在这里发现，实际上可以对 L2 loss 进行分解，分解成 PCA 不同 component 的线性组合。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

可以继续对其进行展开。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

怎么理解 component，我们从大到小分解出来。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

这里是我们所做的网络，称为 component regression network。相当于把图经过 PCA 分解为不同的成分，接下来我们希望通过不同的 subnetwork 把每一个 component 都能回归得很好，最后把各个 component 综合在一起，得到最终的结果。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

接下来是我们的实验结果，可以证明这个网络对于一键卸妆是非常有效的。绿色线条是我们的结果，在 component 为 40 时就能达到比较好的效果。大家可以看到与 Euclidean loss 和 Perception loss 的比较。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

下面的这张图经过美图秀秀处理，把雀斑、皱纹都去除了，可以看到我们复原的结果与 ground truth 修饰的结果的比较。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

下面是一张 overly touched 图片，图像过度平滑，颜色都改变了，我们恢复的结果能把丢失的细节很好地复原出来。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

下面是更多的结果，我们在网上随便找的照片，可以很好地把图中雀斑和皱纹恢复出来。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

这个网络并不对所有案例都有效，下面是对 Trump 的图片的处理，虽然能把图片恢复出来，但和 ground truth 比还是有差别。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

这个工作的总结如下：一、我们在做图像修复时发现了非常重要的性质 component domination effect；二，提出 component regression network，在很多领域有非常强的应用。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

Detail-revealing Deep Video Super- resolution

第二篇论文是 Detail-revealing Deep Video Super-resolution，目前做出来的效果在业界非常好。

首先讲一下我们做视频超分辨率的 motivation。一，这是一个非常传统和基础的问题；二，应用非常非常多，比如说在监控场景下分辨车牌号。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

对于视频超分辨率之前的工作，可以分为两类，一类是 image SR，一类是 video SR，具体的研究工作如 PPT 所示。我们这篇文章在别人的基础上把研究向前推进了一步。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

下面是这个问题的难点。一是怎么去得到非常 effective 的网络，二是模型的问题。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

首先介绍我们方法的优势：一是 sub-pixel motion 更好的运用，二是在视觉和数量上我们的结果比之前好很多。另外这个模型是 fully scalable 的，可以是任何输入大小，实现任何倍数放大。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

下面是我们方法的网络。怎么解决刚才提到的那些问题呢？一是设置 Fully convolutional，二是 SPMC 层没有任何参数，三是 Conv LSTM。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

下面是我们的分析。对这个网络，我们输入三个相同的帧，效果不是很好，而输入三个连续的帧可以得到比较好的效果。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

第二个分析是将 SPMC Layer 和 Baseline 进行比较，SPMC 在此处效果更好。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

通过对比可以看到我们的方法比之前的 Bicubic、BayesSR、DESR、VSRNet 都要好。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

最后分析下运行时间，我们的方法优于 BayesSR、MFSR、DESR、VSRNet。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

最后总结：一是这个工作是端到端的，有很好的适应性，二是提出了 SPMC layer，三是我们的方法质量很高，速度上有较大提升。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

下面是对我们腾讯优图 X-Lab 的简介。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

这是我们的团队照片，目前我们团队大概有 30 多个人。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

最后我还想在这里来个简单的广告，目前我们团队处于飞速发展中，如果大家对我们团队有兴趣，欢迎加我微信。

腾讯优图实验室高级研究员沈小勇：ICCV 2017 一键卸妆&视频超分辨率论文详解

视频：

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

8人收藏

分享：

相关文章

汪思颖

编辑

关注AI学术，例如论文

发私信

当月热门文章

最新文章

热门搜索

小米 360 Apple Pay Groupon GAIR 双十一 Kindle 苹果发布会 Lyft 边缘计算蓝牙

为了您的账户安全，请验证邮箱

您的邮箱还未验证,完成可获20积分哟！

重发邮箱修改邮箱

请验证您的邮箱

立即验证

完善账号信息

您的账号已经绑定，现在您可以设置密码以方便用邮箱登录

立即设置 以后再说