您正在使用IE低版浏览器，为了您的雷峰网账号安全和更好的产品体验，强烈建议使用更快更安全的浏览器

此为临时链接，仅用于文章预览，将在时失效

人工智能正文

发私信给奕欣

发送

0

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法 | CVPR 2018

本文作者：奕欣

2018-03-07 11:34

专题：CVPR 2018

导语：来自北京邮电大学和美国伊利诺伊大学（UIUC）的研究者们提出一种适用于密集人群计数的空洞卷积神经网络模型 CSRNet。

雷锋网 AI 科技评论按：本文作者为美国伊利诺伊大学（UIUC）张晓帆，他为 AI 科技评论撰写了基于 CVPR 录用论文《CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes》的独家解读稿件，未经许可不得转载。

论文地址：https://arxiv.org/pdf/1802.10062.pdf

来自北京邮电大学和美国伊利诺伊大学（UIUC）的研究者们提出一种适用于密集人群计数的空洞卷积神经网络模型 CSRNet。该网络模型摆脱以往广泛应用于人群计数的多通道卷积网络方案，在大幅削减网络参数量和网络训练难度的同时，显著提升了人群计数的精度和人群分布密度图的还原度。该研究已被 CVPR 2018 接收。

人群计数和人群密度估计有着重要的安防应用场景。随着城市人口的日益增长，在地铁站，商场，各种节日集会中，超额聚集的人群带来潜在危险，极容易造成踩踏、骚乱等悲剧。因此，人群计数和人群的密度分布估计成为安防领域的热门课题。近年来，人群计数的算法性能在与深度学习的结合下得到了很大的提升。

人群计数的目的是找出特定场景中的人数，而人群密度分布估计需要获取空间密度信息和人数（密度图求和）。人群计数的难点在于，场景的变化跨度大，目标的尺度变化不尽相同，人和人、人和景物之间存在不同程度的遮挡等等。如图 1 所示，三张图均包含了 95 人，但是他们的空间分布完全不同。

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法 | CVPR 2018

图 1 人群计数场景

作者研究发现，被广泛运用在人群计数上的多通道卷积网络（MCNN）存在着结构冗余、参数繁多、训练困难的局限性。此类多通道卷积网络在不同通道上采取大小不等感受域的卷积网络，以适应不同场景（如高、中、低密集程度）的人群计数需要。但研究发现，不同通道学习到的特征重合度很高（图 2），并没有因场景密集程度不同而出现明显差异。多通道网络表现冗余。为作对比，作者采用一个参数更少、更深层、更易训练的单通道卷积网络（A deeper CNN），获得比多通道网络更好的效果（表 1）。

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法 | CVPR 2018

图 2 多通道卷积网络中的大、中、小通道在 ShanghaiTech PartA 中的测试表现相似

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法 | CVPR 2018 表 1 更深的单通道卷积网络使用较少参数却在 ShanghaiTech PartA 中获得更小误差

此外，作者为了避免过度使用降采样而导致密度图的分辨率损失，在网络的后半部分引入了空洞卷积层，利用空洞卷积增大感受域并维持分辨率（图 3），并提出 CSRNet 网络模型（表 2）。CSRNet 后端四组不同的配置在 ShanghaiTech PartA 中性能测试如表 3。

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法 | CVPR 2018

图 3 使用卷积+池化+上采样（上）与空洞卷积（下）输出同样分辨率图像，空洞卷积可保留更多图像细节

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法 | CVPR 2018 表 2 CSRNet 网络结构，卷积以参数命名为（conv kernel size – channel – dilation rate）

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法 | CVPR 2018

表 3 CSRNet 的四种后端配置在人群计数中精度对比，其中方案 B 精度最高

由于采用比多通道网络更简单的结构，CSRNet 在训练时可直接采用端到端训练并快速复现实验结果，也可利用迁移学习提高训练效果。得益于简单、规整的网络结构，CSRNet 对硬件实现更加友好，可以高效地部署在物联网设备中。

实验表明，CSRNet 在四个公开人群数据集（ShanghaiTech dataset、the UCF CC 50 dataset、the WorldEXPO'10 dataset、the UCSD dataset）和一个车辆数据集（TRANCOS dataset）上均达到了最高水平的精确度（State-of-the-art Performance），详见表 4 至表 8。

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法 | CVPR 2018

表 4 ShanghaiTech 数据集测试结果

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法 | CVPR 2018 表 5 UCF CC 50 数据集测试结果

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法 | CVPR 2018 表 6 WorldExpo' 10 数据集测试结果

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法 | CVPR 2018

表 7 UCSD 数据集测试结果

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法 | CVPR 2018

表 8 TRANCOS 数据集测试结果

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

13人收藏

分享：

相关文章

专题

CVPR 2018

本专题其他文章

more

奕欣

初心者

扫描关注作者微信

发私信

当月热门文章

最新文章

热门搜索

索尼科大讯飞 Oculus chrome 强化学习扎克伯格特朗普移动游戏奇点数据分析手机游戏

为了您的账户安全，请验证邮箱

您的邮箱还未验证,完成可获20积分哟！

重发邮箱修改邮箱

请验证您的邮箱

立即验证

完善账号信息

您的账号已经绑定，现在您可以设置密码以方便用邮箱登录

立即设置 以后再说