您正在使用IE低版浏览器，为了您的雷峰网账号安全和更好的产品体验，强烈建议使用更快更安全的浏览器

此为临时链接，仅用于文章预览，将在时失效

人工智能开发者正文

发私信给AI研习社

发送

0

一篇卷积神经网络的编年史

本文作者： AI研习社

2017-07-11 15:03

导语：卷积神经网络一共有几种？又经历了怎样的演变？

雷锋网按：提起卷积神经网络你会想到什么？LeNet、AlexNet 还是 ResNet？它们之间有哪些差别和特点，又经历了怎样的发展和演变？本文将针对这一话题展开讨论。原文作者杨熹，载于作者的个人博客，雷锋网经授权发布。

人工神经网络模型整体上的发展过程如下图所示：

一篇卷积神经网络的编年史

一篇卷积神经网络的编年史

上图对比了本文所述的各种神经网络之间，操作复杂度和精度之间的关系。

LeNet5

1998， Yann LeCun 的 LeNet5。

图像特征分布在整个图像上。

在具有很少参数的多个位置上提取类似特征时，具有可学习的参数的卷积是个比较有效的方法。

在没有应用GPU的时候，能够保存参数和计算就成了一个关键优势。

LeNet5并没有把每个像素都作为大型多层神经网络的一个输入，因为图像是高度空间相关的，如果用了这种方法，就不能很好地利用相关性。

LeNet5 的主要特征：

CNN 主要用这3层的序列： convolution, pooling, non-linearity；
用卷积提取空间特征；
由空间平均得到子样本；
用 tanh 或 sigmoid 得到非线性；
用 multi-layer neural network（MLP）作为最终分类器；
层层之间用稀疏的连接矩阵，以避免大的计算成本。

一篇卷积神经网络的编年史

Dan Ciresan Net

2010， Dan Claudiu Ciresan and Jurgen Schmidhuber 的 Dan Ciresan Net。

是比较早的GPU神经网络之一，在 NVIDIA GTX 280 图形处理器上实现了9层神经网络的前向后向计算。

AlexNet

2012，Alex Krizhevsky 的 AlexNet。

是LeNet的一个更深和更广的版本，可以用来学习更复杂的对象。

AlexNet 的主要特征：

用rectified linear units（ReLU）得到非线性；
使用辍 dropout 技巧在训练期间有选择性地忽略单个神经元，来减缓模型的过拟合；
重叠最大池，避免平均池的平均效果；
使用 GPU NVIDIA GTX 580 可以减少训练时间，这比用CPU处理快了 10 倍，所以可以被用于更大的数据集和图像上。

一篇卷积神经网络的编年史

OverFeat

2013年12月，Yann LeCun的纽约大学实验室的 OverFeat。

是AlexNet的衍生，提出了 learning bounding boxes。

VGG

2015，牛津的 VGG。

率先在每个卷积层中使用更小的 3×3 filters，并将它们组合成卷积序列。

虽然小，但是多个3×3卷积序列可以模拟更大的接收场的效果。

这个想法也在最近的Inception和ResNet网络中有所应用。

NiN

2014，Min Lin, Qiang Chen, Shuicheng Yan 的 NiN。

它的思想很简单但是很有效，使用1x1卷积给一个卷积层的特征提供了更多的组合性。

每个卷积之后使用空间MLP层，以便在另一层之前更好地组合特征，而没有使用原始像素作为下一层的输入。

可以有效地使用非常少的参数，在这些特征的所有像素之间共享。

一篇卷积神经网络的编年史

GoogLeNet and Inception

2014，Google Christian Szegedy 的 GoogLeNet and Inception。

在昂贵的并行块之前，使用1×1卷积块（NiN）来减少特征数量，这通常被称为“瓶颈”，可以减少深层神经网络的计算负担。

它用一个没有 inception modules 的 stem 作为初始层。

用类似于NiN的平均池加上softmax分类器。

一篇卷积神经网络的编年史

Inception V3 (and V2)

2015年2月，Christian 团队的 Inception V2，2015年12月，Inception V3。

在每个池之前，增加 feature maps，构建网络时，仔细平衡深度和宽度，使流入网络的信息最大化。

当深度增加时，特征的数量或层的宽度也有所增加。

在下一层之前，增加每一层的宽度来增多特征的组合性。

尽量只使用3x3卷积。

一篇卷积神经网络的编年史

ResNet

2015，Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun 的 ResNet。

这个网络绕过了2层，可以被看作一个小的分类器，或者一个NiN 。

这也是第一次训练了大于100甚至1000层的网络。

在每一层，通过使用更小output的1x1卷积来减少特征的数量，然后经过一个3x3 层，接着又是一个1x1卷积，这个方法可以保持少计算量，同时提供丰富的特征组合。

一篇卷积神经网络的编年史

Xception

2016，François Chollet 的 Xception。

这个网络和 ResNet and Inception V4 一样有效，而且用了更简单优雅的结构。

它有36个卷积阶段，和ResNet-34相似，不过模型和代码和ResNet一样简单，并且比Inception V4更易理解。

这个网络在 Torch7／Keras / TF 都已经可以应用了。

一篇卷积神经网络的编年史

英文参考：

http://t.cn/R6V1ELT

雷锋网相关阅读：

YJango的卷积神经网络——介绍

杂谈CNN：如何通过优化求解输入图像

雷峰网版权文章，未经授权禁止转载。详情见转载须知。

6人收藏

分享：

相关文章

AI研习社

编辑

聚焦数据科学，连接 AI 开发者。更多精彩内容，请访问：yanxishe.com

发私信

当月热门文章

最新文章

热门搜索

创业云服务语音识别 Apple TV Foursquare iWatch xbox Ninebot 交互设计数据库 api

为了您的账户安全，请验证邮箱

您的邮箱还未验证,完成可获20积分哟！

重发邮箱修改邮箱

请验证您的邮箱

立即验证

完善账号信息

您的账号已经绑定，现在您可以设置密码以方便用邮箱登录

立即设置 以后再说