英特尔IDF PPT揭秘：高性能计算和深度学习发展的趋势（下）

本文作者：黄鑫

2016-08-19 17:40

导语：在上篇中我们主要在讨论硬件上的一些问题和方案，在下篇中，让我们来看看一些算法上的改进。

雷锋网按：在上篇文章中，我们看到了深度学习对计算量的迫切程度。以及介绍了一款Intel为此设计的处理器：代号为KNL（Knights Landing）的高性能CPU Xeon Phi。在下篇我们将为大家展示一些深度学习语言开发者们针对这些需求和新硬件做出的调整和改进。

在上文的末尾提到了著名的开源学习框架Caffe。不过，来自伯克利大学的原始版本的Caffe语言在处理的数据规模太大时需要的时间太长了，并且默认情况下并不支持多节点、并行文件系统。因此不是很擅长超大规模的深度学习运算。不过由于Caffe是开源的，因此理论上任何人都能对其进行自己需要的改进。Caffe的多种功能事实上都有很好的被改进以支持集群并行计算的潜力。而浪潮集团在原版Caffe的基础上加以改进，开发出了第一代支持在KNL上进行丛集并行计算的Caffe版本。支持英特尔的Luster存储器、OPA网络和KNL丛集。

英特尔IDF PPT揭秘：高性能计算和深度学习发展的趋势（下）

浪潮集团将这个改进版的Caffe框架命名为Caffe架构，下图是关于Caffe-MPI在KNL上进行运算时的结构的一些解释。可以看到，其计算流程采用MPI主从模式，使用多个KNL处理器组成节点网络，主节点使用一个KNL，而从节点可以视需求由N个KNL构成，因为使用了专为HPC设计的Lustre文件系统，因此数据吞吐量并不会限制到计算和训练。OPA架构也保证了网络通信的顺畅。软件系统方面，支持Linux/Intel MKL和Mvapich2 。

英特尔IDF PPT揭秘：高性能计算和深度学习发展的趋势（下）