2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

本文作者：三川

2017-05-11 08:23

专题：GTC 2017【直播】

导语：新一代 GPU 架构 Volta 横空出世！

编者按：北京时间 5 月 11 日 00：00，万众瞩目的英伟达 CEO 黄仁勋 Keynote 演讲，在加州圣何塞举行。全场长达两个多小时，本场主题演讲的话题涉猎面其实很广： VR、Volta、超算、GPU 云服务、自动驾驶芯片、以及机器人训练。英伟达也恰恰在 GTC 举办的同时，公布了2017年第一季度的财报。财务数据显示，NVIDIA在2017第一季度营收同比增长48%，达到19.4亿美元。看来，英伟达已经如同老黄所说，已完全转型成为领先的 AI 企业。

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

今年的 NVIDIA GTC 开发者大会，与往年颇有些不同。

北京时间 5 月 11 日 00：00，万众瞩目的英伟达 CEO 黄仁勋 Keynote 演讲，在加州圣何塞举行。全场长达两个多小时，雷锋网记者在媒体中第一位入场，坐在了前排中央。然而，整场演讲下来，老黄并没有一句提到游戏。

本场主题演讲的话题涉猎面其实很广： VR、Volta、超算、GPU 云服务、自动驾驶芯片、以及机器人训练。但是，所有这些话题都有一个共同点：要么基于 AI、深度学习技术，要么为 AI、深度学习技术服务。

英伟达也恰恰在 GTC 举办的同时，公布了2017年第一季度的财报。财务数据显示，NVIDIA在2017第一季度营收同比增长48%，达到19.4亿美元。在过去一年里，NVIDIA致力于深度学习的计算系统解决方案极大推动了语音识别、机器视觉、虚拟助手、自动驾驶等领域的发展，而其在各行各业的核心开发者也成为这家“核弹公司”源源不断的增长动力。

发布五大革命性产品

看来，英伟达已经如同老黄所说，已完全转型成为领先的 AI 企业。本届 GTC 的主题，便是 AI & 深度学习。当然，还有划时代的深度学习硬件 Volta。下面，便是本届 GTC 英伟达发布的五大革命性产品：Project Holodeck、Volta、英伟达 GPU 云、Xavier DLA，以及 Isaac 机器人模拟机。

Project Holodeck

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

Project Holodeck 是老黄发布的第一个产品，堪称是本届 GTC 的开胃菜。它将 VR 和 AI 的顶尖技术相结合，所构建的 VR 社交、工作空间。它有三大特点：

照片级逼真的视觉
物理交互
协作

其中最大的亮点，无疑是物理交互体验。老黄表示，虚拟共享空间必须要遵从物理定律，否则就无从营造真实世界般的沉浸感。相比之下，同属 VR 社交空间应用的 Facebook Spaces，并没有这么强调物理属性。

英伟达与顶级跑车制造商科尼塞克合作，甚至请科尼塞克创始人 Christian Koenigsegg 利用 VR 化身（上图中的虚拟人）“现身”说法。

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

演示中，有两个细节值得我们注意：

当 VR 化身触摸方向盘时，其“手掌”并不会像网游那样穿过方向盘，而是能实实在在地握住它。雷锋网获知，用户还能在 Project Holodeck 里举起东西。这充分展示了“物理交互”。
Project Holodeck 导入了科尼塞克最新车型（上图）的全部三维数据——不仅仅是外观，还有内饰、零件。随老黄一声令下，整部车分解成一个个的独立零件；展示了让 VR “不止于社交”的可能性。

Project Holodeck 将于 9 月开放早鸟体验。

Volta 架构

没错，Volta 终于来了。继 Pascal （帕斯卡）之后的新一代 GPU 架构，在万众期待下亮相。对于绝大多数观众，不论 GTC 推出了多少 AI 工具，都无法遮掩 Volta 作为本届大会心脏的事实。

毕竟，英伟达今后二至三年的 GPU 产品线，全都要由 Volta 供血。虽然 Volta 架构的游戏显卡最快在今年底才可能与大家见面，但通过深度学习卡，也可一窥 Volta 的满血性能。那么在本届 GTC，英伟达推出了哪些基于 Volta 的产品？

答案是 Tesla V100，以及基于它的深度学习计算机 DGX-1 和 DGX Station。

Tesla V100

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

“迄今为止英伟达难度最高、最复杂的项目；
耗费数千工程师数年光阴来完成；
全世界有史以来最昂贵的计算机项目（研发支出为 30 亿美元）。”

说的就是 Tesla V100，基于新一代 Volta 架构。但英伟达在它身上实现的壮举远不止与此：

Tesla V100 的芯片面积是惊人的 815 平方毫米，约等于一块 Apple Watch，真正达到光刻技术的极限。老黄说：“不可能做出比这再大的 GPU 芯片……我把这看做是几乎‘不可能实现的’，是制造技术的一项不可思议的惊人绩业。”
来自三星的 16GB HBM2 显存，带宽达到惊人的 900 GB/s。

详细规格见下图：

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

Tensor Core

相比 Pascal，Volta 有全新的张量运算指令，这就是 Tensor Core。

它既是指令也是数据格式，是 4*4 的矩阵处理阵列。它使得 Volta 的训练吞吐量达到了 Pascal 的 12 倍，推理吞吐量达到 6 倍。借助它，Tesla V100 的张量运算能力达到 120 TFLOPS。

TensorRT

它是 Volta 的高性能神经网络推理引擎，或者说编译器。目的是为推理运算快速地优化、验证、部署训练好的神经网络。

老黄解释道：”训练完成之后，用于训练神经网络的框架会生成图。图需要为你使用的处理器进行优化、编译。我们把这称为 TensorRT。“

面向推理（inference）

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

众所周知，深度学习运算可被分为训练和推理两部分。从前， N 卡只关注训练，而在 Tesla V100 上，英伟达终于对推理“动真格”。老黄表示，从 Volta 开始，英伟达 GPU 将对训练、推理兼顾，可谓是革命性的突破。如图所示，Tesla V100 的推理运算速度是 Skylake CPU 的十余倍不止。CPU、FPGA 和 TPU 们怕了么？

性能对比

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

这是 Tesla K80、P100 与 V100 三代架构的性能对比。在 Caffe2、Microsoft Cognitive Toolkit（CNTK）、MXnet 三大框架上，V100 取得了数倍的性能提升。以 Caffe2 为例，训练时间由 K80 的 40 多小时，缩减到 V100 的不到 10 小时。

DGX-1V、DGX Station 和 HGX-1

深度学习超级计算机 DGX-1 也把 GPU 升级为 Volta，这便是 DGX-1V。

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

它内置八块 Tesla V100，运算能力为惊人的 960 Tensor TFLOPS。老黄表示，过去 Titan X 需花费八天训练的神经网络，用 DGX-1V 只需八个小时。它相当于是“把 400 个服务器装进一个盒子里”。

售价 149000 美元，即日起接受预定，第三季度出货。

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

DGX Station 则是缩小版的 DGX-1V，老黄称其为“Personal DGX”，堪称是终极深度学习PC。英伟达内部已经使用很久，每个工程师要么有 DGX-1V，要么有 DGX Station，再要么两个都有。这次，老黄决心把它推向市场。

它内置四块 Tesla V100，运算力因而是 DGX-1V 的一半。1500W 功耗，使用水冷。售价 69000 美刀。

另外一个基于 Tesla V100 的新硬件产品是 HGX-1。这是英伟达与微软合作开发的公有云服务器。老黄声称，这是业内首个堪称标杆的云图形加速器。它内置八块 Tesla V100，设计时就考虑了公有云服务器必需的多种任务处理与全能性。

英伟达 GPU 云

“这是世界上首个混合深度学习云平台”，老黄说。

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

每一名深度学习工程师大概都深有体会：在一台设备上创建、设置开发环境并不是一件省心的事。这花费的时间可能是整整一天，可能是一个星期、一个月，也可能灰心丧气干脆放弃。

为解决这一开发者的痛点，英伟达推出了 GPU 云。它的亮点非常直接——在几分钟内设置好本地开发环境。而这，只需要打包下载一整套英伟达优化、整合好的深度学习软件包。开发者所有需要的库和框架都包含在内，并且用容器 NVDocker 隔离。

它支持全部深度学习开发框架。当然，为利用云端成白上千 GPU 的强大计算力，开发者可一键在英伟达 GPU 云设立开发环境，上传工作进度。

英伟达 GPU 云将在七月公测。

开源 Xavier DLA

Xavier 是英伟达的自动驾驶 AI 处理器。它的创新之处在于，整合了 CPU、GPU 以及 DLA 三大处理器的优点：

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

雷锋网注：DLA 即深度学习加速器，前段时间很火的谷歌 TPU，便是 DLA。

Xavier 同时具备 CPU 的单线程性能，CUDA 的并行加速能力，以及 DLA 的计算机视觉特殊功能。

老黄宣布，为加速深度学习技术的普及和进步，将开源 Xavier DLA 供所有开发者使用、修改。初期版本将在 7 月开放，完整版本将于 9 月公开。

Isaac 机器人模拟机

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

Isaac （艾萨克）这个名字，来自于两个人：一是象征物理学的艾萨克·牛顿，二是象征 AI 的艾萨克·阿西莫夫。这是英伟达倾力打造的终极机器人 AI 虚拟训练环境。

在真实世界人为训练机器人有先天的局限性：人力成本过高，风险大，耗时长，效率极低。解决的方案，便是在虚拟环境进行机器人训练。这有点类似于训练智能体的模拟器 Deepmind Lab 和 OpenAI Gym。事实上，Isaac 直接连通 OpenAI Gym，借助后者的强化学习功能。

充分利用了英伟达在物理引擎上的造诣，老黄表示，Isaac 的目标是打造一个遵从物理定律的“alternate universe”（替代空间）。虚拟训练空间将完全遵从现实世界的物理定律，除了时间。理想的情况是，在模拟机中学习过的机器人，就相当于已经预训练过。

2小时、5大AI 新品、英伟达股价暴涨17%，GTC大会上黄仁勋都讲了些啥？（内附PPT） | GTC 2017

而在时间上，机器人 AI 将以多重“分身”在 Isaac 中进行训练，每轮训练中最聪明的那一个，将进入下一轮分配给每个智能体；再从中选出表现最好的那一个进入下一轮，取代上一轮的所有智能体……

如此往复，以训练出最聪明的机器人 AI。

后摩尔定律时代的新出路

与GTC第一天的内容集中在图像处理不同，在两个小时的演讲中里，只有在开场不久列举深度学习对图像处理效果的改善以及中途演示《最终幻想》两处与图像处理有关，其他的时间中，老黄大谈特谈的是AI，是深度学习，是计算能力，是数据中心，是为开发者提供更有效的硬件与平台。

在2016年，得益于人工智能红利，英伟达股价累计涨幅接近200%，成为标普500指数涨幅第一名。而在这次GTC大会上，老黄的演讲再一次赢得了资本市场——在演讲中，英伟达的股价一直上升，到收盘时涨幅为17.83%，市值达到了720亿美元。

如同黄仁勋开场所言：我们需要找到摩尔定律之后的路。在摩尔定律实效、微处理器增速降低到每年10%的今天，GPU 计算的崛起已经在引领着人工智能的革命。有这样一组数据可以佐证：在过去5年中，GTC参会者增加了3倍，增长到7000人；GPU开发者增长11倍，增长到超过50万人......而这一切对于英伟达来说只是一个时代的开始。

关注雷锋网微信「leiphone-sz」，回复「0511」，获得现场完整PPT。

Nvidia推出视频分析平台Metropolis，让你化身未来城市中的“江湖百晓生” | GTC 2017

Nvidia GTC大会首日现场直击：立足图形计算，更多想象 | GTC 2017

Nvidia 发布VRWorks Audio SDK，欲解决VR音效这个大难题 | GTC 2017

科大讯飞：携手NVIDIA后，应用领域效率提升了50倍 | GTC 2017

GTC大会第二日亮点：NVIDIA将推出多用户VR系统，计划培养100000名开发人员 | GTC 2017

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

10人收藏