0
AI,已经成为芯片业的下一个战场。
10天前,一年一度的世界级芯片行业座谈会HOT CHIPS,再次在硅谷召开。英特尔、英伟达、思科、ARM、AMD、高通等一大批芯片行业的巨头也出席了会议,并且纷纷在本次会议上带来了他们的最新成果。
毫不意外地,AI相关的内容占据了很大比例,比如微软新提出的BrainWave、Google最新公布的TPU细节,都成为了热点话题。值得一提的是,国内AI芯片创业公司深鉴科技也是这次活动的金牌赞助商之一,亲临现场的他们也在回国之后第一时间向雷锋网介绍了此次座谈会的情况。首先我们先来看看此次会议中一些值得关注的分享。
在此次的HOT CHIPS上面,微软分享的内容主题为“Accelerating Persistent Neural Networks at Datacenter Scale”,实际上是对如何利用云端硬件处理大量AI需求的一整套思考和实践。
微软首先对硬件做出了自己的界定,他们将现有的能够处理AI需求的芯片统称为“DNN Processing Units(DPU)”,其中还分为以FPGA为基础的“软DPU”,以及相对更加固化、在形态上更接近于ASIC的“硬DPU”。
微软也借这个机会第一次宣布了自己的FPGA云项目“Project BrainWave”,它归属于“软DPU”。有趣的是,百度的SDA跟深鉴科技也出现在了“软DPU”的阵营当中。对应的,Google TPU、Intel Nervana、Movidius都出现了在“硬DPU”阵营当中。
在接下来的演讲中,微软详细地介绍了BrainWave的Stack。
这个架构还具备一定的延伸性,能够在数据中心中用多颗FPGA实现大规模的运算阵列。
至于BrainWave的具体架构,微软也进行了分享。
在此次的座谈会上,来自Google的大神Jeff Dean出乎意料地在一张幻灯片中透露了TPU2的规格以及简单架构:
跟上一代一样,每4个TPU2会组成一个运算单元,进而拥有180TeraFlops的浮点运算能力,总共64GB的HBM内存,2400GB/s的带宽。
后续则是一些TensorFlow架构的常规介绍,在分享的末尾,Jeff Dean还做了一个简单的展望,他认为随着计算能力的上涨,神经网络的准确性还将进一步上涨,超越其他计算方法。
就此次HOT CHIPS 2017,雷锋网也专门采访了去到现场的深鉴科技CEO姚颂,并请他以一个旁观者的身份发表了一下自己的看法,以下是采访实录。
雷锋网:作为本次参加并且成为HOT CHIPS的中国Startup,你们在现场是否有观察到半导体业的一些新发展趋势,可否简单的概括一下?
姚颂:Jeff Dean这次会议的Keynote中表示:Machine learning is reshaping system architecture design. 现在的工业界更加关注domain specific architecture的研发,除了单独提供芯片,大家并越来越重视软件的开发,加大对客户的支持,降低开发者的开发难度。另外,FPGA不断受到更高的重视,往常可能只有两到三个关于FPGA的演讲,本次包括百度的 XPU,赛灵思的两个新一代产品,包括RFSoc和大HBM的新FPGA,英特尔 的Stratix 10, AWS 的F1 Instance ,微软的Brainwave等多篇关于FPGA的讨论。这表明了大家更加重视新的架构与可能。
雷锋网:从会议议程来看,Neural Net占用的时间是最多的。这种区分明显不同于之前的CPU、FPGA、ASIC,又或者是应用平台的区分,例如PC、Sever等等。您是怎么来界定这种芯片?
姚颂:很多人都在争论怎么界定全通用的处理器架构,半通用半定制化架构,全定制化架构。其实并不只有这三种选项,他们之间并没有一个清晰的界限,所有的架构可以排布在一个谱系上,彼此是一个渐变的过程。如果从应用的角度来看,不论是CPU,GPU, coarse-grained reconfigurable architecture, DSP,还是DPU, 如Wavecomputing的data processing unit,深鉴的deep learning processing unit,微软的DNN processing unit,最终的应用都是针对神经网路的。所以我认为不论是在前端/后端,还是训练/推理,处理器面对都是深度学习,即使深度学习的应用来自于不同领域,都可以归结为神经网络的芯片。我支持深度学习会重构未来处理器的架构这种观点,所以未来架构上的分类可能会以应用为导向。
雷锋网:参考本次会议,您认为人工智能是否会给整个半导体业带来冲击?您认为中国企业跟世界领先水平之间的客观差距还有多少年?
姚颂:人工智能给半导体行业带来极大的冲击。过去有一套完整的标准,公司根据标准来定义自己的芯片,从而设计更好的芯片。亦或是公司研发出像GPU一类的通用的芯片。而在人工智能的影响下,大家会转向domain specific architecture。有两点非常有趣。第一点,传统上芯片的性能直接影响了销售,而在深度学习背景下,峰值性能不再是决定因素,用户更加关注自己的需求。比如对于语音识别的用户,他们更加关注延迟,而不是单一的增加吞吐量。第二点,用户对于软件的重视是前所未有的。英伟达霸占现在的深度学习市场,不仅是因为强大的芯片,更是因为整个CUDA生态链的优越性,包括TensorRT, 以及对各种框架的支持。软件工具在今天的半导体行业发挥了前所未有的重要作用。
在人工智能时代,中国企业正在急剧缩短与与国际企业的技术水平差距。比如在本次Hot chips 会议上可以看到深鉴的技术与各个半导体巨头平等竞争。但是中国缺乏资深的,有经验的人才。而硅谷可以找到很多有二三十年专业经验的芯片架构师。所以中国可能在专业人才方面略显劣势,但是在整体深度学习技术水平上显示出强大的潜力。
雷锋网:可否透露一下深鉴科技接下来可能的一些动作?
姚颂:深鉴一直希望可以将产品做好,几个月后我们计划集中公布我们的产品,不仅包括具体的行业解决方案,还有我们的软件工具链,以及我们在应用端的成绩。整个人工智能行业的发展不断推动创新公司从发展团队到重视发展产品,从产品中盈利,这也是深鉴努力的方向。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。