0
本周,一年一度的高性能计算大会ISC如期而至,世界TOP 500超级计算机排名也随之更新公布,对比去年的榜单,今年TOP 10的榜单中,来自美国新能源部劳伦斯伯克利国家实验室的Perlmutter系统新晋入围。
在TOP500的榜单中,中国超级计算机的数量虽然下降至186台,但对比位居第二的美国的123台,依然遥遥领先。
一个值得注意的事实是,此次榜单中有342套系统采用了英伟达技术提供加速,对比去年的333套提升2%,榜单上使用InfiniBand的系统数量也比去年增加了20%。另外,名单上更新的两个新系统“超级云”,能够同时满足AI、高性能计算(HPC)和云端需求。
这意味着,高性能计算正在同AI加速融合,而在这一融合趋势下,英伟达在超算领域的优势前所未有。
不止是TOP10中的8台,新晋系统也选英伟达
雷锋网此前在《全球TOP10超级计算机8台都选英伟达的三大原因》一文中分析过,由于高速数据互连技术的普及,以及英伟达GPU系统能够提高将超算的能效提升2.8倍,全球TOP10超级计算机中的8台都采用了英伟达GPU或InfiniBand网络技术。
在最新公布的榜单中,不少新晋系统也都选择英伟达提供支持,其中包括云端的两个新系统。
Microsoft Azure是其中之一,在TOP 500榜单上连续占据第26位到第29位,利用集群将公有云服务提升到新的水平。作为新兴的共享超级计算机,地球上的任何用户都可以按需使用。
在Azure系统的背后,有8个NVIDIA A100 Tensor Core GPU为其各个虚拟实例提供动力支持,每个芯片都有自己的HDR 200G InfiniBand 通信接口,可以与Azure云中的数千个GPU建立高速连接。
剑桥大学的新系统Wilkes-3是另一个超级云系统,也是世界上第一台云原生超级计算机。该系统使用了320个连接在HDR 200G Infiniband 网络上的 A100 GPU,且有经过优化的NVIDIA BlueField DPU提供安全、虚拟化的数据处理,保证虚拟资源的隐私性和安全性。
此外,本次进入TOP10的新系统Perlmutter,以 64.59 Linpack petaflops 在 TOP500 中排名第 5,也是由来自英伟达6144个A100GPU提供动力支持。
国家能源研究科学计算中心 (NERSC) 数据和分析服务组代理负责人 Wahid Bhimji 表示:“AI是美国能源部的一个增长领域,其可行性已被验证,正计划投入生产。”
英伟达更新超算平台,加入三项关键技术
为了持续满足高性能计算对AI的需求,英伟达也在本次ISC大会上发布全新的HGX A100系统,且已经在英国爱丁堡大学托管的DiRAC超级计算机中落地。
英伟达HGX A100加入了三项关键技术:NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand 网络和 NVIDIA Magnum IO GPUDirect Storage 软件。
其中,A100 80GB PCle GPU采用NVIDIA Ampere架构,与A100 40GB相比其内存带宽带到2TB/S,提升25% 。更高的内存容量和内存带宽,能够将更多的数据和更大的神经网络保存在内存中,从而最大限度地减少节点通信和能耗,研究人员也能获得更高的吞吐率和更快的结果。
在网络方面,英伟达并购Mellanox后,释放 InfiniBand高效网络潜能。InfiniBand 作为全球唯一具有完全负载转移功能的网络内计算互连系统,英伟达为此配备了NVIDIA Quantum-2固定配置交换机和模块化交换机。
NVIDIA Quantum-2 模块化交换机最高可提供 2048 个 NDR 400Gb/s InfiniBand 端口(或 4096个 NDR200 端口)的可扩展端口配置,双向总吞吐量达到每秒 1.64 PB,是上一代 HDR InfiniBand 模块化交换机系列的5倍。
NVIDIA Quantum-2 交换机具有向前和向后兼容的特性,可以轻松迁移和扩展现有的系统和软件。
在软件方面,Magnum IO GPUDirect Storage软件提供了GPU内存和存储之间的直接内存访问,能够实现复杂工作负载处理性能。英伟达称,应用程序通过直接路径从低 I/O 延迟中受益并能够使用网络适配器的全部带宽,同时减少 CPU 的利用负载并管理数据消耗增加所产生的影响。
目前,英伟达最新HGX高性能计算平台已落地英国爱丁堡大学,为其托管的新型DiRAC超级计算机Tursa提供动力支持。
爱丁堡大学的 Peter Boyle 教授对HGX所提供的支持表示肯定:“Tursa 旨在应对独特的研究挑战,为科学建模和仿真解锁新的可能性。NVIDIA 加速计算平台提供超大规模服务,通过精确平衡网络带宽和FLOPS 来以实现这项研究所需的出色性能,进而助力新发现。”
几十年前,学术研究中心尝试模拟原理的相互作用,吸引了航空航天、医疗健康等多个行业的注意,但其所需要的巨量计算阻碍了发展研究,直到加速计算和深度学习的出现,才使得高性能计算落地得以推进。
“得益于各种进步,我们正处于高新能计算革命的开端。”黄仁勋如此评价当下高性能计算的发展。
雷锋网雷锋网
相关文章:
里程碑式Google TPU v4重磅发布! 单个Pod性能是世界第一超算的两倍
雷峰网原创文章,未经授权禁止转载。详情见转载须知。