0
本文作者: 任然 | 2018-11-21 16:20 |
雷锋网消息,2018年11月21日,NVIDIA在苏州举办了GTC China大会。四方赶来的与会者对这场在中国举办的技术大会倍加期待,希望黄仁勋在这场技术盛会上能为中国市场带来新鲜劲爆的消息。
10点整,一身职业皮夹克装的黄教主准时登上了演讲台,其强大的个人魅力瞬间引来了全场的欢呼和掌声。
作为一家以高性能计算著称的GPU企业,黄仁勋首先介绍了其全新RTX系列图形处理器的强大能力。
黄仁勋在现场宣布与网易建立技术合作,其网络游戏《逆水寒》将成为国内首款应用实时光线追踪技术的游戏。
现场还实时演示了《逆水寒》的全新技术demo,依托RTX显卡的全新技术和强大性能,游戏的画面表现力达到了一个新高度。在开启RTX之后,游戏的光影的渲染有了脱胎换骨的飞跃,湖面的波光、金属的反射都处理的更加真实,虚拟的世界变得更加鲜活。
除了实时光线追踪,《逆水寒》也将同时支持基于AI的DLSS高性能抗锯齿技术,黄仁勋表示DLSS可带来1.8倍性能提升。
RTX之后,黄仁勋还在现场介绍了其早前发布的GPU加速平台HGX-2。HGX-2由NVIDIA的16个高端V100 GPU组成,使用NVSwitch高速互联总线将16个GPU完全连接为一个整体来使用,其能在单节点中提供2PFLOPS计算性能。
作为云服务器平台,HGX-2具备多精度计算能力,支持面向科学计算和模拟的高精度FP64和FP32计算,也支持AI训练和推理所用的FP16和INT8精度。与仅使用CPU的服务器相比,它将AI机器学习工作负载的运行速度提升近550倍,将AI深度学习工作负载的运行速度提升近300倍,将高性能计算工作负载的运行速度提升近160倍。
黄仁勋提到,浪潮是中国首家构建HGX-2服务器的厂商,浪潮AI超级服务器AGX-5专为解决当前AI深度学习和高性能计算的性能扩展难题而设计。此外,包括百度、腾讯、阿里巴巴在内的诸多客户,也在借助HGX-2为内部应用及云客户提供一系列更强大的AI服务;联想、华为、曙光也已宣布成为HGX-2云服务器平台的合作伙伴。
紧接着,黄仁勋还介绍了其T4云计算卡。T4基于全新 NVIDIA Turing架构,采用多精度Turing Tensor Core和全新RT Core,与加速的容器化软件堆栈相结合,T4的多精度功能可支持4种不同精度等级的各类AI工作负载,助力实现突破性的AI性能,FP32精度能够提供8.1TFLOPS,FP16精度能够提供65TFLOPS,INT8精度能够提供130TOPS,INT4精度能够提供260TOPS。
凭借其强大的加速能力,百度、腾讯、京东和科大讯飞将开始使用Turing云GPU加速超大规模数据中心;浪潮、联想、华为、曙光、浪潮商用机器和新华三均宣布推出基于全新T4的服务器。
黄仁勋在现场演示了基于百度图片识别引擎的demo,在使用Intel Skylake架构的纯CPU服务器时,运算速度只有4~5fps,而换用4块T4计算卡后,运算速度飙升至6200fps。在将计算卡数量增至28块时,运算速度也呈线性增长至43500fps,可见其可扩展性非常优秀。
在详细阐述完上述计算加速硬件后,黄仁勋还简要推介了其开源的 GPU 加速平台 Rapids,该平台于今年10月发布,是一款针对数据科学和机器学习的GPU加速平台,为数据科学家提供标准化的流水线式工具,数据处理速度较仅用CPU提升50倍。
RAPIDS构建于Apache Arrow、PANDAS和SKLEARN等组件之上,通过CUDF数据过滤、CUML机器学习、CUGRAPH数据图像化来加速处理数据,为最流行的Python数据科学工具链带来了GPU提速。
这三套软件工具都是基于CUDA开发,可以把它们看成是CUDA的一部分。其中CUDF与Pandas的功能非常类似,Pandas的所有功能都可以在CUDF里找到对应的API;CUML则对应SKLEARN,无论是分类、聚类、回归等算法都可以在CUML里面找到。而CUGRAPH目前尚未正式推出,预计会在明年正式集成到RAPIDS中。
黄仁勋介绍到,平安科技最近对RAPID进行了试用,这是一个GPU加速的新开源平台,适用于大规模的数据分析和机器学习,让数据科学家首次能够在GPU上运行数据科学管线,并大幅缩短数据集处理时间。
平安科技使用RAPIDS以及GPU加速的PCA和DBSCAN之后,工作流程执行速度加快了80倍,从几天缩短到几小时(包括数据加载和训练时间),这有助于该公司主动做出预测并完善预防计划。
中国最大的基因公司华大基因同样拥有超过1PB的海量数据存放在数据库中。华大基因使用一种名叫XGBoost的机器学习算法,对用于癌症患者个性化免疫治疗的靶向多肽进行分类。他们队在NVIDIA DGX-1 AI超级计算机 超级计算机上运行RAPIDS平台,将分析速度提高了17倍,并将多肽的分析范围扩大至数百万种。
最后压轴出场的则是被NVIDIA寄予厚望的Jetson AGX Xavier AI计算平台。Xavier是世界首个用于自主机器的AI计算平台,在Xaiver基础上,NVIDIA打造了一个全新的产品家族DRIVE AGX,目前两大主力产品为基础的DIRVE AGX Xaiver和高性能的DRIVE AGX Pegasus。
目前,中国很多初创汽车企业、货运公司和领先的供应商为其即将推出的自动驾驶系统平台选用NVIDIA DRIVE AGX开发套件。一汽集团(FAW Group)是中国最大的卡车制造商之一,正在与自动驾驶初创公司智加科技(PlusAI)和物流公司满帮集团(Full Truck Alliance, FTA)合作开发无人驾驶商用卡车车队,计划于2021年进行大规模部署。
据悉,一汽集团将采用运算能力高达每秒320万亿次的AI超级计算机NVIDIA DRIVE AGX Pegasus,为其即将推出的自动驾驶卡车的运行提供支持,并加速中国长途运输行业的升级。
除了汽车制造商之外,Weride.ai、Momenta、图森未来、AutoX以及Roadstar.ai等自动驾驶初创企业也更倾向于选择。目前为止,有超过370家公司在自家自动驾驶生态系统中使用NVIDIA DRIVE AGX Xavier平台。
总部位于中国广州的初创公司小鹏汽车将使用DRIVE AGX Xavier,致力于在2020年打造面向量产车型的L3级自动驾驶系统;SF Motors也计划于明年推出其首款电动分频器SF5,并表示将采用DRIVE AGX Xavier开发下一代自主计算平台。此外DRIVE AGX Xavier还为奇点汽车即将推出的车辆提供技术支持,期望于2020年实现量产L3级自动驾驶产品。
为了展示NVIDIA自动驾驶芯片的强大算力,黄仁勋在现场放出了搭载Pegasus的NVIDIA无人车在硅谷的高速道路上进行了一段实地路测。
在这段总长度为50英里的路测中,驾驶员全程都未触碰方向盘,由无人车自行完成了所有的行车操作。从车上的实时影像可以看出,Pegasus支持的无人车对车道线、标志、各类道路参与者进行实时的识别、分割、追踪,感知效果相当强大。
同时,京东、美团、菜鸟等电商巨头的人工智能配送机器人,均搭载了NVIDIA Jetson AGX Xavier开发者套件。虽然配送车及其电池的尺寸较小,但传感、定位和路径规划所需的处理量与大型无人驾驶车辆相同,且很大程度上依赖于Jetson AGX Xavier 的高性能计算。
此外,Jetson AGX Xavier平台还配备了NVIDIA JetPack SDK。这套完整的AI开发软件解决方案,涵盖了最新版本的CUDA、cuDNN和TensorRT,以及用于简化并加速开发的高级软件代码。基于此,由软件定义的配送机器人等自主机器,完全可以通过线上更新完成性能提高及添加功能等工作。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。