0
本文作者: 林少宏 | 2017-02-23 11:08 |
在万众期待中,Google云计算平台日前推出了支持云端GPU加速服务的公开测试版,第一款支持的GPU型号是NVIDIA 的Tesla K80,使Google云平台的性能获得了巨大提升。现在,用户可以在谷歌云平台的三个地区玩转基于NVIDIA GPU的虚拟机,包括美东1区(us-east1),东亚1区(asia-east1)和西欧1区(europe-west1)。目前只支持使用gcloud的命令行工创建虚拟机,但从下周起就可以云终端界面来创建虚拟机啦。
据雷锋网了解,如果用户的深度学习算法需要额外的计算资源,其最多可以在自定义的Google 云计端虚拟机上连接将8个GPU(4块K80的板子)。 GPU可以加速多种类型的计算和分析,包括视频和图像转码,地震分析,分子建模,基因组学,计算金融,仿真,高性能数据分析,计算化学,金融,流体动力学和可视化。
图1 NVIDIA K80 GPU加速器板
用户只需在云端的虚拟机添加GPU, 而不必在自己的数据中心构建GPU集群。雷锋网获悉,Google 云计算平台上的GPU是直接连接到虚拟机的,提供GPU的裸机性能。每个NVIDIA K80 GPU配置了2,496个流处理器和12 GB的GDDR5内存。用户可以灵活地选择1,2,4或8个NVIDIA GPU来构建服务器形态,让运行在服务器上的虚拟机实例拥有最佳性能。
图2 Google Cloud支持多达8个GPU连接到自定义虚拟机,从而优化应用程序的性能。
这些实例支持流行的机器学习和深度学习框架,如TensorFlow,Theano,Torch,MXNet和Caffe,以及NVIDIA流行的CUDA软件,CUDA可用来构建GPU加速应用。
云GPU和谷歌其它基础设施一样,价格是一大亮点。价格按分钟计费,最低消费时长是10分钟。在美国,连接到虚拟机的每个K80 GPU的价格为每小时0.700美元,在亚洲和欧洲,每个GPU每小时0.770美元。和往常一样,用户只需按使用的量支付费用。这样就不需要自己维护一个GPU集群,在零资本投资下获得高速的深度学习和机器学习训练。
图3 GCE的GPU定价
Google云GPU集成了Google 云机器学习(Cloud ML),帮助您节省大规模使用TensorFlow框架训练机器学习模型所需的时间。现在,您不需要花费几天时间在单台机器上用大量的图像数据集训练一个图像分类器,您可以在云机器学习中使用多个GPU执行分布式训练,大大缩短开发周期并快速迭代模型。
Google云机器学习是一项托管服务,提供端到端培训和预测工作流,集成了其他云计算工具,如Google Cloud Dataflow,Google BigQuery,Google Cloud Storage和Google Cloud Datalab。
建议从从低量级开始,在小数据集上并训练TensorFlow模型,然后启动更大的云机器学习,用整个数据集训练模型,以充分利用Google 云GPU的规模和性能。有关Cloud ML的更多信息,请参阅《快速入门指南》并开始使用,查看《Using GPUs for Training Models in the Cloud》这篇档以深入了解Google云GPU。
请在Cloud NEXT(谷歌云计算大会, 3月8日至10日在旧金山举行)上注册账号,然后注册CloudML 训练营,并了解如何使用GPU增强云计算性能。您可以使用gcloud命令行来创建虚拟机,并尝试在该虚拟机上运行TensorFlow,体验加速的机器学习。
详细文档可在在这个网站上查看https://cloud.google.com/gpu/。
本文摘自谷歌云平台博客,作者为谷歌产品经理John Barrus,由雷锋网AI科技评论编译,封面图片 via gsmarena
via GPUs are now available for Google Compute Engine and Cloud Machine Learning
雷峰网版权文章,未经授权禁止转载。详情见转载须知。