1
本文作者: 李尊 | 2016-09-13 18:35 |
今天下午,在北京举行的GTC China 2016(GPU技术大会)中,英伟达深度学习研究院对CNTK中图像识别功能进行了简单介绍。
首先,我们来了解下CNTK。
CNTK(Computational Network Toolkit)是由微软研究院开发的开源计算网络工具包,它通过一个有向图对一系列的计算步骤进行描述,也是一个统一的深度学习神经网络工具包。
CNTK的总体架构如上图所示,这里我们可以简单地分几部分进行理解,分别是上中下和左中右两种理解逻辑。先说上中下部分,最下面的包含IDataReader这一层可以理解为基础的数据。
想象训练一个典当行的学徒鉴别古董的真假,你需要先拿一些真真假假的古董让他自己去领会,这个就是学习的过程,也是初始数据的输入过程。
学习的结果就是第二层包含CN的东西
可以理解为典当行学徒通过真真假假的古董所领悟到大脑的知识
最上面的IExecutionEngine
其实可以理解是这个典当行学徒的个人行为,顾客拿了一个古董,让其鉴别其真假,这就是最上层的作用或者是意思。
其次左中右部分,最左边是输入的原始数据,这里引入了CN Description也就是网络的描述
可以理解为典当行学徒的师傅给予的指导性意见或者是古董鉴别教科书
而Features&Labels中的Features就是样本或者古董,Labels可以理解是古董样本上标明真真假假的标签
中间的是ICNBuilder是学习的行为的驱使,IDataReader是仔细观察并且检验所学内容的行为的驱使。最右边的ILeaner是学习方法,CN之前解释过了是学习的成果,IExecutionEngine也就是最终拿来真正东西进行检验的行为。
可以说CNTK的总体架构,描述了一个典当行学徒的从入门到精通的学习过程。从样本训练自己,形成自己的能力,然后使用其所学。
根据研究人员的描述,由于具备更为优秀的交互能力,CNTK工具包中图像识别速度比另外四个当下主流的计算工具包都更加受开发者的欢迎。
在微软最新发布的CNTK1.7版本中,CNTK已经支持英伟达的最新的深度神经网络资料库cuDNN5.1。
其实在Facebook、百度等巨头的人工智能研究中,经常用到英伟达的GPU。
Facebook的Big Sur服务器是围绕本来为图片处理而开发的大功率处理器——GPU来设计的。每8个GPU就配置一台Big Sur服务器,Facebook使用的正是擅长于图像识别的英伟达制造的GPU。
百度将把英伟达的GPU应用到其无人驾驶系统的车载电脑中。这台电脑可以解决汽车厂商在融合无人驾驶技术时面临的一大问题:如何将人工智能技术集成到紧凑的电脑中,从而帮助汽车制定决策。除了为无人驾驶、以及深度学习的复杂计算提供强劲性能支持外,它还能够同时驱动多个高分辨率的显示设备,应用于智能汽车中的仪表盘、地图导航、车载中控面板等。
几乎所有巨头都在依靠强大的图形处理单元(GPUs)来进行深度学习应用,从而处理更为复杂的算法,能提高人工智能和识别能力,微软在此方面也不甘落后。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。