0
本文作者: 谷磊 | 2017-05-30 17:22 |
在5月27日的全球机器智能峰会 GMIS 2017 上,英特尔人工智能产品事业部(AIPG)数据科学部主任刘茵茵发表了主题为《演变中的人工智能:与模型俱进》的演讲,她分享了如何用同一种模型为不同行业提供解决方案,以及如何让各个行业的专家建议推动整个人工智能生态系统的发展。
演讲结束后,刘茵茵接受了雷锋网等媒体采访。
人工智能领域中的解决方案包括模型设计、数据收集、AI 框架搭建等不同组成部分。
除了这些部分,各行业从业者的思考,譬如哪些问题是可以解决的、什么样的解决方案是有效的,也对整个生态系统的发展有至关重要的作用。
用于图像的模型是最常见的一种深度学习模型,然而一种模型可以投入到不同的领域中给出多样的解决方案。例如,图像识别可以用于农业,进行作物疾病的识别。即使缺少针对这一个细分领域的数据集,我们也可以通过在 ImageNet 数据集上训练好的通用图像分类器上添加层数和微调,以迁移学习的方法搭建针对特定领域的高效图像识别模型。
而图像分割则可以用于作物产量的预测,还可以应用于自动驾驶。即使这个问题更难、数据注释更难获得,我们也可以用游戏引擎直接生成场景图片来进行用于自动驾驶的模型的训练。
在油气勘探、肿瘤检测任务中,用于图像的模型也提供了大量的解决方案。
另一种常见的深度学习模型是用于序列的模型。我们用序列模型为金融业从业者提供了内容概括解决方案,帮助他们从海量的数据中找到和自身任务相关的信息。序列模型也被用于基因组学、语音识别等其他领域。
深度学习推动着人工智能领域的进展,模型是我们的起点,然后我们收集不同的需求、解决这些问题、再将相关经验反馈到模型中。在不断重复这个循环的过程中,我们就可以设计更好的模型,并更加高效地提供解决方案。
Nervana 为这个过程提供全栈式平台,我们提供多样的硬件、库、框架与工具包,最终,我们也收集不同领域的经验,融入到平台的设计中,使更多人获益。
我们希望,人工智能最终能为整个社会做出贡献。
刘茵茵
以下是媒体采访实录,雷锋网做了不改变原意的整理:
1、能否简单介绍下英特尔AIPG?
刘茵茵:之前我们是英特尔Nervana的团队,现在整体已经变成了AI产品事业部。英特尔一直致力于在AI方面做到前瞻和领导位置,现在有这个独立的部门来专门负责这个事情,就是希望将英特尔在AI方面做的一些原本分散的产品或者研究,放在一个更连贯的生态环境里,提供给用户和其他行业的人。
具体到队伍的组成和分工,基本上是跟着产品走的。有硬件部分的同事来设计下一代芯片;也有软件的同事从事开源的架构和硬件的支持;然后就是做数据科学和做算法的团队,他们可以在上端和外面的用户做接口。
因为AIPG在两个月前刚刚成立,想要把所有的东西都整合到一个连贯的平台上也是需要时间的,所以很多东西都是在不断的变化当中的。
2、英特尔在中国会不会成立类似AIPG这样的部门?
刘茵茵:AIPG和英特尔其他的产品事业部的运作模式是一样的,也是一个全球化的机构,它们都是关注全球市场的。
3、目前业界在推动深度学习方面有不同的思路,比如CPU+GPU的模式,TPU+TensorFlow的模式,英特尔的思路和优势是什么?
刘茵茵:英特尔奉行端到端的模式。作为一个非常强大的硬件生产公司,英特尔提供了很多不同的产品。同时在软件架构方面也做了很多工作,而且软件架构都是开源的,这样用户可以及时跟进我们的软件的进度。
在软件架构方面我们再提供各种各样的解决方案,在这种端对端的平台上,用户如果有什么问题的话,英特尔平台可以帮助用户选择出最合适的硬件。
硬件方面我们也整合了一些过去的经验,针对深度学习的运算量和工作量的瓶颈,把解决的方法放到了我们下一代的芯片里面,叫做Lake Crest。在Lake Crest上,我们专注于提供运算的包容量,除了在运算速度方面,我们设计了很多存储架构来提高利用率,并且解决带宽的问题。
Lake Crest是一种新的架构,是专门针对深度学习而设计的。可以理解为它是一种基于张量的操作,而且在数据表示上也做了很多工作,是专门用来支持深度学习的。它和CPU配合在一起,为了应用和负载,定制的一款集成电路芯片,专门进行深度学习的加速。
4、能否再详细谈谈从模型到方案这方面的工作?
刘茵茵:很多时候一个模型是来源于一篇学术文章,学术文章一般提供一个新颖的想法和方向,但一般学术文章里模型并不能直接用于产品级别的商业方案里。就拓展性来说,很多时候模型会用到很多常用的计算单元,这样我们可以在环境里将它们做个更好的架构,然后它才可以提供一个比较好的接口,这样我们就能引用不同的模型来干同样一件事情。这就是从一个模型到商业方案的过程。
在实现方面,英特尔奉行端到端,从上至下各个部分都可以进行优化。在优化后,速度会有很多的提升,也会变得更稳定。在提升的过程中,也可以引用其他的一些部分,联合在一起,作为一个商业的模型。对于数据科学,很多模型在参数调整或流程并不是那么成熟,所以我们就要结合数据科学的的一些经验,将一些东西完善一下。
*文中图片为雷锋网编辑现场拍摄。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。