0
本文作者: 木子 | 2018-01-30 10:06 |
自2017年以来,人工智能(AI)的发展热潮已经蔓延到集成电路领域,不仅如英伟达、海思、英特尔等大厂但凡有个风吹草动就能霸占头条,诸多新晋公司也相继重磅发布了有关人工智能芯片的产品。如果说当今科技界什么最火,AI芯片毫无疑问是最大热门之一。
泓观科技(otureo.ai),由三位清华校友创立于2015年的科技型公司,一直致力于通过边缘计算实现深度学习高效率赋能于嵌入端设备和应用,与上下游合作伙伴携手共筑人工智能产业生态。一贯低调潜行的他们,也在用着自己的方式开拓着另一条产品线,如今破茧而出——面向物联网(IoT)物联端率先推出超低功耗异步AI芯片,上演了一次另辟蹊径的厚积薄发。
泓观科技选择了一个AI芯片领域中独特的发力点潜心磨砺,提出并设计了一种全新的基于异步架构的卷积神经网络AI芯片,剑指loT物联端的超低功耗智能化场景应用需求,可以极大的降低loT场景下智能数据分析所需的功耗。目前,首款该类芯片已经由泓观科技的团队率先设计完成并实现流片(如下图),这是迄今面向IoT领域的异步架构AI芯片的第一次问世。
泓观科技的创始人向雷锋网介绍到:“从近20年前我们进入清华大学微电子学专业读书时算起,虽然后面的职业生涯不断带来更多元化的知识背景,但毕竟都算是集成电路这一行里多年的从业者了,对于芯片这个庞大产业的自身规律有着自己的理解和认知。既然决定在AI芯片这里也做点儿事情,构建第二产品线,我们希望选择一个独特而有趣的着力点,对应具有一定差异化的应用领域和生态位置,同时可以与我们依托平台型系统芯片的第一产品线,兼容互补,相得益彰。”
泓观科技所采用的异步架构,与这个领域中先前已推出的各类AI芯片有着显著的区别。先前的AI芯片有一个共同的特点,就是遵循功能与性能优先的设计原则。其针对的应用场景主要分为两类:基于云端的在线计算和基于前端设备的离线计算。前者如Google TPU系列、比特大陆Sophon系列等;后者如Movidius Myriad系列、海思包含NPU的Kirin970、Apple包含Neural Engine的A11等,即使作为前端AI芯片,其应用环境也集中在手机、无人机等高端设备上。
然而对于IoT设备及其应用场景而言,上述AI芯片的架构与特点并不适合。“一则因为loT 设备通常专注于某种单一功能,例如针对视频采集的设备一般情况下无需运行语音识别和自然语言处理的相关算法;二则相较于手机、无人机这样的高端设备,大部分loT设备的刚性需求在于超低功耗,性能并非第一考虑因素。”泓观科技的创始人这样告诉雷锋网,“像我们这样,遵循着完全不同的设计原则和技术路线来实现卷积神经网络AI芯片,可以说有点卓尔不群甚至颇为超前。就目前已知的媒体报道,我们应该是率先实现异步卷积神经网络电路方案并实现流片的创业公司,不论在中国还是世界范围内。”
关于这款具有首创意义的超低功耗异步卷积神经网络AI芯片,泓观科技的创始人向雷锋网予以了颇为详尽的讲解。
“首先要从架构设计上入手。IoT 设备大多无需集成通用型芯片,只需根据应用需求设计定制架构即可。”泓观科技在芯片架构上专注于卷积模型所支持的特定操作(如卷积、池化等),并针对识别场景的特点,考虑芯片工艺、面积、片上存储等因素,对支持的网络架构加入一定的约束(如层数、通道数量等)。
“大量的loT设备只有在被唤醒时才工作,设备经常处在休眠状态,如何在设备休眠状态下严格控制功耗产生,是重中之重。”在这个环节,泓观科技采用了异步(asynchronous)电路技术,与常规的同步(synchronous)电路对比(如上图),异步电路能够保证芯片在设备休眠时,产生的功耗可以忽略不计。
“接下来优化访存同样是一个关键环节。”受限于芯片面积和成本,片上存储的容量也非常有限,传统解决办法是引入大量的片外I/O 访存,但由于 IoT 设备的自身特点,偏低的片外访存效率会导致性能下降和功耗增加。泓观科技则采用了多层融合的架构技术(如上图)来减少 I/O 访存——通过架构和算法的交互优化(co-design),保证算法层的输出数据能够被有效缓存。
此外,神经网络操作对数据存在较强的鲁棒性,因而网络对于数据的精度变化并不敏感。泓观科技通过定点化处理神经网络,使用16位数据甚至更低的比特数可以保持网络性能基本不下降,并通过自动化搜索不同网络层定点化配置的方法,对权值和输入/输出采用不同的策略(如上图)。
同时,泓观团队设计了一种自动化剪枝算法(如上图),对神经网络的每一层建立单独的剪枝参数,从而解决了神经网络本身存在的冗余性。
基于上述设计要点的异步卷积神经网络芯片,其整体框架图如上。泓观科技的创始人告诉雷锋网,“在同样的芯片制程、达到相同性能的情况下,位于芯片active ratio(工作时间占比)较低的应用区间,相比基于传统同步电路,采用异步电路设计可以显著减少功耗,而这一区间恰恰是大量的物联网终端智能化应用场景的分布重心。”下图显示了不同active ratio条件下,同步电路和异步电路的功耗对比。可以看到,在物联端应用重点分布的低active ratio区间,采用异步架构的AI芯片,可以将功耗降低近一个量级甚至更多。
这款独特而全新的异步卷积神经网络芯片,其功能聚焦于物体识别等智能化视觉分析,面向可穿戴设备、智能家居、自供能(如太阳能)监控等对超低功耗有刚性需求的IoT终端领域,逐步赋能实现AI应用落地。“这个路线及发力点的选择,来源于我们对技术发展和市场定位的思考与判断。” 泓观科技的创始人这样总结到,“届时从不久的未来里回望,这款芯片所代表的特质,应当不再是独特和另类。对于AI和IoT这两大领域的广泛交汇和深度融合,相信这一次意味着一个开端。”
雷峰网原创文章,未经授权禁止转载。详情见转载须知。