0
就在林元庆离职创业之际,曾经与林同门的NEC Labs系师弟、前Snap资深科学家、Snap研究院创始人之一王孝宇博士,于近日宣布加入深耕安防领域的人工智能公司云天励飞,出任首席科学家兼AI副总裁。
如果说MSRA是军风统一的黄埔军校,那NEC Labs无疑是百花齐放的西南联大。
前者低调、务实的风格贯穿整个人工智能研究圈,后者雷厉风行的行事风格为AI创业注入了源源不断的活力,掀起多股AI浪潮。
MSRA的影响力毋庸赘言,而很多人较为陌生的NEC Labs所培养出的余凯、周曦等人已经成为细分领域的领头人之一,刚刚从百度离职的林元庆也投入到创业大潮,书写自己AI历程的下一篇章。
而今,王孝宇的归国无疑让智能安防江湖的角逐更加激烈。
“非常快。”
在问到回国后的第一感觉时,王孝宇不假思索的说出这三个字。
“国内人工智能圈的节奏,无论是技术迭代还是业务推进速度都远超硅谷,这很让我兴奋。”
连续六个月KITTI无人驾驶数据库识别任务冠军;2013年ImageNet美国第一,全球第二;美国国家标准局性别识别第一和年龄识别第二;大规模细粒度图像识别研究中,二十万张图像数据集中识别600多种差异较小的车型,准确率高达96%。
这便是作为团队一份子的王孝宇在NEC Labs任职期间交出的成绩。
在NEC Labs打下了结实的算法基础后,2015年,王孝宇加入了当时仅有一百多人的Snapchat,并与李佳一同创办Snap研究院,主导Snap计算机视觉研发,研究云端的视觉解决方案和手机端的人脸检测、识别、分割方案,AR,商业图像智能等,尤其在模型压缩上取得了非常优秀的成果。
当时王孝宇团队把运行在2亿手机终端的神经网络压缩到2MB,超过Google研究团队的压缩性能。
在NEC Labs专攻计算机视觉基础技术研究,在Snap研究手机端的消费级AI功能,虽然两个地方做的事儿都让王孝宇充满干劲,但他明白,这并不是自己内心真正想要的。
“这次我回国加入云天励飞,就是想让AI更直接地为传统行业赋能,这里我需要强调下‘ 更直接’。”
“我选择人工智能公司的标准是,在业务上脚踏实地,在服务模式上和行业结合紧密。这家公司要懂得如何做行业解决方案,而不是单纯的人工智能技术提供商,只做人工智能这一单点技术。”
云天励飞是一家很To B、更加注重实际落地的智能安防解决方案商,相反,王孝宇的基础研究和消费级AI研究背景,与新东家所做的事有些不同,这时候往往会遇到水土不服的问题。
此前笔者与美的人工智能研究所所长俞大海交流时,安防出身的他谈到消费级和企业级人脸识别产品的算法、软硬件方案,几乎可以用“完全不同”四字形容。消费级产品是以用户体验为主,而企业级产品更多讲究的是功能实现。
在研究侧重点和客户需求迥异的情况下,王孝宇却并不担心。
“05年到08年期间,我本人就已经在安防领域创业,公司叫创世科技。这三年间,我不仅熟悉了安防业务的流程,也深谙行业痛点,所以基本上不存在行业水土不服的问题。”
随后,他继续补充道,过去由于智能摄像头架设数量有限,客户方往往看重安防解决方案的准确性,对速度的要求并不严格。但近两年随着各家顶尖供应商识别精度差异越来越小,智能摄像头覆盖数呈指数级增多,前端设备的处理速度成为了重要的比拼点。
目前云天励飞在深圳龙岗区架设了3000多路智能摄像头,在全国有6500+多路部署,这些摄像头都需要大量的视频处理能力,如果未来当规模达到数万甚至几十万路级时,更需要强大的前端强大的分析能力,快速反馈结果,并降低服务器端的压力。
“过去大家都在拼性能,但算法的壁垒会越来越低,到那个时候相差百分之几的数字比拼本质上并没多大差别,真正的差别在于谁的算法能在嵌入式端和大规模数据中实时运行。”
“15年我们创立Snap研究院时,Google等巨头都把App的AI功能放在云端处理,但是云端成本太高且速度较慢,于是我们决定把它放在手机端。当时团队做了世界上唯一个运行在两亿手机设备上的神经网络系统,这套系统可以在几十毫秒内把人脸检测、识别、分割全部完成,而且功耗很小。其实这些手机端的CV研究经验,很多都可以沿用在摄像头前端。”
加入云天励飞后,王孝宇的第一要务是对公司的算法和大数据进行进一步的规划。
“在大数据上,我们计划积攒超过千万人的数据系统,增强训练。算法创新上,我们想让自己的算法在千万和亿级数据集上得到更好的效果,开发算法自动化系统,缩短研发周期。”
在人人都谈人脸识别率可达99%以上时,某安防集成商高管告诉雷锋网,他们曾使用了两家计算机视觉公司的人脸识别方案,最终在某个场景中的实战准确率分别为30%-40%和70%左右,准确率相差百分之四十之多,后者已经是行业顶级水平。
王孝宇指出,这个现象其实就能反映出AI实战的重要性。
由于实验室库中的数据量较小,产品单一,模型训练相对简单,因此能够达到很高的精度。研究者们能够轻而易举在LFW中取得非常可观的成绩,主要因为LFW仅有一万数据量。但在实际应用场景下,方案商面临的底库完全能够达到几百万、几千甚至上亿人级,精度会立马下降。
而且在安防实战动态底库数据比拼当中,各家公司完全不在同一起跑线上。
除了底库外,复杂的应用场景,如远距离、夜晚、侧脸、逆光等环境都会对识别影响很大。
“我认为半年到一年以后,绝大部分公司的算法和性能都可能处于同一条起跑线上。但技术领域有个规律,当A条件成熟之后,就会对B条件产生新的要求。”
如马斯洛需求理论把人类的需求,像阶梯一样从低到高按层次分为五种并层层递进一样,科技这一行,客户对供应商的技术要求也会随着低层需求的满足,从而对其他条件提出更高的要求。
“性能和速度之后,就是智能摄像头硬件的比拼,尤其是硬件价格的比拼。”
“同样的算法、同样的精度、同样强大的处理能力,有人只需要1万块的硬件就能架设完,而有人可能得花费10万。虽然近些年算法方案的价格战屡见不鲜,但更残酷的硬件价格战正在来临。”
寒冬将至之际,云天励飞也在这个关键节点发布全新产品IFBOX V3.0,可应用于传统摄像头改造,硬件产品二次开发等。该产品采用嵌入式设计CPU+DSP架构,提供较高性价比的视频图像处理及人脸识别解决方案,最高支持到每秒50+人脸抓拍,15+个人脸特征值提取;数据库最高可以支持超过20W,并实现每秒15+个人脸的数据库对比。
目前云天励飞也已聚集了一个40多人的团队研发AI芯片,并将于明年生产投片,为客户提供“芯片+算法+数据+应用+服务”端到端的整体解决方案,全面进入备战状态。
一边为安防“硬”战筹备粮草,云天励飞一边也在探索安防之外的场景。
安防中可以标识人身份的有两种重要信息:人脸和车。
王孝宇谈到,为了更全面的掌握“人”的信息,除了老本行对“人”的检测和识别外,云天励飞接下来最有可能做的事情将围绕车来展开,完成在各种复杂环境下对每一辆车的识别等。
“但我们也不得不考虑另外一个问题,当无人车普及后,私家车更多会以共享的形式出现,这时候车辆信息在人身份中扮演的角色权重就会下降。因此我们需要提前预判新的场景,并筹备新的解决方案:当用户进入共享无人车时,这时需要摄像头来捕捉到进入车的人是谁,汽车端的监控方案会成为必需品。"
做解决方案得随时考虑未来可能发生的状态,随着场景的改变,很多应用也会随之改变,王孝宇总结到。
随后他又谈到基于监控摄像头的新应用。
众所周知,互联网是收集用户线上行为数据、构建人用户画像的重要平台,而用户线下的行为数据却很难采集。
这时候,安装在城市中的亿万个摄像头将会成为构建人线下用户画像的新平台。
云天励飞希望通过对城市用户画像,挖掘这中间的数据附加值。
“我在Snap也有做过相关的研究,我们在这方面的技术能力全球领先。”
除此之外,云天励飞的新研究团队具有广泛的AI技术研发实力,如医学影像和无人车等,但有些传统行业的数据壁垒和商业壁垒比技术壁垒更高,还处于战略调研阶段。
“云天励飞选择进入某个行业比较慎重,得深入调研我们团队对这个行业有没有一个好的思路,好的积累。等到对商业模式有充分把握后,再去用技术实现。”
确实,过去人工智能企业野蛮生长时期,商业模式很容易被技术误导。
微软亚洲研究院副院长张益肇曾告诉雷锋网,很多AI创业者们在切入某个场景时,既没捋顺流程,也没想清模式。单纯觉得我有AI技术,有几个合作伙伴,就能大干一场。
于是技术先行,在没认清自己,想好业务时,直接用人工智能去撬动整个行业。
好者,在碰的鼻青脸肿后吸取经验不断保持商业模式和产品的迭代,最终走对路;坏者,一蹶不振。
虽然前者“精益创业”式的产品开发手段在移动互联网时代被互联网界热捧,但在企业级产品中,这种方式并不是所有公司、投资方和员工能承受得起的。
“我们相对属于保守派吧,AI技术的拥有者得对传统行业抱有敬畏之心。”王孝宇笑着说道。
作为有着优秀实验室背景的研究者,王孝宇还有一项重要任务是在美国西雅图建立AI Lab,专注做更加前沿的工作。
过去云天励飞围绕业务创立了应用机器学习组和机器学习框架组,探讨如何搭建更好的框架,更高效地做训练,更高效地采集数据,更直观地做可视化,满足公司几个月内的技术需求。
“AI Lab主要聚焦在6个月到2年内的前瞻性研究,很多时候,当你钻进一个很细的应用之后,不站在外面看问题,很难看到更多改进的空间,我们非常需要有这样一群人去看6个月到2年后的技术走向。”雷锋网
雷峰网原创文章,未经授权禁止转载。详情见转载须知。