联邦学习：深度学习之后，AI 安防的第二落脚点

本文作者：张栋

2019-11-25 10:56

导语：未来，联邦学习必须生态化。

梦想与现实从来都是纠葛着的，AI也不例外。

以AI落地最多、最快的安防行业为例，过去几年，行业各类神捕、鹰眼等产品让人眼花缭乱。

渐渐地，AI成为了无所不能的代名词。

但是AI在安防行业的真实应用，还有很多现实问题亟需解决。

大规模落地：AI安防仍存两大痛点

宇视CEO张鹏国提到，“当前AI落地能力与用户需求存有较大差距，前者还需面对数据隐私保护与安全管控、低成本、流程再造、组织变革等挑战。”

具体来看，最为核心的痛点有二：

其一，数据不够多元，且异常封闭。

中国拥有庞大的人口数量、用户量及图像采集点，相关企业得到数据之后经过筛选、过滤、叠加、组合，会对自身算法效果有阶段性提升。

但这类提升属于个人式的、微乎其微式的。

每个厂商所建设的AI系统类似一个又一个的“烟囱”，“烟囱式”架构也就是垂直的体系结构。

每一个IT系统都有自己的存储和设备，以及独立的管理工具和数据库，不同的系统不能共享资源、不能交付和访问，形成了资源孤岛和信息孤岛。

由于不同企业的数据库模型设计和针对的目标有所不同，他们也无法直接交换、共享模型。

即便相关企业间的数据库可以融合，但受制于隐私、安全等问题，也绝不可如此为之。

有场景缺数据、有数据难共享。这是包括AI安防在内的诸多行业目前存在的普遍问题，也是阻碍AI普惠的最大痛点。

其二，缺乏优质数据，算法不够精准。

由于缺乏足够优质数据作为训练支撑，大多企业依靠开源框架微创新，然后采用低价策略抢占市场，导致整个行业丧失了做基础原创技术创新动力的案例。

坚持自研是一条漫长且艰苦的路，没人知道数年的努力能不能换得一次数量级的提升，也没人知道高投入后是否得到与之相匹配的回报。

对此有人或许会提到，基于安防行业自身天然的高试错率，小数点后的算法精度数量级提升对于项目的最终归属没有大的改变。

其实，现阶段与安防相关的AI技术精准度还远远没有达到天花板，分类检测、分割、以及对整个图像区域分类问题均还未得到很好解决。

概括而言，AI技术在安防市场上的应用主要还存有几个挑战：

1、认知问题相较感知问题较难解决。感知问题可以用神经网络函数逼近，相比之下认知问题解决起来比较棘手，比如如何教会机器辨识一把椅子。

2、在弱线索、遮挡、模糊、对象追踪等情况下，人类在识别的过程中通常会依据常识，并加入丰富的想象及推理。但是想要将这些能力传授给机器则非常困难。

3、计算机视觉技术带给机器的能力不只是用来观察世界，而是需要与世界建立联系，从而一起做交互，而想要做到“交互”这一步，还有很长一段距离。

基于安防场景的不断变化，其对算法迭代的要求一定是非常严苛且上升的。

在这个市场中，谁能够看到算法精度提升解锁的更多场景，并根据场景的变化做到最为快速且精准的反应，谁就能在未来竞比中走得更远。

联邦学习：AI大规模落地又一革命性突破

一方面，AI在安防行业的探索才刚刚开始；另一方面，做好AI所必须的数据养料有限且质量较差，不同数据源之间存在难以打破的壁垒。

除了少数几家拥有海量用户、具备产品和服务优势的巨无霸企业外，大多数中小型AI安防企业难以以一种合理、合法的方式跨越人工智能落地的数据鸿沟，或者需要付出巨大的成本来解决这一问题。

联邦学习：深度学习之后，AI 安防的第二落脚点

此外，随着大数据的发展，重视数据隐私和安全已经成为一种世界性的趋势，一系列条例的出台更是加剧了数据获取的难度，这也给人工智能的落地应用带来了前所未有的挑战。

何解？

针对这个问题，雷锋网同时采访了六位学术界、工业界领头人，得到的答案比较一致：从目前的研究进展来看，“联邦学习”技术可能是解决以上问题的最佳选择。

联邦学习的概念最初由谷歌在2016年提出，在中国，香港科技大学讲席教授、微众银行首席人工智能官（CAIO）杨强教授算是联邦学习研究第一人。之后包括微众银行、腾讯、平安科技、华为、京东等在内的国内企业和机构推动联邦学习进入了学术研究与行业落地新阶段。

联邦学习之所以能够在如此短的时间里迅速由一个构想变为一门学科，主要因为它可以让参与各方在不披露底层数据的前提下共建模型，之后利用整个数据联邦内的数据资源，提高每个成员的模型表现。

通俗来说，深度学习时代，每个AI企业的技术能力是单打独斗式的；而联邦学习的出现，更为紧密、安全地将各个AI企业联系在了一起，联邦中的每个成员都可以用最快的速度提升自身能力的同时汲取别人的长处，最终获得共同成长。

譬如A厂商有校园数据、B厂商有工厂数据、C厂商有社区数据，且这三家厂商都使用了联邦学习技术。

从业务层面出发，A、B、C这三家厂商便直接获得了两种能力：1、最快速地优化自身业务；2、最快速地拓展新业务。

最快速地优化自身业务表现在，平台每天会有若干个类似A厂商的企业向平台输入加密后的数据模型，而这些数据模型中有A厂商非常缺乏的其他数据信息，而A厂商便可根据这些数据去更新自己的算法模型。

最快速地拓展新业务表现在，A、B、C每家厂商都有各自构建好的模型，通过汇总去得到更大的数据模型，在不流通数据的情况下得到数据流通的最好效果，通过资源互补可以在最短时间内安全地获得对方的能力，去拓展新业务。

从隐私保护层面来看，通常智能摄像头产生的数据会被上传到后台服务器中，然后由部署在服务器上的神经网络模型根据收集到的大量数据进行训练得到一个模型，服务商根据这个模型来为用户提供服务。

这是一种集中式的模型训练方法，这种方式很难保证数据隐私安全。

而联邦学习就不再是让数据发送到后台，而是在每个企业自己的服务器上进行训练，并加密上传训练模型，后台会综合成千上万的用户模型后再反馈给用户改进方案。

相较传统学习模式，联邦学习的优点是显而易见的：

1、在联邦学习的框架下，各参与者地位对等，能够实现公平合作；

2、数据保留在本地，避免数据泄露，满足用户隐私保护和数据安全的需求；

3、能够保证参与各方在保持独立性的情况下，进行信息与模型参数的加密交换，并同时获得成长；

4、建模效果与传统深度学习算法建模效果相差不大；

5、联邦学习是一个「闭环」的学习机制，模型效果取决于数据提供方的贡献。

在传统的方法下，用户只是人工智能的旁观者——使用，但没有参与；而在联邦学习场景下，每个人都是“驯龙高手”，每个人都是人工智能发展的参与者。