14段语录，听懂“AI+安防”的冰与火之歌丨AI 安防峰会 2018

本文作者：张栋

2018-03-08 12:06

专题：2018中国人工智能安防峰会

导语：变革已经成为安防行业的时代主题。

人工智能在安防领域的规模化应用，再次引发了行业的业务重组与利益重构。

这期间，传统厂商从容、科技新秀锐利、资本市场疯狂。显然，“变革”已经成为安防行业的时代主题。

在此大环境下，众多安防大会的演讲内容依然陈旧且同质化严重，嘉宾往往只针对市场、业绩、行业、趋势等主题泛泛而谈，为参会者创造的学习价值有限。

在这个节点，作为“AI+安防”这一报道方向的领跑者，雷锋网将于3月31日举办“2018中国人工智能安防峰会”。届时，一线企业领袖、学术大师、解决方案专家将聚首深圳，围绕“人工智能+视频监控”的前沿技术研究与实战技术落地展开演讲与讨论。（更多大会内容欢迎点击：https://gair.leiphone.com/gair/sd2018）

过去变革的一年里，雷锋网共出品100篇以上的“AI+安防”深度报道，逾50位业内顶级专家向雷锋网深入讲述了他们对智能安防技术与业务的理解与思考。

本文节选了其中11位重要受访人的独到见解，让更多人了解行业引领者遇到的人工智能安防难题与解决方法。

受访人名单：中国工程院院士高文、海康威视总裁胡扬忠、大华股份董事长傅利泉、阿里巴巴副总裁兼iDST副院长华先胜、东方网力董事长刘光、英特尔物联网事业部CTO张宇：宇视科技国际市场部总裁闫夏卿、苏州科达总经理陈卫东、天地伟业总工程师杨清永、商汤科技CEO徐立、旷视科技副总裁陈雪松、格灵深瞳CEO赵勇。

他们看见的行业问题

中国工程程院院士高文：

现有视频监控体系的弊病，使得很多复杂任务无法完成，即便是人工智能大规模渗入后，需求方也往往为了一些特殊目的才加特定的智能摄像头和处理系统。有些专用摄像头只是用来识别车牌号，有些摄像头只用来识别人脸，这种打补丁式的方法实际会带来很多问题。

杭州市通过城市交通管理云进行规划，除了规划信号灯本身外，架设的摄像头每时每刻都在拍路面，并计算车的占有率（即每百平方米路面中车的数量），基于此来判断每条道路的饱和程度，然后对信号灯进行优化。把一个月全天24小时的数据输进去后，重新进行计算。

但这些数据往往不一样，因此需要有一个数据交换平台。如果信号进来，它在摄像头上做编码，传到云端做解码，解码后再去提取特征、做分析等。

这是常规的流程，但这样的系统是不是一个理想智慧城市系统？不是。

这种方式根据以往的数据来做调度规划效果总体不错，但对突发事件无法及时做出判断。最理想的方式不仅可以通过以往的数据统计进行决策、进行查询，而且也可对实时的数据进行处理、分析。

世界各地的紧急事件发生时，系统整体的响应速度实际都比较差。为什么？主要因为现在整个视频监控体系本身造成。

现在的视频监控系统，从一开始就面临数据量太大、存储量太大，查找数据不易等一系列挑战，这些挑战可以归纳成三个问题：存储成本高、检索困难、对象再识别难。

我们不仅要把东西存储起来，而且能够实时对任何想识别、想搜索的信息进行实时操作。现在的系统主要是用摄像头把视频抓进来后压缩，传出去，然后存起来。

很多设有卡口的道路专门安装了卡口服务器，以此来识别车牌号。有些道路还专门安装高清跟踪摄像头，用于踪人和车。

上述情况往往是为了一些特殊目的才加的摄像头和处理系统，这种打补丁式的方法实际会导致很多问题。

简单来说就是你有A需求，便装一个系统，你有B需求，于是再装另外一个系统，然后把所有任务抓取的视频都推到云端，这就是现有系统通常采用的设计模式。因此，行业需要一套更加前沿的方案来解决这些问题。

大华股份董事长傅利泉：

要让人工智能在安防领域大规模应用，首先不得不面临一个问题：贵。

其次，AI近两年才开始逐渐走向商用落地，面临三项机遇与挑战：

1、如何准确把握客户对AI的需求，从而让AI价值最大化，会变得愈发重要。

2、硬件、算法的迭代速度飞快，使得AI正进入高速发展期，但仍有诸多不稳定因素，企业需跟得上技术的迭代；

3、AI推广受到成本的影响，期待在不久的将来能有接近传统芯片价格来实现终端智能化，真正从模拟到网络到智能的转变。

东方网力董事长刘光：

过去十年是安防IT化时代，未来十年将是安防人工智能时代。

未来想让城市变得更安全，必须将Video、AI、IoT三大技术与应用场景融合起来。但这并不是一项简单的工作，两道大山必须移平：

1、人才。目前全球都急需深度学习人才，如何吸引他们加入是个需要深思的问题。

2、AI芯片的发展稍显滞后。目前AI芯片的滞后束缚住了安防厂商的发展。未来一到两年内，这个问题应该很快会被解决。届时，几家安防厂商将会开足马力做产品、做方案、做场景。

在人才缺乏期内，行业里的创业公司通过单一算法优势获取了机会+订单，但本质上并未对传统安防厂商产生大的影响。因为安防行业是一个需要深度了解客户需求、了解整个销售体系、产品体系、方案的行业。

随着国内外学术界、产业界在深度学习领域的不断研究与积累，人才瓶颈会得到解决，国内传统安防公司的AI人才需求将更快得到满足，利用AI切入安防的创业公司将面临越来越大的挑战。

在当今这个技术驱动的时代，想要创业也必须思考两点。第一，自己是否掌握核心技术，人工智能时代与移动互联网时代迥然不同，这个时代最稀缺的就是人才及技术，商业化落地不必太早考虑。第二，自己是否掌握产业资源，如果缺乏技术及人才，也可以通过体外投资与孵化，做一些与预想产业相关的AI产品，机会也很大。

宇视科技国际市场部总裁闫夏卿：

人工智能势头很足，但存在诸多阻碍：

1、不同的系统不能共享资源，不能交付和访问，形成了资源孤岛和信息孤岛；

2、大数据业务有几个要素：及时性、关联性、时空的一致性，但这三点恰恰是大数据应用的三个硬伤。

在残酷的商业环境中，能活到最后的企业一定是懂得“有所不为”的企业，企业在壮大的过程中一定要避开发展途中的“大坑”，做不了的业务坚决不碰。

以大数据的某些应用为例，软件行业有一个“10%规则”，利润只有5%到 8%，任何一个项目，软件定制低于5%就有利润，有10%的修改就得赔钱，但是在大数据行业，远不止10%的定制，大多都是30%到70%的定制。

再比如在智能化的部分场景中，再好的算法、再高清的摄像头，面对北京（超一线城市）任何一个地铁站数秒内拥入的上百人群都无法做到精确感知、识别。

格灵深瞳CEO赵勇：

人脸识别解决公共安全问题仍然微不足道。

我们能够意识到人脸识别尽管在过去几年有着巨大进展，可以在金融领域做身份验证，但它对解决公共安全问题来说是仍旧存在很多难题无法逾越。

这个事实说明人脸识别技术不够好吗？也不尽然。动态人脸识别的问题体现在，假如想象有一天在北京有100万个动态人脸识别的摄像机，而北京有3000万人口，在这种背景下，它每天产生的问题高达数以万万计。在这种情况下，发生错误的机率即使再低，但乘以这么大的基数也会产生海量的误报。所以这个问题的规模非常残酷。

他们预见的趋势与机遇

海康威视总裁胡扬忠：

将人工智能算力注入到“边缘”将是安防行业的大势所趋。随着各行各业的计算业务越来越复杂，对速度的要求越来越高，云计算应运而生。但云计算的使用，要求将计算所需数据全部通过网络传送至数据中心。

这种方式不仅会消耗大量的网络资源，传输过程也会耗费大量时间，高延迟、高能耗、网络拥塞、低可靠性等问题便会出现，因此，将一部分算力注入前端将有效解决这些问题。

未来，海康威视还会根据不同的场合不同的场景不同的方式向客户提供针对性的、适合的、丰富的产品和解决方案，不排除未来将AI技术对外开放的可能性。

苏州科达总经理陈卫东：

安防前几年技术的驱动来自编解码技术的进步、视频分辨率的提升以及传输方式的进步，编解码技术从MPEG-4到H.265、分辨率从一百万像素到4K、传输方式从模拟到智能到IP，从始至终，都是技术在驱动安防的发展。

而下一个重大技术方向就是AI。未来，科达会在AI＋安防这条路上深耕：

第一、把AI赋能到所有的安防细分领域，进行水平拓展，AI功能不仅体现在专业摄像机上，普通摄像机也要逐渐普及；

第二、深度方面，要做进一步发展，现在的AI的感知相对来说还是浅层感知，未来要做深层感知，识别目标要不断深化、甚至到认知水平，像人一样看懂情景。

第三、紧紧围绕场景落地做针对性的优化和开发，使得AI不再是技术概念，而是安防领域各种典型场景、各种用户需求，能够适应各种场景下的深度应用。

天地伟业总工程师杨清永：

AI在安防行业无论多热，新的巨头很难出现，老的巨头也不会倒下。

AI技术其实更类似于H.264、H.265，这些技术更多的是起到锦上添花的作用，而并非雪中送炭，其不足以让行业重新洗牌。AI在安防行业的落地也只会是个“小风暴”，不会带来大的行业格局的改变。

未来五年之内，AI在安防行业会一直谈下去，而在这段时间内，双方都应该做好各自分内之事，不应想着如何抢夺别人饭碗，没有任何一家企业能够“吃掉”整条产业链，有效的企业分工及协作格局才是立身之本。

AI涉及的范围很广，安防行业的范围更广，一些AI初创公司羽翼未丰就想着做一整套解决方案是不合理的。

商汤科技CEO徐立：

人工智能行业有点像是一个江湖，核心是练内功，即深度学习大脑，练好了，十八般兵器都能够熟练使用（解决各种垂直应用的问题）。

坚持做原创的关键在于能不能带来核心竞争力，成功了就会有马太效应和聚集效应，能够带来越来越多的原创效益。

技术上的突破，创造的是蓝海市场；技术上的领先，带来的是产品的不同质化；目前AI领域，领先的算法是打造产品差异化的关键点。对此，商汤通过核心技术来打通上游的合作伙伴，帮助他们拓宽下游市场，同时为下游合作伙伴提供全链条的一站式解决方案，最大化地发挥其在应用场景的价值。

商汤在做一个中国大部分企业不愿意做的事情，就是做原创技术的开发，坚持原创，让人工智能引领人类进步。

他们手中的解决方法

中国工程院院士高文：

现有视频监控体系的弊病，使得很多复杂任务无法完成。于是数字视网膜应运而出，承载数字视网膜的摄像头需做两件事：

首先做好编码；
其次为后面的识别，提取出所需的信息。

数字视网膜与人的眼睛既具有影像重构（精细编码视觉内容），又具备特征提取（面向识别理解）的功能。整个数字视网膜实际上包含了三种核心技术：基于背景模型的场景视频编码、视频特征的紧凑表达、视频编码与特征编码的联合优化。

整个数字视网膜实际上包含了四方面的核心技术：

1、基于背景模型的场景视频编码

2、视频同步描述整个表达的记录，同时可结合最近比较热的深度学习

3、在保证性能的时候，用同一个码流把两个任务都传出去，这需要靠视频和特征原有编码技术的优化形式来解决

4、最后是云端的检索，对视频进行更加合理的描述，以便用于搜索

而云端系统三大构建模式为：直接基于特征码流、在特征码流上深度分析、前端简单识别+云端大数据搜索。

阿里巴巴iDST副院长华先胜：

哪些流程放在端上做会更合适？

我个人觉得质量增强和简单的结构化可以放在端上，非常精细的分析放在前端会有一些局限，尤其是算法更新速度极快的今天，如果很多智能功能要嵌入在摄像头端，得把所有软体刷新一遍，工作量巨大且不见得所有硬件会支持。

除此之外，摄像头端也没有能力把多方位的城市数据及时汇聚起来做决策。

计算是我们要解决的核心问题之一，怎样才能拥有较高的计算效率，阿里在这上面投入了很大力气。

第一要有计算平台的支持，该平台要让项目做起来更加高效，要能容错；其次是云计算平台又需要大量的计算机器资源；最后是算法本身。

过去处理一路视频，需要一台电脑的二十四个核全部运行才能搞定，我当时的目标是看能不能降到十个核、八个核甚至一两个核完成。截止到目前为止，我们利用算法提升了20倍对计算的优化。

此外，改进深度学习的方法很多。首先可在机器指令集上进行优化工作，其次也可在CPU和GPU层面优化。算法本身的优化，较为常见的是优化神经网络结构。由于神经网络中集成的计算量相当大，因此我们需要考量能不能把大模型在不损失性能的前提下压缩为小模型，小模型能不能剪一剪。

格灵深瞳CEO赵勇：

当智能化产品进行推广时，我相信这种方式很难快速进行。所以当下急需解决的事就是前端智能化。我发现有一些厂商试图把识别和比对放在摄像头里去做，我认为这是有问题的，为什么呢？你在摄像头里做识别，识别产生人脸特征。由于每个公司各自的算法不同，就要求客户后台的比对系统只能对接这种特征。这样一来的话就给客户带来很大麻烦，假如我今年采购这个厂商的设备，那我的后台也需要依据这些设备来建设。

到了明年，我想采购不同厂商设备时，就会发现不兼容性。我认为图片是最兼容的、供通行的数据，所以得从客户的角度看待问题，识别算法和比对不要放在摄像头前端，回头会给客户带来很多不灵活的负担。

比对我觉得就更不应该放在前端，因为比对需要把客户的核心资源对比库放在摄像头上，在很多公安应用里面这些都是核心机密。你可以想象，如果有黑客攻击了摄像头就会从里面获取跟黑名单相关的核心信息。我认为核心信息应该永远待在数据中心，待在客户最核心的保密网络里，而非前端。

英特尔物联网事业部CTO张宇：

未来的人工智能安防系统一定是一个端到端的系统，边缘计算在当中会发生非常重要的作用。随着视频技术在安防等领域的广泛使用，在摄像头端的视频处理将成为人工智能的一大应用。

对于深度学习和人工智能在安防领域的应用，未来除了在终端侧的部署之外，还将会呈现出三大趋势：

1、增强学习正快速应用到安防领域；

2、通过网络压缩来解决计算冗余的问题；

3、未来AI算法将会相对固化，专用的AI芯片和服务器将得到广泛应用。

旷视科技副总裁陈雪松：

目前人脸识别落地安防的确是趋势所向，但人脸识别只是AI落地安防行业的一小部分，在很多实际场景中，人脸识别作用有限。

市面上绝大部分视频监控只能看到俯视角度的“脑袋”以及非常渺小的人体，根本无法看清人脸。以北京海淀区为例，30万个监控摄像头当中能准确看到人脸的不足2000个。

当监控摄像头看不清楚人脸的时候，监控中的人走入另外一台摄像机的监控范围，机器如何辨别“谁”是 “谁”？

人形追踪技术（或者说行人再识别（ReID）技术）可以很好地解决这个问题，这也是旷视接下来重点深耕的方向。AI通过机器学习输出的结构化信息，其实本质上是建立了一个多维向量模型。这时候，机器可以给每一个模型一个编号，做跨摄像头的人形追踪。

装载“人形追踪”技术的监控摄像头可以将一个人的行为轨迹还原；之后，只要出现在任何一台可以识别人脸的摄像头中，就可以被轻易锁定，不会出现“断片”现象。和单点监控相比，ReID方案通过多组摄像机的轨迹还原及人员比对让安防工作变得更为立体，方便办案民警对目标嫌疑人的行为轨迹、出行规律进行分析，进而为案情线索和实施灵活布控打击提供依据。

现阶段大家都在展示视频结构化，其实更难的是基于跨摄像头的人形追踪。该技术的发展对于安防行业来说也具颠覆性作用。