1
说起“路怒症”,你脑海中会浮现出怎样的形象?
2017年5月30日,微博网友@写字李华良 发出的一条视频引发了众多网友的公愤。
视频显示,当天上午9点半左右,李华良开车右转时,因看到前方斑马线上有行人通过(有老人,也有推婴儿车的人),于是停车礼让。然而,他后方一辆车牌号为冀A02***的红色奥迪车驾驶人却嫌他阻碍其右转。于是,奥迪男便恼羞成怒地将他强行截停,下车后对他辱骂、殴打,随后驾车离开。
事后,李华良立即报警,同时微博发文,并配以行车记录仪视频。
该视频一经发出就得到大量网友和媒体的转发评论,打人者因此也在微博“一炮而红”,被冠以#嚣张奥迪男#的称号,网友希望警方迅速把施暴者绳之以法,毕竟,他不仅打人,还很有可能酒驾,危害公共安全。
事情发生一天后,打人者依然没被抓获,个别网民开始对公安机关的反应速度提出了质疑。
其实,破案过程远比我们想象的复杂,案件的侦破曾一度陷入僵局。
警方在侦查过程中发现,通过车牌号查到的涉案奥迪车的车主实际并非打人者,且暂时失联。联系不到车主本人,也意味着无法迅速找到打人者。专案组需要依靠线索中断的车牌号,以及一段模糊的视频来在石家庄一千多万人中锁定目标。
虽然最终“嚣张奥迪男”在6月1号被抓捕,不过具体的侦破过程却鲜有报道,雷锋网曾在公开的资料中发现了下面这段话:
僵局之下,一个名为“昆仑镜”的情报系统开始加入警方的破案过程中,在研判人员的操作下,警方从车牌号出发、通过找车主以外的研判路径很快掌握了犯罪嫌疑人的关键情报,锁定了打人者,为抓捕直接指明了方向。
听上去有些神秘的“昆仑镜”情报系统到底有何威力?它到底是如何帮助警察蜀黍破案的?
为我揭秘这个大数据系统奥秘的是“明略数据”公安事业部总经理黄艳,她所在的公司正是这个系统的重要搭建者之一。
黄艳自毕业后一直从事与警务数据有关的工作,她告诉雷锋网,这起表面看似简单的案件背后,其实需要交管、情报、刑侦和管辖分局等多个相关部门的通力合作。
在案件侦破过程中,有两个关键点,一是你是否掌握了足够的信息,二是你要如何抽丝剥茧把破案的关键点拎出来。在传统的破案中,前者需要进行长时间扎实的调查,后者需要你拥有丰富的侦查经验。
大概情况应该像《犯罪心理》剧中的情节相似,面对整墙的纷杂信息,需要找出最核心的关联,依此破案。比如在嫌疑人和被害者的众多信息中,需要找出哪个关键时间点和关键物证才是可以定罪的突破口。
那现实中,“嚣张奥迪男”究竟是如何通过情报系统被揪出来的?
由于破案细节涉密,黄艳并未直接回答,但她举了一个例子向我解释情报系统到底是干嘛的。
首先,情报系统需要将各个不同的信息系统进行整合。
原来系统对于一个人的刻画可能是这样的,A系统知道我是一个女的,B系统知道我学历是硕士,C系统知道我最近经常出差住各地的酒店,D系统知道我坐了哪些航班,F系统可能知道我的日常联系人是谁……但这些系统在没有整合之前,对一个人的刻画都是片面的,只有把他们进行整合,才会有更立体和全面的描述。
情报系统要做的第一件事就是要对各个系统之间的数据进行整合,这就如同你想做一桌子好菜,首先得准备好足够的食材,避免出现“巧妇难为无米之炊”的状况。
也就是说,要想破案,警察需要掌握的数据不仅来自于公安内部的系统,还需要来自其他委办局或者政府部门的多个系统的数据。
第二,依据不同的场景,找出破案的关键点。
数据纷繁复杂,不能要求所有警察都具备孙悟空的火眼金睛,所以必须要拣出哪些才是与破案有关的关键信息。这就好比你要做出可口的饭菜,除了充足的食材,你还要考虑这么多的食材如何搭配、如何烹饪口味才会最好。
“嚣张奥迪男”的抓捕,正是利用了情报系统对上面两方面信息的处理。其实放眼全球,这类系统的搭建,在美国早有先河。
911 之后,在 CIA (美国中央情报局)等部门在调查各种线索的同时,斯坦福的的几个教授也以公开的海量信息为基础,利用计算机建立关于人物关系的网络,最后他们锁定了一堆疑似人物,并迅速将结果公开发布出去。
这让 CIA 等部门大为震惊,因为教授们所得出的结果与 CIA 花大量精力侦查和审讯的结果有很多重合之处,当局迅速飞到斯坦福找教授们问话,怀疑他们与恐怖袭击有关。
自此,“人脑+电脑“来分析复杂问题并辅助破案的可能性,开始被媒体关注。
回到文章开头的问题,“嚣张奥迪男”最后到底是如何在机场被抓获?虽然黄艳并未透露破案的细节,但据雷锋网推测,这个有些神秘的“昆仑镜”情报系统,应该是一个具备多部门信息整合的平台,从车牌号查到车主后,可以顺藤摸瓜,查出亲属关系、最近通话记录、相关航班信息等,最终将打人者抓获。(此处纯属推测)
虽然信息系统的整合是做所有大数据系统的必经之路,但黄艳告诉雷锋网,整个过程并不顺利。一些地方的警务数据系统比较分散,在整合过程中不仅要满足不同系统之间的不同权限,还要满足各个系统不同的保密需求,这些顶尖的数据工程师在繁琐的开发过程中遭遇了重重困难。
如何整合不同警种的数据就是一项充满挑战性的工程,比如有人负责缉毒、有人负责抓经济犯罪、有人负责抓刑事犯罪,它们之间的数据都不是完全公开的,而且有些数据还涉及公民隐私,不能随便给其他人看,要制定详细的权限,这就是切实存在的问题。
在实际的整合过程中,黄艳和同事发现,单个系统的局部优化程度越高,最后整合的工作就越复杂和不可完成,甚至会出现许多重复建设和资源浪费的情况,整个过程要解决的细节问题非常多。
起初,一些工程师并不适应这种有些基础并繁琐的工作方式。比如基础的检索工具也是情报系统中的一环,但对于一些工程师来说,他们认为一家高科技公司没必要做这种非常基础的工作,类似定制化的需求,跟他们的开发身份不符,但从警察的角度来看,这又是实际需求。
最后解决这个问题的方式,其实有些“简单粗暴”,但非常有效,就是工程师本人去实际体验具体的办案过程,解决这个过程中所遇到的问题,从而理解警方的办案逻辑。
在具体的信息整合过程中,工程师们会同时想到,在查询可疑人、可疑关系、可疑标签的过程中,为什么要这样查询?在哪种业务场景下会需要用到这个查询?查完以后接下来的动作是什么?需要跟哪个警种做互动?是否需要派出所协查?这一系列的问题都应该在产品中进行优化。
在深入一线的过程中,这些大数据工程师终于实现了从工程师思维到民警思维的转变。
对于黄艳和同行而言,一家颇具“警察思维”的大数据公司一直是他们的榜样,名叫“Palantir”,这家美国公司多年来一直服务于 CIA、FBI 等情报机构。最近,在一张硅谷实习生工资排行榜中,Palantir 超越谷歌、苹果等一众大牌公司,名列第一,换句话说,吃警务情报这碗饭,非常挣钱!
据雷锋网了解,伊拉克战争后,反恐变成政府最急切的需求之一。尽管CIA、FBI等情报机构掌握着成千上万个数据库,包括财务数据、DNA样本、语音资料、录像片段以及世界各地的地图,但要在这些数据之间建立联系,却相当耗费时间。如何从浩如星海的数据中快速找出有价值的线索,提前掌握恐怖份子可能发动袭击的消息,对情报部门的技术水平有非常高的要求。
“Palantir”的创始团队认为,硅谷比政府承包商的技术更先进,因为政府不能接触到最好的工程师。如果由他们建立一个数据分析库,整合相互分离的数据库来进行搜索和分析,以提升数据分析效率,或许可以向政府“推销”这项技术。
让低调的“Palantir”一炮而红的,是通过大数据分析识别出了华尔街大佬麦道夫的庞氏骗局、协助美国当局找到了本拉登的藏身地。当年,众多媒体用“本拉登最终被大数据整死”这样的标题来报道这个爆炸性的新闻。
由于大数据分析在很多案件中发挥了巨大作用,目前无论是国内还是国外,对于警务系统数据的整合分析已经是一个大趋势,但黄艳认为,“堆在一起进行数据治理就是大数据”这种观点离真正大数据还相差很远。目前来看,要真正实现大数据破案,这三点亟待突破。
第一,需要政策的推动来进行数据的整合,这还需要时间。
数据掌握的越多,对于破案就意味着能掌握到更多的线索,但各个部门数据整合与否的决定权,并不在明略手上,作为一个第三方的服务公司,它没有权限要求北京市的交管部门和海南省的交管部门将彼此的数据整合,要想推动这件事向前走,就一定要通过顶层设计。
黄艳告诉我,中国公安系统目前还是分灶吃饭,就是地方财政的建设模式,它还没有那么的集中化和中心化,但未来看,大集中肯定是一个趋势。
在近两年的项目中,团队可以明显感觉到自公安部开始的自上而下的政策推动效果,各个地方的数据正在越来越多的进行整理和汇总,如果没有这些政策的推动,没有自上而下对于数据的重视,就不会出现像明略一样的公司,更不会出现这两年飞速的发展,是整个环境造就了行业的发展。
第二,需要对业务进行深入的挖掘和了解。
任何一个行业要进行大数据的落地,只做一个数据资源服务平台远远不够。这是一个需要跟业务人员反复沟通、共同创造的过程。
在具体的项目中,要做的不仅仅是数据的处理和分析,还需要更多地关注行业的业务发展模型,专注分析细节的处理,这些对行业洞察的能力,需要在积累一定客户在基础上才会有长足的进步。
第三,分析工具固然重要,但是人的判断也是非常重要,要发挥人机结合的最大效用。
当有了数据,做出具体的业务模型后,就需要考虑如何把人和机器的最强的优势发挥出来。
在数据处理的过程中,如果每一条数据都需要人来进行处理,会因耗费人力而行不通。但与此同时,数据处理分析又需要人的辨识能力,如何协调人与机器之间的关系,是需要解决的核心问题。
“不管白猫黑猫,抓住老鼠就是好猫”。这句老话在警务系统的建设中,同样适用,用了再多的高科技,最后到底能不能帮警察抓住坏人,才是最终考验。
明略数据创始人吴明辉的父亲是一名警察。从小,吴比别人更能体会老警察的辛苦,一起重大案件需要几百个警察分析情报,找线索,过程相当痛苦。因此,吴在创办明略时,萌生了搭建大数据网络平台,让人工智能协助警察办案的想法。
他想,借助数据与智能,也许父亲以及和父亲一样的警察办案不用那么辛苦。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
本专题其他文章