0
你可能经常能听到共享单车、共享充电宝、共享雨伞、共享汽车、共享住宅……在共享经济的火热大潮下,只有你想不到,没有创业者做不到~
但你听说过共享安全吗?
纳尼?安全怎么共享?这事儿靠谱么~
从网络安全的角度来看,我们在构建的是什么呢?行业里面肯定有一波人有非常好的经验,现在我们要把这一波人的经验以模型的方式输出出去,构建一个通用型的模型,给到企业,企业再基于这个通用型的模型,结合他的自身的数据,做自己的安全模型,然后把这个风险在模型里面抽取出来,然后再传递到其他用户那去。
顶象科技的 CEO 陈树华这样向雷锋网解释自己正在做的事情。这家成立只有几个月,人数还不足70人的公司,给自己核心业务的定位是做“全景式业务安全风控体系”。
市面上有经验的网络安全人才这么紧缺,为啥他们能做“全景式”的安全业务?
雷锋网的编辑查了一下陈树华在创业之前的履历,发现他曾经参与创办了阿里聚安全、阿里钱盾以及阿里移动安全产品体系,属于传说中的阿里 P10 级的技术大牛~~~
但是,网络攻击的套路那么多,各家公司的风控模型各不相同,以何种方式共享?共享时会不会造成用户数据的泄漏?我们又如何能通过共享来打击黑产?
在 ISC 2017“人工智能的安全利用与防范” 论坛上,陈树华还做了一场名为“基于知识共享的新一代风控体系”的演讲,其中提到的“私有云部署”和“风控模型共享”,就正在解决以上两个问题。
假如A企业、B企业、C企业都有自己的风控模型,每一个模型一定对应了一个风险,不把它分享出来,可能这个东西仅仅是你自己的,其他人的也一样会去遭受同样的风险攻击。
但是,每个企业的业务不同,数据也不同,威胁方式手段有差异,攻击场景更是不尽相同,不同的威胁共享难度很大。
比如,即使 A 企业充满爱心的分享了自己的风控模型,B企业也很有可能因为上述的差异性,无法接受这份突如其来的爱~
如何利用这些各不相同的模型来发挥共享的作用呢?
每一个用户的具体模型分享出来之后,这时候我们要对这个模型去做通用化的处理,因为你的模型分享出来了,别人也不能用,数据不一样,维度不一样,包括整个建模的平台也可能不一样。
以我们常见的刷单为例,可以基于用户 ID 、利用设备环境、用户行为等数据,通过智能风控引擎进行多维度建模分析,提供实时的恶意请求识别与阻断,以及离线的综合分析报告,从而现并阻断刷单、作弊等行为,精确区分黑灰产和正常用户,保障营销活动的正常运营。
而随着“用户 ID 、利用设备环境、用户行为等数据”等这些建模的“原料”越来越丰富,这个安全模型的功能也会越来越强大。
也就是说,模型共享实际上是要把团队做业务安全的经验以模型的方式输出出去,从而构建出一个通用型的模型,给到每一家企业,然后每一家企业再基于这个通用型的模型,结合自身数据和应用场景,变为自己的专有模型,等于既站在了巨人的肩膀上,又能跟自己的业务紧密相连。
至少在行业里面,很多安全风险我们都可以迅速的打通,这样的话,好处就非常大了。
但是,业务安全涉及到很多用户的数据,当用户把风控模型共享时,如何能避免数据的泄漏?
作为普通用户,我也不希望我的数据被共享。比如说我逛淘宝,我肯定不希望淘宝把我的购物记录分享出去了,每个人都是这样。数据共享这件事情,不管在安全,还是在业务领域,越往后的其实难度越大,因为从用户开始,从每个企业开始,大家都反对这件事情。
在如今的大数据时代,数据已经成为了企业的一种无形资产,具体到个人,无论是购物记录还是支付信息,我们都担心自己的数据被外泄出去,而网购平台也早已视这些信息为商业机密,那在共享风控模型时,如何能保证这些敏感信息不泄露?
我们的模型里面没有任何的数据,举一个例子,我会用IP地址、购物清单、时间戳,去组成一个风控的规则,这是在一个函数运算的基础上的,你的购物记录也好,你的支付信息也好,那些信息在模型里面是没有的。
陈树华向雷锋网解释,模型本身只是一个数据加工的方式,经过加工后,这个模型里面没有任何跟用户信息相关的东西,比如识别一个异常的刷单,模型会以用户点击鼠标的频率来识别,而不是以这个用户的 IP 地址这类隐私信息来识别。这时候对于用户来讲,就不会反感这件事,而对于企业来讲,也不反感,因为共享对它也并无害处。
在陈树华所接触的众多传统企业中,他认为很多在业务安全领域很多还处于“裸奔”状态。
黑产现在是一个体系,一条利益链,大家基于利益去合作,所以挺好合作的。但是今天我们去看对于黑产攻击的共享,大家之间是没有合作的。所以就造成了什么呢?做黑产的打完你之后,还可以再用同一个套路打别人,而且打得很顺,把整个行业都打一遍,每一家都可以试一把。
陈树华认为,第一个要解决的,就是要把用户协同起来,这就等于是把所有的风险就汇聚起来了,对于一个安全厂家,或者是对于其它安全厂家,这时候就很容易构建一个能力,针对黑产去做整个黑产的全面画像。
今天没有一个安全厂商能够看整体的,因为用户数据不给你共享,所以我们一定要把模型能力建到客户那边去,再把分析结果体现出来。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。