0
说一个故事。
周武王灭商后把纣王的儿子武庚封在朝歌做诸侯,又封了三个弟弟在武庚周围监视,另外几个弟弟留京辅政,其中周公最受信任。
两年后,武王得了重病,周公特地祭告祖先,表示愿代哥哥去死。祭毕,他把祝辞封存在石室里。
不久后武王驾崩,太子姬诵被拥立为王。周公受命摄政,惹了其他诸侯眼红,到处散步谣言抹黑他。纣王之子一瞅机会来了,也准备乘乱搞一波事情。
周公急啊,写了首诗给成王,结果对方毫无波动。
幸好成王无意中在石室里发现了周公的祝辞,解开了对其的误会,才有了周公出兵征讨三叔和武庚的后话。这也是“未雨绸缪”一词的来源。
故事说完了回到现在,不久前在Facebook听证会上,小扎献上三字箴言:对不起,我错了,我负责。
企业听了会沉默,用户听了会流泪。隐私都被泄露了你和我说这个?
聚焦已发生的事情毫无意义,未雨绸缪才是王道。而在阵“雨”频发的数据安全领域,有什么招儿提前防护吗?
讲防御前不妨先看看数据安全面临的挑战。
首先是合规要求。中国《网络安全法》及欧盟GDPR(《通用数据安全条例》)的出台,一举把个人信息保护问题送上C位。(酷爱赶时髦的我宅也对GDPR进行了详细解读,指路这里。)
除此之外,人们在享受大数据带来的种种便利同时,也越来越多的将个人隐私暴露在网络之上。网络情缘一线牵的时代过去了,神操作之下没有找不到的人,没有扒不出的皮。更何况还有比你妈都了解你的大数据杀熟、售假事件。
相关数据显示,在2017年全球发生了25亿条隐私数据的泄漏,相比2016年增长88%,平均每秒有82条数据泄漏,65%的企业认为自己面临巨大的数据安全风险,曾经发生过数据泄露的企业竟多达80%。而泄漏的数据中仅有1%是经过加密的。
更为迫切的是,量子技术快速发展引发的“量子霸权”也将带来巨大的安全风险。
对很多人来说,量子计算是个“网红”概念,很早就听说,一直在进展,但离目标始终差五年。随着IBM、Google 先后宣布了量子计算机的进展,越来越多的学者宣称说量子计算机即将成为现实。
问题在于,量子计算一旦落地,将从根本上重新定义计算这件事,某些传统计算机难以运算的问题,如大数分解和离散对数,使用量子计算机可以轻易解决。
而这背后隐藏的却是对其轻易破解加密算法的担忧。比如RSA加密算法,该算法的安全性依赖其密钥的长度。据公开资料显示,如果使用768bit长度的密钥,用一台家用计算机来解密,大概需要180万年,,但是利用量子计算机来破解仅需1秒。
量子计算机相较于传统计算机的运算力,正如核武器之于常规武器。而量子攻击的破坏程度也远非普通攻击能及。那时数据安全还能保证吗?
不能,因此美国的FBI、NASA、以及欧盟等着手研究抗量子攻击的加密算法,巨头玩家也不甘落后,Google、IBM、Intel、Microsoft 等纷纷入局。
做菊(局)外人显然不太可能了,于是腾讯云派出了一支特别行动队,代号——数盾。
“我们开始寻找可以抗量子攻击的一些加密算法,以此保护数据安全。攻击的矛可能还没出现,我们要把盾做出来。”腾讯云数据安全专家研究员彭思翔博士和腾讯云数据安全总监崔子翊告诉雷锋网。
数盾团队在网上的资料凤毛麟角。
我:数盾是个很神秘的团队?
崔子翊:没什么特殊的,一群加班狗,今天采访完回去要继续加班了。
……
据崔子翊说这群码农起初没有数盾这么高大上的名字,其前身是2010年成立的核心数据安全团队,主要负责腾讯自研产品的数据安全,包括QQ空间,部落、附近的人,QQ音乐,微信等一系列你能想到的社交网络产品。
▲崔子翊
关键时间点是刚刚过去的2017年。整个公司以及行业发展方向都在上云,数盾团队也开始在云上做一些能力开放。实际上也就是将内部能力向外输出,将积累的数据安全能力打包成产品,即数盾。
其中有多不容易可能只有数盾自己知道,毕竟这其中要经过产品化以及生态建设过程。
难吗?难吧。
当时团队处于初期,技术能力不是问题,但产品化并不清晰,同时团队产品能力也比较缺失,首先需要从内部耦合的安全能力里把产品抽取出来,供客户通用接入。
有了产品形态又要转观念,从先做出一个版本再进行迭代的2C产品转向一推出就要完美的2B产品,“以前是服务业务,现在要单独做产品,面对的是外部客户。”彭思翔告诉雷锋网。
人才仅是其中一个困难,更大的困难来自于算法。
所谓用人工智能技术突破传统瓶颈,比如在数据库防护或脱敏场景中,实际上就是将人工智能附能到传统安全领域,其中涉及到的是将整个算法横向迁移到安全领域、脱敏,以及模拟量子计算机中。
数盾用一年时间来突破桎梏。
一年后出现在腾讯“云+未来”峰会上的数盾拿出了一套王牌,分三路指向上面三项数据安全挑战。
在合规要求方面,彭思翔认为数据库审计是基石。为此数盾提供了对风险操作事件的检测,包括了从识别到告警与监控的多种功能,另外还有用于事件追溯,如问题事件追责,最后针对保合规的需求还提供了流程数据合规、审计内容合规等功能。同时,为了加持数据库审计更精准地发现问题,腾讯云搞出了一个AI黑白双引擎模型。
▲彭思翔
所谓的黑白引擎即白引擎主要对用户常见的操作进行记忆,黑引擎收录了80%常见的攻击语句,二者综合起来自动学习用户操作特征,降低误报率与漏报率。简单说判断一个人是好人还是坏人要综合对照其行为中的正向行为和反向行为得出结论。
合规只是第一步,企业想生存就要开展业务,如何在不侵犯用户隐私的前提下开展业务,用数据赚钱?这需要平衡用户隐私保护与企业开展业务的需求。
最彻底保护用户隐私的方法当然是将数据彻底涂改,但如此一来数据也无法使用了。
是否可以只对敏感数据进行脱敏和水印处理?这样在不泄露用户隐私的同时也保证了统计学信息,同时符合金融行业、运营商行业、政府部门对数据使用共享环节中的合规要求。
完全OK。
脱敏主要是对用户敏感信息的隐藏,而水印用于这些数据一旦发生泄露后的数据溯源。为了省时省力,数盾开发了一个一键脱敏的功能。其中敏感数据涵盖了中、美、欧等相关法律定义的29种不同敏感字段,通过行业敏感信息包的加载也可以进一步提高其覆盖率和准确率。
彭思翔表示,针对生产测试与数据分析对数据可用性的不同需求,数盾提供了基础的脱敏和高级脱敏算法。
基础和高级差在哪里?据说在分析场景中对静态数据实时查询,还有数据共享下的脱敏提供了相应的算法,针对静态数据脱敏,可以使用匿名算法,通过聚合与泛化的方法使得脱敏的数据无法还原,保证了统计分析的可用性,带来的误差仅在2%以下。
这些可能还是单方面的数据发布,在数据交换场景中涉及到多方的融合与计算,此时应该如何保障数据脱敏?
目前多数解决方案都是合作多方或者双方中有一方处于弱势情况,被迫接受数据量较多一方的要求。比如将自己的一些数据库明文传给对方或者采用一些极简单的加密方式。
数盾采用的则是基于PSI共享安全算法,保障各方地位的平等,并且具有极高的加密速度,无需解密可以直接用来分析。
举个栗子,绿方与蓝方有一批号码要求交集,首先绿方将这个号码用自己的密钥和PSI算法加密隐私之后发给蓝方,蓝方再用自己的密钥进行二次加密。同理蓝方要将自己的数据集使用自己的密钥和对方的密钥进行双重加密之后,密文仍然可以对回来。也就是这两个号码处于交集中,其他不处于交集的号码会以密文方式体现,从而达到保护用户隐私的目的。
最后,数据保护最重要基础的手段是数据加密。量子计算机的出现则会变成加密杀器,虽然仍可以通过加长密钥维持加密传输的安全等级,但由于加密传输、密钥协商、身份认证,还有数字签名都使用了非对称加密算法,它可能会被量子计算机轻易攻破。
如何解决这个问题?
以“量子”制“量子”的手段是可以,比如现在已经出现的量子随机数据发生器,还有不可复制和窃听的量子密钥技术。
但是对于身份认证和数字签名并没有现成的解决方案。于是数盾研发了一个对应的解决方案——抗量子加密算法,用来做身份认证和数字签名。
具体来说,数盾将这些算法全部打包,作为一个整体的量子时代的安全解决方案,它的具体框架如下。
右半边是一个传统的密码技术,左半边的红框是量子加密技术。物理层采用了量子随机数发生器,算法层采用了纠错码、格密码等抗量子算法,提供了量子密钥管理分发、抗量子密钥等服务,使得企业可以在量子时代使用抗量子密钥签名,抗量子身份认证,还有传统的一些加密的服务。
总之,数盾打包送给客户的是一整套流程,首先在最前端为数据提供保护,筑起数据安全第一道防火墙。随后数据入库通过AI审计,威胁告警等技术感知企业数据库的安全风险。当数据在其后用于大数据分析、共享互通的时候,可通过数据脱敏与水印技术保障用户隐私,确保业务正常开展。而这一切都是使用了量子加密技术,保证了数盾在量子时代依然安全可靠。
已经连续加班两三个月的数盾在冲即将迎来的时间点(据说有新品发布),在问到大家会不会有怨言时,崔子翊摇头,“我觉得大家的目标是一致的,而且能看到这份事业的价值,这也是对整个行业的价值。”
“那最近有什么趣事吗?”
崔子翊想了想,“内部PR算吗?我们在内网的知识社区中发了一篇文章,下面有人留言说:数据安全哪家强,来找数盾彭思翔。其实这句话是我们的人自己打的广告。”
“还有呢?”
“加班。”
雷锋网宅客频道(微信公众号:letshome)原创,欢迎关注。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。