0
本文作者: 张利 | 2017-03-11 21:37 |
人工智能(AI)经以雷霆万钧之势从学术界潜入产业界的每一个角落,AI已经不是科技公司创新创业的专属武器,因其价值之大,也成为了传统行业变革求新、提高效益的利器。AI掘金志致力于传统行业AI应用的解读,帮助从业人士寻找最有价值的模式与落地路径,记录AI浪潮之巅的时代变迁。
未来,我们还将举办相关培训训练营,以及行业首创的“首席数据官峰会”,搭建起数据科学家与首席数据官之间的桥梁。
AI掘金志本周关键词:Google的DeepMind Health,智能诊断,IBM Watson,平安科技,Amazon Go;格灵深瞳。
IBM Watson是认知计算系统的杰出代表,认知计算能力能使金融服务机构更深入了解用户的盈利性和偏好,进而为用户提供更加个性化的新一代产品和服务。Watson还可以帮助企业灵活地应对管理风险和合规问题,提高适应变化的监管环境能力。
Brian Walter是新成立的Watson金融服务机构中客户洞察和认知体验全球项目主管。Omri Barzilay与Walter 讨论了 AI 是如何改变金融世界。
Omri Barzilay:你现在看到的最有吸引力的行业趋势是什么?
Brian Walter:当然是AI和认知计算在金融服务领域的应用。
Barzilay: Watson金融服务的主要关注点在哪儿?
Walter:我们的工作重点是帮助银行、金融科技公司和开发者建立创新的解决方案。我们还通过运用Watson超级计算机、机器学习和高级分析等技术,提供用户前瞻性预测,用户留存和流失分析,产品偏好,动态分段和个性洞察服务。
Barzilay:在这个领域,你们还发现了什么机会?
Walter:除了认知计算和AI之外,我们还看到了云计算和区块链等子领域的潜在机会。银行和金融市场非常青睐区块链的商业应用方案,接受程度远远高于预期。
Barzilay:你们如何与初创公司合作?
Walter:我们会指导初创公司上市事宜、业务和技术发展,还对它们开放了访问IBM AI平台的权限。
Barzilay:最近有哪些创业公司在做一些有趣的事?
Walter:监管、风险和合规行业的数字化转型会是未来几年的掘金地。
近日,平安科技人脸识别团队在国际权威人脸识别公开测试集LFW(Labeled Faces in the Wild)中,获得在无限制条件下人脸验证测试(Unrestricted,Labeled Outside Data Results)0.9960±0.0031的成绩。
目前,很多成果在 LFW 人脸数据集上的准确率都停留在 99.5% 左右,平安科技团队的成绩意味着人工智能技术之人脸识别又获得了突破,人脸识别、人工智能作用于金融业有了更稳固的保障。
据雷锋网了解,这项技术,来自于平安科技人工智能实验室,以及大数据平台等团队。这次测试结果的发布,是平安科技的领先技术在国际学术层面的一次亮相。
日前,雷锋网与平安科技智能引擎部总经理兼大数据首席总监、“”国家特聘专家肖京博士,以及平安科技人工智能实验室主任、首席AI科学家刘飞进行了对话,谈及平安科技在人工智能研发和应用的进展与未来思考。
AI助长金融
早在2013年,平安就针对人脸识别方面开始做了一个前期的调研。从2014年开始,平安科技组建了自己的人工智能实验室团队,开始研究算法和核心技术应用。人脸识别技术作为人工智能核心一环,目前已经应用到金融、安防、身份识别类等严肃应用上,以金融业为例,包括刷脸开卡、刷脸取款,保险中理赔对象识别等等。AI技术的成熟运用,是“未来银行”、“新金融”的基础。比如,人脸识别技术全球首发应用于平安普惠小额贷款 “平安i贷2.0”的融资场景。
平安科技研究深度学习,走不一样的路
人工智能在综合金融的大规模应用,关键在于安全、准确、高效,某些规则性问题下,效率和成效甚至比人做得更出色,比如人脸识别。然而,这背后的摸索,如同黑暗隧道中前行时看到的曙光。
更少的数据,更高的精度
平安科技在研究的是,如何通过较少的样本来达到更高的精度。刘飞表示,如果要用比较少的数据也能训练出很高水平的话,法宝在于算法。“我们最近就有一个让人兴奋的研究课题,也是最近这几年在学术界也有提及的,叫‘one-shot learning’技术。”“one-shot learning”技术,可以在一个单点领域有足够高效、深入的应用
AI规模化应用,需要通用型AI
刘飞表示,其实我们现在的人工智能技术在解决当前的问题是相对分立和孤立的,人脸识别通过图象就解决了身份识别的问题,而至于其它的方向,比如识别一个目标物体,一个电话、一辆汽车,它又是一个问题。目前人工智能,包括深度学习的介入,还是正在解决这些单独的问题,甚至还用不同的方法解决单个问题。
“人工智能界还需要一些比较通用的方法,使得人工智能的技术基于某一个单一方案解决更多的问题。比如现在在研究的多任务网络。一个神经网络能不能解决多个不同的问题?包括静态和动态。”
从规则利用到数据分析,金融业进入深度人工智能阶段
除了算法上的摸索,平安科技造的另一个轮子是大数据挖掘。这两件事,都并非一蹴而就的。
刘飞解释称,即便更少的数据、更高的精度成为可能,但我们也不能否认数据的重要性。“当领域进入差异化发展的时候,一方面数据可带来算法前瞻的预言,帮助做出差异化的算法成果,同时借助数据规模又能够较早地投入商用。而能够较早地商用就意味着,又能帮助我们发现别人还没有机会发现的问题,从而优化算法,反复来训练。”
而做数据集中,这就需要先搭建清洗、整合等一系列的底层数据应用以及平台。这些做完了以后,最重要还是要挖掘数据的价值。做这么多事情,所花的力气也可想而知。对平安来说,其无非是坚持向数字化转型。目前第一步,是赶上了大数据、AI的列车,通过挖掘数据的价值,来提升客户的体验,扩大自身服务能力。
AI 技术的成熟,使得由人工智能来自动消化海量监控视频数据成为可能。目前,人工智能已经逐步渗透到安防行业,最终将会把以视频网络为核心的安防产业,重塑为以结构化数据为核心,以精确情报生产为目标的智慧物联网产业。
作为智能安防的先行者,格灵深瞳在近 4 年间推出多款应用于安防的 AI 产品,包括基于三维计算机视觉技术的皓目行为分析仪、基于结构化数据的威目视图大数据分析平台、威目车辆特征识别系统、威目人脸识别系统,以及全新产品深瞳人眼摄像机。
在这期雷锋网硬创公开课上,格灵深瞳 CEO 赵勇博士基于自己多年的研究和行业经验,深入分享 AI 技术将怎样以智能硬件、大数据挖掘和物联网的形式,深刻地变革整个安防行业。
本次公开课包括以下内容:
• 基于人工智能的最先进的人脸、人体和车辆识别技术
• 安防产业为什么需要智能硬件
• 基于仿生原理的人眼相机,是怎样实现大场景、远距离人脸识别的
• 当前的人脸识别技术,在解决实际安防问题过程中面临的挑战
• 深层大数据挖掘在人工智能物联网中的意义
本次公开课中,赵勇博士展示大量生动的案例和视频,并回答多个网友精彩问题,所以推荐优先观看视频。
一、传统安防的现状和急需解决的问题
在今天的安防监控行业里,几乎所有组成都是以视频为核心:摄像头是视频的生产者,录像机是视频的存储者,网络是视频的传播者,监控中心是视频呈现的地方。
所以我们整个安防体系,从摄像头到存储都是一个拥有极大数据量的网络。但一个主要矛盾:我们产生了太多的视频,可这些视频却没办法消化。
目前,急需解决的问题:把普通视频数据变为有意义的“情报”。目前以视频数据为核心的安防监控体系,其实给客户带来了大量的麻烦。因为你产生了非常多的数据,把这些数据放在客户跟前,然后寻找线索,这好比大海捞针。所以整个行业都把希望寄托在智能化上,所谓智能化就是能够把人工智能引进来,把所有的视频数据除了人以外,引进人工智能 Consumer,能自动把这些视频数据里面的内容和目标变成结构化数据。
但是当人工智能把这么多的录像转变成结构化数据后,就会产生一个新的数据海洋:结构化数据海洋。如果数据没有经过很好的挖掘,那它也不是有意义的情报。
当今天这些数据变成了结构化数据以后,在不同行业、不同场景要有大量的数据挖掘应用才能够有效地把结构化数据变成有意义的情报。
二、图像识别在垂直安防行业的成果
1. 已经成熟的车辆识别
2. 人物属性识别
3. 人脸识别
三、AI 应该用在前端还是后台?
我觉得智能放在前端最大的好处是针对一个视频流时,它所有的运算资源都专注于前端。放在前端有一个好处就是大量数据,用不着通过非常拥挤的网络传到数据中心去。
把智能放在后台的好处有点像云计算,云计算的一大优点是分享,我在后台可以用非常强大的硬件、非常复杂的软件把识别性能做得非常好,因为人们对识别的精度要求永远是无止境的。但这样会导致对识别算法、硬件要求比较高,如果放在服务器里可以达到这个条件,同时分享给不同的前端。
四、人脸识别的真实现状
很多公司认为人脸识别已经做得很好,但另一方面,如果大家去调查一下如果使用了人脸识别,尤其是使用动态人脸识别的客户,大多数客户都认为误报率太高,而且高到基本上这个系统就没有办法使用。
五、智能安防接下来该怎么走?
1. 人工智能+人类智能
2. 人工智能+大数据
六、前沿生物视觉技术在安防领域的应用
大自然是一个非常丰富的知识库,我们可以从里面学到很多知识。计算机视觉是关于“视觉”的,所以我们会关注人的眼睛以及动物的眼睛。
据OMIM数据库(人类孟德尔病数据库)数据,单基因遗传病的病种数量约有7000种,其中约4000多种致病基因和发病机制比较明确。单基因遗传病单个发病率低,但单基因病种类极多,所以总体发病率高,且具有先天性、致死致残性的特点。
就诊断而言,单基因遗传病涉及多个学科,临床症状复杂,且由于基因的突变具有多样性,每种突变都可能导致不一样的临床症状,而突变的临床意义也相当复杂,故诊断较为困难。而且,许多遗传病都及其罕见,属于罕见病,对于一名医生来说,诊断经验不足,根据症状极易误诊。
所以对于临床医生而言,这些问题显得颇有挑战性:根据患者症状如何快速鉴别其是否为遗传病?患者表现为某些特定症状时,哪种基因突变的概率最大?
如今,随着基因测序成本的大幅下降,随之而来的是基因大数据的出现,在这种形势下,基于基因型和表型的关系,建立辅助诊断系统和临床知识库看起来是一条容易且有效的路径。那么,具体搭建过程是怎样的呢?会遇到什么意想不到的挑战呢?这种方式做遗传病诊断,遇到最大的瓶颈是什么呢?
本周四,雷锋网邀请了发布了国内首款遗传病智能问诊系统的北京金准基因公司副总裁孙隽回答这些问题。课程总结文将会在下周AI掘金志公众号栏目首发。
3月9日,Google旗下的AI健康科技子公司——DeepMind Health,宣称将使用比特币底层技术区块链,让医院、NHS、甚至病人自身都能实时跟踪其个人健康数据。
该技术,又被称为“可验证数据审核”,可创建一个特殊的数字分类帐,以加密可验证的方式自动记录患者数据的每次交互,这意味着对数据任何更改或访问都会被记录到,正是这种特点,对困扰DeepMind已久的问题——患者的数据隐私问题有帮助。
2016年12月,DeepMind曾与帝国理工学院医院合作,共同发布了一款肾脏监控APP Streams,在这项合作中,DeepMind将会获取到100万患者的医疗数据。但两者的合作因数据隐私问题备受质疑,民众怀疑其与NHS的数据共享协议过于广泛,担心这可能给予DeepMind太多的权利,甚至超过NHS。(关于这次合作,雷锋网曾有详细报道:DeepMind与帝国理工学院医院合作,获得100万患者数据)
这就解释了,谷歌AI团队为什么搞起了区块链?
我们的使命始终如一,核心探索我们如何能长期建立信任、透明度和对数据更好的控制。
这此次开发区块链计划发布后,DeepMind联合创始人Mustafa Suleyman如是说。Suleyman指出, DeepMind已经采取了很多措施促进民众信任,包括组织成立AI行业联盟等,但是技术的方法是公司促进信任的另一种手段。
事实上,关于区块链与人工智能的结合,业界早有讨论,区块链在人工智能的一些应用很普通,正在逐步改变人工智能。其中,区块链不可改变/审计跟踪记录的特点,可以为人工智能带来训练数据和模型方面的数据溯源,从而改善数据和模型的可信度。
据雷锋网了解,3月7日早间消息,IBM Watson即将与Salesforce的人工智能平台Einstein合作。在IBM官网上,这样介绍了他们的合作关系:
Salesforce人工智能平台Einstein上客户的数据与Watson的结构化、非结构化数据结合,后者有各行各业、各个来源的的数据,包括天气、医疗保健、金融服务和零售。两者结合后,将能够理解数据、推理并生成决策,加速企业决策和提供更好的客户体验。
在其官网上,具体介绍了合作细则:
IBM Watson和Salesforce Einstein整合。整合IBM Watson APIs到Salesforce中,可以将非结构化、企业内外数据与Salesforce Einstein顾客数据产生的预测性洞察结合,使得销售、服务、市场和商业等过程更智能。
提供Salesforce的IBM天气洞察。IBM的一个业务,The Weather公司,为Salesforce AppExchange提供有关天气洞察,这些信息可能影响客户的行为和公司业务表现。
提供Salesforce的IBM应用整合组件。客户能将内部部署的企业数据和云数据与Salesforce的个性化集成产品结合起来,直接在Salesforce的智能平台上呈现。
IBM的咨询公司Bluewolf将创建一个实践单元为Einstein的软件和服务。
这些合作细节勾勒出一个这样的未来:能够“预测未来”的CRM系统。并且据外媒报道,通过Salesforce的Einstein平台和Watson一些业务的整合,这次合作还为IBM销售其咨询服务开辟了道路。
Amazon Go 从推出到现在已过去四个月,这期间,国内不少传统零售商和创业者受到影响,开始试水搭建无人零售商店。但由于对技术和工程细节不熟悉,往往无从下手。
无人零售除了应用到计算机视觉等 AI 技术外,还涉及到大规模的传感器和智能设备,是一个复杂且庞大的项目。雷锋网了解到,虽然已经有人分享了对无人零售商店的原理解读,但大多只讲述了粗略的实现方式,没有深入到细节。为此,雷锋网采访了无人零售商店创业者陈维龙(微信:daoyuan3),通过讲述基于 Amazon Go 原理为主的无人零售商店项目来帮大家解答疑问。
陈维龙提到,要打造 Amazon Go 这样的无人零售商店最核心的是要解决“什么商品被谁怎么处理了”这个问题,需要处理的因素有5个:人、人的位置、商品、商品的位置、动作。
陈维龙举了个非形象动的例子:对于超市而言,商品存在两种状态——卖掉或没卖掉;对货架而言,商品的状态是在或不在;对顾客而言,商品的状态是买或不买;对人的手而言,商品的状态是在手或不在手,进一步简化成拿起或放回。相机和传感器都可以表示该状态。
其中,商品的识别应该是难度最大的关键点之一。陈维龙指出,在初始状态,特定品类的商品被放在特定位置,由相机和传感器侦测。对相机和传感器而言,它们只需优先识别少数且特定的商品类及数量。这个相对而言是简单的。即使图片无法识别,也可以根据重量识别和筛查。在品类摆放的时候可以选择易区分的品类摆放一起,所有被拿取的商品记录在顾客的购物清单里。困难在中间状态。由于顾客放回会破坏初始状态,导致识别难度急剧上升。因为顾客可能放回任意商品,所以商品的识别范围又扩大到无法解决的情况。
将商品记录到动作的发起者身上是一件较为复杂的工程。陈维龙介绍到,识别人大体通过 2 种方式:身体特征或附带物,例如人脸和手机。人脸识别的精度在室内还在可接受范围,几乎可以当做唯一标识。手机也是一个人的唯一标识,通过判断是谁的手机从而判断顾客是谁。
而要匹配顾客和商品的 ID,首先要确定人和商品的定位。关于人的定位,可以用到追踪系统。手机的 GPS、wifi、蓝牙也可以提供较准确丰富的位置信息。关于商品的定位,红外、重量感应、相机、商品和货架初始的问题都是已知的,可以推测出来。例如,通过隔板,将同类商品分在不同的网格种,每个网格对应不同的红外或重量感应器,可以知道被拿取或放回商品的位置。
总之,难度没有凭空想象的难,但是工程量不小。即使动作和商品识别能达到 100%,因为定位方案和精度问题,导致整体的识别存在一定的误差,而使整个方案无法使用,或者只能部分依靠顾客协助实现。所以 Amazon Go 以及未来的其他无人零售店还只能在小部分范围内对特定人群使用,例如信用度较高的会员。
陈维龙将无人收银分成三个阶段:商品和顾客行为数据统计阶段、识别正常购物的无人收银阶段、识别作弊的无人收银阶段。
• 第一阶段比较容易实现,因为仅仅是统计,顾客不会存在作弊情况,而且统计误差范围相对于无人收银较大。
• 第二阶段是顾客不作弊的情况下,100% 记录顾客和商品数据,达到无人收银的效果。目前 Amazon Go 处于这个阶段。这个阶段的明显特征是建立在高素质会员人群中。
• 第三阶段是识别任意作弊行为,并且准确统计。这个阶段超市或零售行业所以的作弊行为都能被识破、杜绝,不仅可以实现无人收银,还彻底解决了盗损问题。
由于成本和技术问题,陈维龙认为达到第二阶段,往第三阶段靠近就可以了。
相关文章:
毕马威发布2016 Fintech投资报告、支付宝决定放弃社交 | AI金融评论周刊
Google旗下AI健康子公司DeepMind Health,为什么搞起了区块链?
雷峰网原创文章,未经授权禁止转载。详情见转载须知。