0
近日,鹏城实验室与微众银行联合建立的“鹏城实验室-微众银行‘AI金融联合实验室’”(以下简称“AI金融联合实验室”)在广东深圳微众银行总部正式揭牌。该实验室成为广东首个“AI金融联合实验室”。
“除了这次的AI金融联合实验室,微众此前已和很多高校都建立了联合实验室,如南洋理工大学、香港科技大学、深圳大学、清华大学等,以后这些实验室或将一起合作研究。”微众银行首席人工智能官(CAIO)杨强教授对雷锋网AI金融评论表示。
不难看出,AI领域的产学研一体化趋势正在不断加强。这样的背景下,雷锋网AI金融评论采访了杨强教授,详解联合实验室的具体合作内容,以及此次合作背后的微众银行AI布局全貌与细节。
据了解,鹏城实验室主任高文院士作为人工智能方向的责任院士,将指导“AI金融联合实验室”工作,杨强教授则担任“AI金融联合实验室”主任,负责“AI金融联合实验室”的日常运作。
实验室将以AI+金融领域的相关研究作为工作重点,聚焦以下三大领域:一是基于联邦迁移学习的联合AI建模生态研究与应用;二是以金融服务为核心的新一代人机交互技术研究与应用;三是AI精准决策研究与应用。
“争取在一些具体的技术方向上做到世界领先,比如如何在更好的硬件和网络帮助下加速做联邦学习、如何研发更好的加密技术、如何将区块链和联邦学习进行有机结合、如何实现多模态的识别和安全等。”杨强表示。
据他介绍,AI联合实验室目前的技术支持主要来自于微众的AI部门和IT部门。资本方面,由于目前实验室主要还是做科学研究,所以是微众内部投资。
在数据方面,杨强表示目前的数据还够用,以后如果有需要的话,会有其他数据方参与进来。
雷锋网AI金融评论注意到,除了设立首个省级“AI金融联合实验室”,微众银行还首开银行先河,聘请香港科技大学新明工程学讲席教授 、国际人工智能联合会理事会主席杨强担任首席人工智能官(CAIO),成为全国首家设立“首席人工智能官”的商业银行,也由此开启了微众银行的AI布局。
据了解,微众AI布局从去年开始探索,目前已实现四大方面的突破性成果:
一是服务侧。微众紧贴互联网银行业务流程打造了泛机器人技术,探索新一代AI人机交互新方式,落地了一系列具体的机器人产品,包括语音客服机器人、电核机器人、风控对话机器人、质检机器人、OCR机器人等,目前已经覆盖“业务咨询、身份核验、资料审核、操作放款”等业务全流程。
二是营销侧。与其他行业不同,金融行业产品属于典型的高价值低频次产品,这种产品的用户决策和购买路径一般很长。针对这种特点,微众银行AI团队自研营销解决方案:长效推荐模型+智能运营平台,以“数据+算法+平台”驱动的站内广告形式,打造极致用户体验。
其中,长效推荐模型针对性解决用户在互联网平台的“复杂交互行为”和“长短期兴趣优化”的挑战,对用户复杂交互行为进行图结构建模,优化短期用户点击率。同时,以强化学习探索用户动态兴趣,有效避免信息茧,优化长期用户点击率。
目前该营销解决方案已应用于不同的金融细分领域,包含保险、贷款、银行等业务场景。
三是资管侧。微众利用微型卫星数据和遥感影像分析技术探索金融保险、风控等场景下的辅助决策应用。
具体关键技术包括目标检测技术、道路提取技术、地表识别技术,目前基于这三大技术的模型已成为评估某一个地方经济发展变化的代表性指标。
四是大数据侧,针对行业“小数据”和“数据孤岛”、数据安全、隐私、合规等问题,微众银行AI团队提供了一种新的思路,即“联邦学习”,通过分布式加密机器学习技术,在数据不共享的情况下,共同建模,提升AI模型效果。
目前微众银行已经将联邦学习应用于企业风控、城市管理、语音识别引擎等领域,并建立起了以联邦学习为基础的大数据合作生态。
针对更为具体的布局细节,杨强教授接受了包括雷锋网在内的多家媒体采访,以下为采访实录:
问:微众银行AI布局集中在四大领域,为何会选择这四大领域进行重点布局?下一个布局领域会是什么?
杨强:紧贴业务需求。微众两千名员工,要服务超过1亿的人,就要先抓住重点需求,类似实体银行,用AI赋能前台的营销、客服、资管和后台的风控建模,这四大领域是按照一个银行的主要业务需来布局的,另外我们也正在布局监管领域,比如风险投诉渠道检查、舆情分析等,我们正在和监管方一起合作推进。
问:AI什么时候能达到对银行业务全领域覆盖的程度?要达到全覆盖需要重点突破什么技术?
杨强:全领域、全业务流程的AI覆盖比我们想象的要难,更多能做到的是人机合作、人机互动,金融业务流程复杂,人的知识不可或缺。让人和机器一起合作,在人工智能领域还是一个新鲜的事物,人机互动这种人工智能现在需要什么技术呢?需要把人工智能的黑箱变成白箱,需要知道它的解释性,就是说它作出一个决策来,这个决策背后主要的因素需要被找出来。
所以,真正做到全自动的、端到端的、没有人参与的AI覆盖,离我们还很遥远,目前大家关心的是要把人的因素考虑进来,包括银行从业人员,也包括终端客户。
问:怎么让黑箱子变成白箱子?业界目前有哪些最新的探索?
杨强:现在有几个尝试还不是很为大众所知,国际上有一群人在专门研究因果关系,通过因果关系建立一个人工智能模型。但他们的问题是,他们还没有能成功地利用到大数据,所以他们的研究离深度学习这种黑箱还有很大差距。
但也有一群研究者已经开始把这两者结合起来,比如你在训练一个黑箱的同时,可以让这个训练的流程影响到一个白箱的建立,白箱的目的就是解释黑箱到底为什么是这样的。
总的来说,现在有一些学者在做这个研究,但还没有特别大的突破,这也需要时间。
问:微众目前在AI赋能上走过了几个阶段?
杨强:从去年开始做,先是调研阶段,现在的四大领域就是调研的一个结果,这算是第一阶段;拿到调研结果后,我们就开始建平台去跟业务部门合作,这是第二阶段,也是我们目前所处的阶段;下一个阶段我们的计划是在微众银行内部大规模铺开,以后也不排除去对外帮助其他企业拥有同样的AI赋能能力。
问:如何衡量微众用AI赋能业务的效果?
杨强:两个方面,向外看客户的满意度,向内看业务效率,即看AI的覆盖面和降本程度,尽量把所有的繁琐流程都自动化和效率化,所以微众还有一个领域叫做流程自动化,RPA+AI,专门做流程自动化。
问:现在RPA为什么这么火?
杨强:过去大家做AI雄心很大,把商业想得简单了,以为整个商业是可以取代的,但事实并非如此,因为商业逻辑里其实是有很多人的经验在起作用。RPA+AI的一个特点是需要把AI真正深入到业务里去,提高人的效率,但同时保留人对业务的知识与经验。
也因此,很多RPA+AI的商业机会是自内而外的,就是先发生在一个企业内部,然后在对企业的业务和流程有一定熟悉度的基础上,面向整个行业的共同特点推广开来,而不是先在外面建立一家RPA公司来帮助不同的行业。
问:微众银行在探索AI赋能的过程中,最大的经验是什么?
杨强:紧贴业务,虚心向业务学习。以前AI刚出来的时候,大家都是以颠覆、取代为出发点,但现在发现这个出发点是错误的,正确的应该是要与行业紧密地结合,从AI+变成+AI,AI+是说你先成立一个AI公司,然后去赋能业务,但实际上会很难,也会走一些弯路,而+AI是说你已经有了业务,然后你用AI去赋能,本质还是以业务为中心。
问:目前在AI金融领域有哪些泡沫?
杨强:金融是一个比较严谨的行业,所以AI金融的泡沫会少很多,想要尽可能地减少泡沫发生,最核心的就是抓住落地场景。
一个更广泛的AI应用例子是智能音箱,以前大家以为它是未来的入口,现在发现是不对的,现在沦为一个放音乐的音箱。所以有时候我们容易把对技术的期待和对业务场景的期待相混淆,这时候AI产品经理就变得非常重要,这些人负责找到正确的应用场景。
问:微众现在AI团队是一个什么样的架构?您觉的现在AI人才难招吗?会是微众的一个痛点吗?
杨强:我们的AI团队是按照前面说的四大赋能领域来分项目组的,人员都在深圳。AI人才在我们看来和别人看来可能角度不一样,别人眼中的AI人才可能更多是指算法人才,我们在这方面一点都不缺。
因为我们觉得AI的实现不是由算法人才努力的结果,是由刚才说的AI产品经理这种角色努力的结果,是需要发现AI和产品和业务的一种有机结合。这种发现是需要智慧和一种非常巧妙、同时非常耐心的特质,所以我们在人才方面跟别人的需求不一样。
问:您当初为什么选择加入微众?
杨强:因为微众做的事情和我的研究方向有契合之处,比如我现在做联邦学习,如果不来微众,恐怕是做不起来的。
微众作为一家用少数人来服务庞大客群的互联网银行,它有很多需要AI的场景,同时也需要有很多合作企业。
企业合作这个事儿在AI里并不是空谈,而是区分前一代人工智能和下一代人工智能的分水岭。因为合作必然会引入数据安全和隐私问题,那么在微众这个互联网银行既小又要覆盖面广的矛盾下,由联邦学习这种技术来解决数据安全与隐私问题就变得必不可少,这也是我为什么选择微众的一个重要原因。
问:联邦学习目前在工业界使用的规模大吗?
杨强:除了微众,还有很多行业在使用联邦学习,应该说它落地已经成熟了,但还不断会有新的技术点要突破,比如在面向C端的终端设备上,更好的芯片会让联邦学习做得更好,再比如面向B端的、同行业或跨行业的企业之间的合作,在保护双方数据的同时还能交换知识,建立共享模型。微众目前在这方面已有十几个落地案例。
问:除了联邦学习技术,业内还有其他关于隐私计算的研究吗?它们在业内的地位是怎么样的?联邦学习技术被接受和认可度有多高?
杨强:隐私计算是一个非常重要的题目,不同行业都在研究,比如做数学的、做算法的、做计算系统架构的,都从不同的角度在研究,所以自然而然就出现不同的框架。
联邦学习目前看来,是一个优势胜出的框架,因为它是专门针对机器学习提出来的。像其他框架如安全多方计算更多是针对计算的需求,加减乘除这种简单的运算和数据库查询。
还有一种叫做隐私保护的数据查询,privacy-preserving database和data query,更多是从加密的数据库角度进行的,它的做法是加很多噪音进去,使得查询数据的那一方分不清个别用户,从而起到一定的保护隐私作用,但是事实证明,它在工业界使用的不多,更多是学术界的数学推演。
总的来说,目前大概有四五个方案在齐头并进,其中联邦学习是落地比较扎实的,也是在大规模计算上前途较好的一个方向。雷锋网雷锋网
雷峰网原创文章,未经授权禁止转载。详情见转载须知。