0
2020于全体银行而言,是一场无预告的终极考验,一轮最直观的金融科技对决。疫情让网点流量骤降到接近于0,全方位挑战银行线上服务水平,检验那些连年增加的科技投入,有多少真正变作数字化、智能化的一点一滴。
踏进2021,银行们迎来周密复盘、整装待发的最好时间节点。
在过去这一年,银行更努力地摆脱大象转身的刻板印象,告别以往被各路创新推着走的窘况,试图在金融科技和数字新基建的浪潮里承担更主动、开放的角色,以轻快敏捷的步伐持续向前。
没有一家银行不想拥抱AI,没有人愿意错过数智化转型的未来。在梳理数十家银行AI全布局,以及「银行业AI生态云峰会」多位嘉宾的分享过程中,我们逐渐发现银行业AI的那些挑战和困境,那些艰险之处同样是机遇所在。
银行业AI,首先被AI本身正面临的数据困境,和日渐收紧的数据监管尺度拦住。
在技术维度不断向前奋进的同时,银行必然要思考的一个议题是:业务创新与隐私保护如何兼顾?
雷锋网AI金融评论主办的《联邦学习系列公开课》曾对这一问题展开过系统深入的探讨。第一节课上,微众银行首席人工智能官杨强就直接点明:“人工智能的力量来自于大数据,但在实际运用过程中碰到更多的都是小数据。”(详见《微众银行首席AI官杨强:万字图文详谈联邦学习最前沿》)
平安科技副总工程师王健宗也在课上指出,“传统的AI技术必须从海量的数据中学习或者挖掘一些相关的特征,利用数学理论,去拟合一个数学模型,找到输入和输出的对应关系,比如深度学习中训练网络的权重和偏置,模型效果与数据量级、质量、以及数据的真实性等有着密切的关系。”(详见《平安科技副总工程师王健宗:联邦智能的突围与应用之道》)
一个典型例子就是银行信贷风控:现在大部分AI应用都由数据驱动,信贷风控更需要大量数据训练,但大额贷款风控的案例又非常少。“要是来做深度学习模型,只用少量这种大额贷款的样本远远不够。”杨强解释。
小数据需要“聚沙成塔”,同时又面临侵犯隐私的可能。为此,网络安全与数据合规领域的立法进入了快车道,滥用数据和爬虫也受到过严厉整治。虽然目前《数据安全法》还只是处于草案的状态,但是草案明确提出要关注数据本身的使用,需要在保护公民组织、相关权益的前提下,促进数据为关键要素的经济发展。
数据被称作是新时代的油田,但银行该怎样通过AI摸索出更高效、更合规的开采工具?
在「银行业AI生态云峰会」第一场演讲中,微众银行区块链安全科学家严强博士就对银行必备的数据安全与隐私保护思维,进行了深入讨论。他指出:
在数字经济时代下,银行业AI发展必须要尊重“数据孤岛”作为数据产业的原生态,隐私保护技术则是打破数据价值融合“零和博弈”的关键,需要打通隐私数据协同生产的“双循环”。
而区块链是承载数据信任和价值的最佳技术,对于隐私计算和AI应用中常见的数据品质等难题,都可以通过区块链进行互补或提升效果。
联邦学习、TEE可信计算、安全多方计算等多个AI技术路线也正尝试落地于银行的核心业务场景。AI金融评论了解到,除了微众银行,江苏银行2020年也已开展联邦学习方向的探索,他们与腾讯安全团队合作,基于联邦学习技术对智能化信用卡经营进行联合开发和方案部署,在联邦学习技术支持下进行金融风控模型训练。
以“数据”为线,银行前中后台的升级轨迹清晰可见。
如果说前些年的银行科技,讨论度更集中在前台智能化应用,那么如今中后台建设开始更多地来到聚光灯下,讨论它们为银行数字化转型呈现的价值和意义。
这当中的一个重要模块,就是银行数据库的改造升级。
我们曾经报道,Oracle自进入中国市场以来,在银行数据库市场,一直具有压倒性优势,也是许多银行的采购首选。
由于长期使用Oracle,不少银行形成较严重的路径依赖。平安银行分布式数据库技术负责人李中原也向AI金融评论表示,系统迁移和重新建设需要大量成本,从单机变为多机群体,故障发生的故障发生的概率和维护成本都会加大,对整体系统运维将是巨大挑战。(详见《银行业“求变”之日,国产数据库“破局”之时》)
但随着银行业务创新需求愈发复杂,传统数据库在技术边界、成本、可控性方面越来越不相匹配;采购数据库的来源单一也让银行陷入非常被动的处境。
而云计算的出现,让Oracle在数据库市场接近垄断的地位有所动摇,各大互联网云厂商杀入战场。
腾讯云副总裁李纲就表示,云化数据库胜在成本低、易扩容两大特点,任意一台X86的PC服务器就可以运行,理论上也有着无限的横向扩展能力,这都是Oracle等传统数据库难以企及的优点。
中国数千家银行由此获得更多选择余地,开始从集中式数据库迁移到分布式数据库,一场事关“大机下移”的漫长征途就此展开。
这场变革已有先行者,例如张家港行在2019年就将其核心业务系统放在了腾讯云TDSQL数据库上,传统银行首次为核心系统选用国产分布式数据库;2020年,平安银行信用卡的核心系统也完成切换投产,新核心系统同样采用了国产数据库。
在「银行业AI生态云峰会」上,腾讯云数据库TDSQL首席架构师张文就深入分享了张家港行和平安银行这两个典型的数据库迁移转型案例。
以平安银行为例,其体量之大,意味着应用改造更具挑战性。张文解释道,为了配合此次改造,应用引入了微服务架构对应用进行了拆分和解耦。对账号的分布进行了单元化划分,以DSU为一个逻辑单元,单个DSU包含200万个客户信息,单个DSU同时处理联机和账务两种业务。
但国产分布式数据库也同样还在成长当中,张文也指出了目前金融级分布式数据库面临一系列挑战点,除了有可伸缩、可扩展的能力,更要解决高可用性、数据强一致性,同时探索更具性价比的性能成本,以及为金融机构打造更易上手的、更产品化的成熟解决方案。
“中台建设”这个热门关键词,不再是互联网公司的专属。银行也不例外,甚至更需要中台。
银行这样的大型机构,架构极其复杂,还有跨部门多团队的协作,海量数据日积月累之下如同年久失修的危楼,更需要及时、持续的治理。
在看来,银行拥有大量的数据、技术和人才,资源却往往“各行其是”,部门之间没有配合意识、独立造烟囱;技术流于表面,无法链接、深入,这造成了银行资源的大量浪费。
中台的体系化建设和顺利运转,才能将这庞大体系中的“死结”一一梳开。
建设银行监事长王永庆就曾指出:中台建设是商业银行数字化经营转型的关键环节,认为商业银行数字化转型的必然归宿是生态化、场景化。(详见《中国建设银行AI全布局》)
尽管商业银行在多年经营过程中沉淀了一定的竞争优势,形成了各具特色的内部生态系统,但目前仍是封闭的、高冷的,还无法满足数字经济对开放式生态化经营可交互、高黏性、有体感、无边界的要求。
因此,建行也已在数据中台先行一步,其落地上概括为5U(U是统一的意思),包括统一的模型管理、统一的数据服务、统一的数据视图,统一的数据规范以及统一的数据管理。
为求轻松支撑亿级用户,实现高时效、高并发场景化经营,招商银行近两年也在中台和技术生态体系的建设上持续发力。去年年底发布的招商银行App 9.0,迭代需求点超过1800项,“10+N”数字化中台建设就占据了相当的比重。(详见《招商银行App 9.0上线:当一个十岁的App谈「新基建」与「杀手锏」》)
如何构建金融机构需要的数据中台?
在「银行业AI生态云峰会」上,360数科首席科学家张家兴就用“三通三快”概括了数据中台的标准:
金融机构面对着海量用户、复杂业务,一个优秀的数据中台,必须是达到多业务打通,内外数据互通和用户关系连通,同时还要做到数据的实时处理快、使用快、需求响应快。
他进一步强调,数据与AI融合得非常紧密,如果数据中台和AI中台各自建设,两者之间将不可避免地存在割裂的现象。基于此,360数科也推出了自己的数据AI融合中台,将最上层数据平台,到中间数据服务支撑的平台服务,再到整个数据资产的管理,到最下面整个数据技术架构的设计都进行调整,并且将自身沉淀的AI能力嵌入其中。
张家兴也在云峰会的演讲上透露,360数科研发了一项联邦学习技术——分割式神经网络,通过神经网络在高维空间,Embedding不可逆的特性,使得不同参与的数据合作方只需要传递Embedding向量,见不到原始数据,但最终可以使模型产生目标效果。
而在过去一年里,银行信贷风险管理,仍然是最引人关注的方向之一。
关注度一方面来自于,受疫情影响而剧增的贷款逾期和坏账风险,如何借助技术手段“端稳这碗水”,把握好信贷支持尺度,成为银行、消金公司和风控技术服务商们的开年大考。(详见《信贷战“疫”:一场给风控的开年大考》)
而另一方面,2020年下半年起,针对金融科技或是互联网金融的监管“红线”逐渐清晰。例如《商业银行互联网贷款管理暂行办法》,其中就明确提出了对商业银行的风险管控要求,和对合作机构的管理规范。
尽管结合AI、大数据的智能风控在银行科技应用中不再新鲜,但这并不意味着智能风控已经足够成熟——数据资源壁垒、自有数据累积、数据特征提炼、算法模型提升,被认为是大数据风控目前所面临四大困境。
某商业银行负责人就曾表示,在模型建设和模型应用过程中普遍存在数据质量问题,包括外部数据的造假(黑产欺诈)和内部数据的滥用等,在模型迭代方面,很多银行只追求迭代的速度和频次,而忽略了最终效果。
前百度金融CRO、融慧金科CEO王劲进一步指出,数据规范和治理体系不健全,数据质量差且缺失率高,技术能力不足,复合型科技人才匮乏等因素都是银行等金融机构无法做好模型的重要原因。
王劲曾在有着“风控黄埔军校”之称的美国运通工作17年,负责过全球各国各类产品相关的700余个模型提供政策制度和独立监控。在「银行业AI生态云峰会」上,他也结合自身二十余年风控经验,剖析了金融风险管理中的那些理念误区。
“很多人并不是特别理解,风险管理永远是一个寻找平衡点的科学。”王劲认为,风险管理平衡有着这样的核心三问:
如何把握风控和业务增长之间的平衡?
在风险管理的数据、模型以及策略中,如何平衡简单和复杂?
在基于数据、技术的“科学”,和更依靠主观经验的“艺术”之间,如何找到平衡点?
他也解析了银行等持牌金融机构做好风险管理平衡的核心要素,谈到风险管理最重要的就是对数据的把控,“金融公司成立之初就要思考数据的生命周期。首先要从对业务产品和客户的选择当中,决定需要什么样的数据。”
数据战略是一个相对长期的落地过程,机构首先要立下数据选择的原则和条件:要考虑的不只是数据的合规性、稳定性和覆盖率,更要考虑数据的新鲜度、时效性和时间跨度。
从模型建设的角度出发,王劲指出,一个卓越的风控模型应当具备辨别力、精准度、稳定性、复杂度和可解释性五大要素,“原材料”数据、模型架构和算法的选择,衍生变量的出现,对模型的监控和迭代,以及对y的定义和样本的筛选,无一不影响模型的“锻造”。
在他看来,银行等金融机构如果能在身份识别和控制、数据安全管理、风险模型管理,和自动化监控体系方面,做到高效完善,将会是非常理想的一种状态。
还有一个关键词,在各家银行年报中出现频率越来越高,那就是RPA(机器人流程自动化)。此前AI金融评论也曾举办《RPA+AI系列公开课》,邀请到五位头部RPA厂商高管分享RPA与金融碰撞出的火花。
RPA的定义,很容易联想到2012年左右的“流程银行”转型潮。当时的流程银行,意为通过重新构造银行的业务流程、组织流程、管理流程以及文化理念,改造传统的银行模式,形成以流程为核心的全新银行经营管理体系。
如今银行的转型之战,全方位升级为“数字化转型”,内部流程的优化改造在AI和机器人技术的加持下持续推进,RPA也迅速成为银行数字化转型不可缺席的一把“武器”。
达观数据联合创始人纪传俊在「银行业AI生态云峰会」上指出,RPA+AI为银行带来的价值,最明显的就是减少人工作业、降低人工失误,提升业务流程效率,同时也提高风险的预警和监控能力。
雷锋网AI金融评论注意到,已有多家国有大行将RPA投产到实际业务中。
以工商银行为例,RPA在工行的应用覆盖了前台操作、中台流转和后台支撑等多个业务场景,在同业率先投产企业级机器人流程自动化(RPA)平台并推广应用,全行累计46家总分行机构运用RPA落地实施120个场景。
建设银行同样也引入了RPA,建立国内首个企业级RPA管理运营平台,敏捷研发业务应用场景 100 个,实现人工环节自动化、风险环节机控化。
农业银行方面则透露,农行目前还处于技术平台建设阶段,之后将以信用卡业务、财务业务等为试点落地RPA需求。其实施策略,是建设全行统一的RPA技术平台,面向总分行各部门输出RPA服务。
中国银行在2017年底,旗下公司中银国际就已有RPA的概念验证,团队成功投产20个机器人,分别在不同岗位执行超过30个涉及不同业务流程的自动化处理工作,也与RPA厂商达观数据展开了合作。
纪传俊也在云峰会上分享了目前AI+RPA在银行各大典型场景的落地:
例如智慧信贷,面向的是整个银行最核心的流程——信贷流程,分为贷前、贷中、贷后三大阶段。其中涉及数据查询、数据处理、财务报表、银行流水等专业环节,需要完成基础信息的录入、尽调报告的审核,而这些环节中的大量重复劳动,可以基于AI、OCR、NLP等技术自动化完成。
纵观银行数字化转型进程,更多前沿技术逐渐进入到银行的视野,还有许多业务环节、场景和体验正在被科技的力量重塑。
基于此,雷锋网AI金融评论在新旧交替之际,邀请到八位重量级嘉宾做客「银行业AI生态云峰会」,以线上直播演讲的形式,针对数据安全、数据库、中台建设、智能风控、RPA等银行科技的不同赛道,进行深入浅出的干货分享。
扫码关注“AI金融评论”,对话框回复关键词“参会”,即可获得本次云峰会所有回放。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。