0
金融科技这一行,存在两种「伪AI产品」。
一种是温室花朵,产品性能在实验室和小数据场景中表现优越,然而一旦放在枪弹雨林的复杂业务环境中,系统立马崩溃。好比碰到欧美球队的中国男篮。
二是画蛇添足式产品,很多IT问题,明明可以用简单、传统的技术方法就能解决,但企业非得让客户使用更贵、更复杂的产品。犹如高射炮打蚊子。
金融行业到底需要什么样的人工智能?
为此,雷锋网《AI金融评论》策划了「AI能否解决金融刚需问题」系列选题,借同一个话题,对不同背景的受访者、产品和客群各异的企业们进行采访,期望在不同的商业和技术认知下捕捉观点碰撞的火花。
本系列选题的第一篇文章,由冰鉴科技CEO顾凌云讲述他眼中AI和金融之间的关系。
以下为顾凌云的所感所想:
闻到血腥味儿的“鲨鱼”
90年代末,我在CMU计算机学院攻读博士,当时选择了AI作为研究方向。
其实在21世纪的第一个十年里,人工智能从商用角度来讲,始终是阳春白雪,难以落地。
直到深度学习爆发后,我才意识到,AI的时代要来了。
于是在2015年,我创办了AI金融风控公司——冰鉴科技。
「冰鉴」拥有上百家客户,其中也包括工商银行总行、中国银行总行等大客户,投标经历,不可谓不丰富。
当年有一家国有行,在网上公开招标,这一赛道里的金融科技公司,听到这条消息后,都像嗅到了血腥味的鲨鱼一样。
那次POC极其惨烈,一共来了29条“鲨鱼”。
这29家公司中不仅有做人工智能算法的、有做IT系统的,甚至,连咨询公司都来凑份热闹。
这么多公司只选出5家进入第二轮竞争,而「冰鉴」是这5家公司当中「技术标」第一名。
当然,这并不意味着我们最终赢得胜利,后面还有竞争更为激烈的「商务标」。
商场如战场,这5家公司中,有一家在圈内比较知名的公司砸了一个极低的价格。
但幸运的是,这家大型银行的商务标的百分比调的没有那么高,技术标的百分比也调的没那么低。
最后,我们争得了技术标和综合标的第一名,成功拿到了这一单。
这是我印象最深刻的一次POC经历。
当然,POC测试也好、投标经历也罢,要想成功竞标,拥有一支技术铁军,永远是第一位。
管理一支卓越的技术队伍,最基本的原则就是,领导者能够清晰地定义问题,清楚地知道每一种AI方法的能力和边界。
我之前听一些专家谈到这么一个观点,如果能用上个世纪的传统方法很好地解决问题,那就别轻易用最新的算法。
其实在金融风控领域也同样如此,很多业务根本用不到先进的机器学习模型,一个简单的决策树或逻辑回归就能完成。
但很多AI公司犯了一个比较致命的错误,认为凡事都该用前沿和复杂的方法。最后把AI这个实用的工具,弄成了炫技的道具。
这非常可悲。
AI不是一个筐,任何东西都可以往里装。
从CMU读书到创办冰鉴科技,虽然一直都在和AI打交道,但我不认为AI就是放之四海而皆准的真理、不认为在任何场景下AI都可以应用地比现有的技术都要好。
张口闭口谈AI,却对以往的信贷风控方法嗤之以鼻,那它基本不是一家AI公司。
AI不是「排他型」的技术,不会一路走来像坦克碾压一样,把历史上所有的算法或方法都扔进垃圾桶。
在我们做数据处理时,数据的来源越是繁杂、越是难以用人工分析,AI所发挥的功能越强。
当每一个物理变量都非常清晰,我们为什么还一定要用AI画蛇添足?
但是,这并不意味着企业要减少科学家团队的招募力度。
根据我多年经验来看,搭建一个特别昂贵的机器学习团队,非常必要。
冰鉴85%以上的员工是技术人员,很多来自CMU、MIT、斯坦福等高校,他们无论是工程师还是产品经理,撸起袖子就可写代码、整整领子便能谈商务。
一家科技公司靠一个算法或者一个特别复杂的机器学习模型,就想长期领跑行业,几乎不可能。
科技在不断变迁,研究的方向也在不断改变,一家公司能在某一技术领域领先其他对手6~9个月,就已经非常了不起。
我认为,能够保证我们在最新的领域中始终保持自己独到的见解,甚至再进一步,引领行业新的研究方向,才是我们打造昂贵机器学习团队的最终目的。
“鸡肋”的人工智能
目前人工智能在金融行业中有着非常多的应用,企业也不断在拿锤子找钉子。
但很多时候,AI在一些看似热门的应用领域,其实际效果并不理想。
在计算机视觉当中,有个非常传统的研究领域叫OCR,说白了就是识别图片上的文字,然后提取出来,变成可编辑的文档。
这些数据电子化后,我们做模型就会非常方便。
听起来很简单,但实际操作却非常困难。
如果OCR扫描的是高考试卷,哪里放照片、哪里写姓名、哪里填数字,每一张试卷的格式都一样,那么OCR可以很快捷的识别。
但是如果每一张纸的内容不同,就很难处理了。
每一次上法庭前,律师都需要准备大量的材料。每份材料都有相对应的观点,需要一一分类。
这些事,全靠法律实习生或者实习律师,通过查阅浩如烟海的文献资料,归纳总结出来。
律师事务所就在想,这些法律材料比如公司的营业执照、组织机构代码、财务文件、合同等等都是打印出来的图片。
能否通过OCR将这些图片扫描,然后通过自然语言处理,找出相关内容,放到律师的观点下。这样律师上庭的时候, 不用自动归纳总结,用AI技术就可以轻松搜证。
这是一个听起来,目前技术可以解决的问题。但是真正操作起来,即使用最好的NLP技术,50%的正确率也达不到。换言之,和扔硬币没区别,我扔硬币的准确率还50%。
法务这样的一个场景,很多公司都在做,都希望赚钱,但实际上AI的实际应用效果一点都不好,而且价格高昂。
你可以去任意一家律师事务所询问,有没有人采购这种可以轻松分析大量法律文件,归纳总结并拿去上庭的AI产品。一定不会有答案。
AI没能帮助律师事务所处理这个问题,实际上是因为底层的技术本身还不够强劲,从理论到实践还有很长的路要走。
想要解决这个问题,AI企业第一要做的是将基础算法再往前推进一步,第二点是在数据采集的过程中,保证采集的数据更加清晰、干净。
此外,在非常火热的智能营销领域,由于用户有多元化的需求,然而市场上的产品较少,导致推荐效果并不理想。
我们的方法则是用很多跟AI相关的算法,对流量进行分层。一家公司不管好坏,只要购买了流量,我们就能根据非常有限的信息,对每一个客户进行一次用户画像。
画像后,进行分层,分层后,对不同的人群和不同的流量,进行最优化,然后匹配。
让AI成为“鸡腿”
食之无味、弃之可惜,如何让AI这只“鸡肋”变成“鸡腿”,一直是金融和科技公司在思考的问题。
银行需要一些客观的标准来鉴别哪家金融科技公司AI实力更强,随着合作的愈发紧密,甲乙两方也逐渐摸索出一套比较通用的技术指标。
其中第一个标准叫「KS值」,KS是俄罗斯两位科学家的名字,因为两个人的名字太长,世界上没几个人能记得,所以把他们名字的第一个字母提取出来。这是一个用来衡量AI模型好坏非常通用的指标。
另外一个指标叫「AUC」(Area Under Curve),就是在一条曲线下的面积到底有多大,在这个曲线下的面积越大,说明这个模型效果越好,反之模型效果越差。
还有一个指标叫「F-score」,当准确率变得越来越高的时候,效果也会越来越好,可以把更多的坏人挡在门外。
刚才讲了三个指标,但是如果你的模型覆盖率太低,那也没用。
假如某个模型的目标是覆盖1000万人,即便你测试了1000人,达到了测试标准,但是这并不代表你的AI产品一定就是好的。
此外,AI模型也是有时效性的,随着时间的变化,它的性能是否会大幅下降?AI模型在更新的过程中,是否需要大量时间和金钱?AI模型和银行的核心系统在对接的过程当中是否简易?AI模型本身是否做的很标准化?
这些都是在技术指标之外,银行使用AI产品时,必须要考量的标准。
金融业务十分复杂,每项业务所需要的AI能力也不尽相同。
我们知道,人工智能的三大技术分支:计算机视觉、语音语义、机器学习,对实际业务的改善效果也各有千秋。
计算机视觉在人脸识别、生物特征识别上应用的更多,具体到金融业务中,在支付方式上应用的就很广泛,现在很多人去商店购物都是刷脸支付;当你去银行或者证券公司开户,也普遍使用这样的技术。
当一家企业开完户后,你如果要申请贷款或者理财时,语音语义(自然语言处理)所具备的舆情分析能力就变得很重要。
计算机视觉、自然语言处理一般是应用在贷款过程中。
贷款后,金融机构需要判断个人或者企业发展稳不稳定,是否能还钱。而机器学习算法本身就可以帮助金融机构决定谁先还款、如何还款。
在贷后管理环节,还可以应用语音识别技术。利用人工智能客服,可以大大减少人力成本、提高效率。此外,教育客户什么是AI、怎么用AI也是非常重要的一点。
我们的方式是联合建模,手把手地和客户共同完成一个项目。
联合建模比咨询更进一步,大家肩并肩坐在一起,我告诉你我是怎么一步一步把这个模型建出来的,你跟着我用你的数据重复一遍,这种方法是教育不太懂AI的客户最好的方法。
当然,银行在评估金融科技公司的产品时,也会有自己自有的一套指标或者方法。
比如说某些消费金融机构,会执行一套客观的指标。以24小时、7天或者30天为一个期限,他们会时时刻刻监控模型的效果,一旦模型的效果超出规定范围,马上就会根据期限调整产品。
即使你本身的模型效果很稳定,他也会每3个月做一次测评,每6个月做一次测评,每一年对供应商进行一次重新的测评和调换。
通过这种方法来保证他们使用的产品,一直由最佳技术实力的公司提供。
我的一些思考
从业这么多年,我不断地在加深一个认识:科技和监管之间的关系到底是什么?
很多人认为这两者之间是一对冤家,监管越严,科技公司发展得越困难。我觉得不是。
监管本身跟谁都没有仇,监管是为了能够让金融和科技在合法、合规的框架中更好的发展。
监管,实际上监管的都是金融机构,当然金融公司受到了影响,科技公司也会受到影响,但这并不意味着监管直接对科技产生了影响。
大多时候,监管限制了金融机构的发展,却促进了金融科技公司的长远进步。
没有监管,科技本身将裹足不前。
因为没有监管,银行和金融机构赚钱太容易,从而不会在技术上有大规模的投入。
但是,一旦有了监管,金融机构就戴了锁链,还想赚钱就必须提高自己的竞争力,而提高自己竞争力最好的方法是拥抱科技公司,所以最终监管暂时抑制了金融公司的发展,促进了科技公司的发展, 最终促进了两者的共同发展。
监管的本质是良币去驱逐劣币,监管打击的是劣币,促进了真正的科技公司的发展。
科技公司一般都比较前卫,研究的东西也比较新颖。
人们于是认为科技公司开着一辆法拉利跑车,嗡地一声就开出去很远,监管可能还骑着一辆二八大杠的自行车,在后面追也追不上。实际上不会这样。
因为「监管」在整个道路上面设计了网格化。网格化就是红绿灯、限速、停车等标志,跑得再快的法拉利,到了路口,也要停下来。
红绿灯的时间由「监管」来调控,如果监管觉得科技可以跑得更快,就让绿灯亮的时间更长;如果觉得科技已经跑得太快了,有超速的倾向,监管可以将红灯的时间调得更长。
最后,我也想对金融科技的创业者和优秀技术人才说几句话。
如果你是悲观主义者,那就别再往AI金融行业里跳了,它早已不是蓝海,而是一片看不到头的红海,你还往里跳什么,即便你穿着救生衣,带着游泳圈跳进来,不淹死你,也能挤死你。
如果你是乐观派,你们赶紧来吧,AI金融和其他所有行业比起来,属于近水楼台先得月,是离国民经济最核心的地方。
在这样的行业中,对于科技的渴求是最强烈的,是最容易做出一番事业、最容易发挥我们技术人才聪明头脑的。(雷锋网)雷锋网
封面图来源:电影《万物理论》
雷峰网原创文章,未经授权禁止转载。详情见转载须知。