1
本文作者: 木子 | 2019-07-08 10:11 |
机器学习的下一波浪潮!
AI领域最炙手可热的技术之一!
国外的谷歌、Facebook、微软,国内的深兰科技、旷视科技、第四范式等领先的AI企业竞相研发......
如果2019年你只关注人工智能领域的一项技术,可能最应该是AutoML技术。
近日,国内AI企业在AutoML技术上传来好消息。7月1日,IEEE ISI 2019国际大数据分析竞赛结果出炉,深兰科技DeepBlueAI团队分别取得了一项冠军和一项季军的优异成绩。
到底何谓AutoML技术?为什么谷歌、Facebook、微软都重金投入竞相研发?为什么它被誉为“AI领域最炙手可热的技术”?为什么说“中国企业AI转型或迎来新进程?”
近日,来自中国上海的AI独角兽——深兰科技DeepBlueAI团队,在IEEE ISI 2019国际大数据分析竞赛上分别取得了一项冠军和一项季军。
拥有16年历史的IEEE年度国际会议,是安全信息学领域的旗舰会议。目前已从传统的智能和安全领域发展到多领域联合研究与创新。今年7月1日,第17届IEEE ISI会议由深圳人工智能与数据科学研究所主办。
IEEE ISI会议发起了此次国际大数据分析竞赛(IEEE ISI 2019年世界杯,IWC 2019),并面向全球高校、研究机构、企业、政府开放。本次大赛总计参赛人数逾千人,三百多支参赛队伍分别来自中国、美国、巴基斯坦、英国、德国等7个国家。来自华为、京东、滴滴等知名企业,以及来自清华大学、北京大学、浙江大学等知名高校的三百余支队伍参赛,参赛总人数逾千人。
今年IEEE ISI大赛分为:投资价值评估和法律诉讼类型预测两个赛题。在企业投资价值评估赛题中,深兰科技DeepBlueAI团队凭借自研的AutoML系统,以较大领先优势获得冠军。
所谓AutoML全称Automated Machine Learning,即自动机器学习,该技术是2014年以来,机器学习和深度学习领域最炙手可热的领域之一。
AutoML技术之所以被广泛关注,是因为它让机器学习从“教学”变成了“自学”,大幅提升了机器学习的效率。
具体而言,传统的机器学习,从摄取数据到预处理、优化,然后预测结果,每个步骤都需要由专业的AI人才来控制和执行。而在AutoML技术的加持下,人主要只关注两个主要方面:数据采集/收集和预测。中间发生的所有其他步骤都可以让机器轻松实现自动化,同时提供经过优化并准备好进行预测的模型。
AutoML技术普遍具备两个特征:
自动化:AutoML能高效通过自动执行的重复性任务来提高工作效率。这使得数据科学家能够更多地关注问题而不是模型。比如深兰科技自研的AutoML技术,除了能够节省大量人力物力财力,并且还能更加快速和安全地搭建出一个优于大多数算法工程师搭建的机器学习系统。在本次比赛中,AutoML系统可挖掘各业务字段间的复杂关系,自动提取高阶特征,给企业价值评估提供了新颖的更加精准的解决方案。
泛用性:由于AutoML自动化以及高效的特征,它一定程度上打破了AI技术与AI科学家的深度绑定关系,进而降低了AI技术的应用门槛——毕竟并非所有企业都有资源来聘请经验丰富的AI人才团队。这意味着,AutoML技术可广泛用于那些AI人才不足的企业,这或许是传统企业AI转型的突破口!
值得注意的是,此次比赛的冠军团队深兰科技拥有多年的机器学习经验。此前在 PAKDD2019、CVPR 2019 等国际知名比赛中多次取得冠军的优异成绩。
为什么说AutoML技术是“传统企业AI转型的突破口”呢?
众所周知,汽车行业被誉为传统制造业皇冠上的明珠。我们具体以汽车产业为例,近距离地洞察AutoML技术的赋能。
深兰科技是最先将AutoML技术应用在智能驾驶以及整车制造领域的国内AI企业之一。今年6月,深兰科技同其他5家企业正式收到路测牌照,成为首批获得广州市智能网联汽车道路测试资格的企业,其中深兰科技是唯一获得大型客车路测资格的AI企业。其旗下的熊猫智能公交车也将在黄埔区、南沙区、花都区、白云区等四个区域内路测行驶。
深兰科技自诞生就自带AI基因,但是中国汽车行业中的主要玩家们——传统车企,要想入局智能驾驶领域必定面临着诸多挑战。
比如,在智能驾驶状况下,车与车之间必将形成的“车际网”,即汽车之间的“相互沟通”,以相互告知车距、车流、事故、路况等。而这种沟通必定是通过数据实现的。
那么,两辆不同品牌、不同智能驾驶技术的车辆之间,甚至一辆有智能驾驶另一辆没有,其间的数据传输就极有可能遭遇障碍,比如数据格式不一、维度不同、字段不同。
以我们比较熟悉的EXCEL中的数据作为类比,同样是“7月1日”这个时间数据,不同的统计表格显示不同,可能是“7-1”可能是“07.01.2019”,也可能是“July 1st”。如果数据量巨大,那么根本无法通过人眼来一一识别、矫正。EXCEL尚且如此,别提AI了。
如何保证车与车之间的数据沟通能顺利进行?AutoML技术就能很好解决这种问题。
前文提到的深兰科技自研的AutoML系统,不仅能挖掘各规格数据间的复杂关系,还有自动提取高阶特征,进行自动化的数据清洗。这意味着不同车辆之间的不同数据,可以被AutoML系统自动统一。
此外,深兰科技自研的AutoML系统天生的自动化能力,也可以让数据传输的过程、面对复杂场景的数据更加高效;其匿名性则可以保证车主位置数据不被泄露;其泛用性,则可让该技术低门槛、大规模地赋能传统车企。
事实上,谷歌早已将AutoML系统用于智能驾驶。今年1月,Alphabet(谷歌母公司)旗下的子公司、全球自动驾驶领头羊——Waymo,就在成立十周年之际于官方博客重点深度剖析了AutoML技术如何助力智能驾驶。
Waymo称,AutoML技术使其智能驾驶技术针对不同的场景快速优化,高效和连续地提供大量机器学习的解决方案,以将其智能驾驶技术应用到不同的城市和环境中。
可见,不论是国内的深兰科技还是国外的谷歌,AutoML技术已成为智能驾驶领域最为关键技术之一。国内传统车企甚至是造车新势力若想“弯道超车”,必定离不开AutoML技术的赋能。
事实上,AutoML技术的赋能并不局限于汽车行业,它也是国内几乎所有传统行业和中小企业AI转型的切入点之一。
传统行业和中小企业的AI转型,甚至AI整个行业的发展,主要受三个关键因素所桎梏:
第一,人才
第二,数据
第三,算力
而在企业纷纷拥抱数字化,云计算可低价租用的今天,人才正成为最后也是最难的瓶颈。毕竟AI人才培养不可能像企业数字化转型和公有云普及那样迅速,受到教育资源等种种原因的限制,AI人才的稀缺性必定将持续很长时间。
今年4月,加拿大人工智能孵化器公司Element AI发布的《2019年全球AI人才报告》显示,在全球AI人才培养方面,有44%的AI人才的博士学位是在美国获得的,在中国获得的约11%;而在雇佣AI人才方面,46%的AI人才替美国的雇主工作,中国这个数据仅11%。
可见,国内AI人才总量相对匮乏。
更严峻的一个问题是,国内AI人才大多只在科技企业甚至BAT、TMD等大型科技企业间流动,对于传统行业以及中小企业而言,AI人才成本是一个难以迈过的坎,而AI人才常需要团队作战才能发挥才能,更是让这种情况雪上加霜。
这意味着,一方面,至少未来数十年在AI产业化的转型途中,传统行业以及中小企业内部存在着一个巨大的市场。另一方面,通过AI创造全新产品和服务,推动传统行业转型升级,同时也已经成为国家倡导的推动供给侧结构性改革、实现高质量发展的重要着力点,相关的政策早已层出不穷。
所以,不论是市场竞争还是国家政策,AI赋能传统行业以及中小企业,都将是大势所趋。
根据国务院发布的新一代人工智能发展规划,到2030年,中国将实现人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。
而能降低企业用户、开发者以及研究人员使用门槛的AutoML技术,正是切入这一巨大蛋糕的利器。换言之,深兰科技、旷视科技、第四范式等领先的AI企业,有机会利用AutoML技术为国内传统行业以及中小企业赋能。
目前AutoML技术已经广泛应用在精准营销、金融风控、自动驾驶、疾病预测等业务场景中,做出了接近甚至超过数据科学家的模型效果,决策精准度超过人类专家数倍。
以深兰科技为例,深兰科技曾提出,将把AutoML技术作为开发工具,在公司搭建的世界级核心算法平台上推出系统性的解决方案,赋能AI交通、AI医疗、AI工业、AI社区等领域。
据了解,深兰科技的AI产品横跨多个领域,使用场景复杂。AutoML技术可以在海量复杂数据基础上,做到算法的自我更新和自我适应,从而达到AI真正的智能化和个性化。
再如第四范式,目前其已发布AutoML平台可以帮助企业基于历史的数据、业务的实时反馈做迭代,充分挖掘特征做出更精准的决策。今年4月,旷视科技也首次披露了AutoML相关成果...
可以预见在不久的将来,围绕AutoML技术,中外AI企业将展开新一轮技术争霸。
来源:氢媒工厂
雷峰网版权文章,未经授权禁止转载。详情见转载须知。