0
6月24日下午,钛媒体和杉数科技主办的2017 AI 大师论坛在京举行,论坛邀请了五位算法优化、机器学习领域的顶尖教授、学者出席并发表学术演讲,他们分别是斯坦福大学李国鼎工程讲座教授叶荫宇,佐治亚理工学院终身教授蓝光辉,纽约大学助理教授、Michael I.Jordan 的高徒陈溪,清华大学交叉信息研究院助理教授李建以及杉数科技 CTO、明尼苏达大学助理教授王子卓。
论坛上,五位科学家围绕算法、数据、应用,结合各自的研究领域,畅谈了现状和未来的发展。
* 叶荫宇
叶荫宇教授是斯坦福大学李国鼎工程讲座教授(K. T. Li Chair Professor),其研究领域为连续和离散优化、数据科学和应用、大规模算法设计和分析、计算博弈论/市场平衡,动态资源分配和随机和鲁棒决策等,他也是优化领域基石算法之一——内点算法的奠基人之一。
因贡献突出,他曾获得美国运筹与管理学会冯·诺依曼理论奖,也是迄今为止唯一获得此奖的华人学者,也曾主持、参与美国波音、FICO、运通、美国卫生部、美国科学基金、美国能源部,以及美国空军科研部门等多个科研项目。此外,在工业界,叶教授也多有涉猎,担任优化软件公司 MOSEK 科技顾问委员会主席、杉数科技的首席科学顾问,同时也参与中国国家电网调度,华为、京东商城收益管理、无人仓等项目。
在论坛上,叶荫宇教授以“优化算法的思想及应用”为题做了演讲。他早在1982年去美国斯坦福读书、工作期间,就经历了一次 AI 的火爆和降温,从最红到无人问津,和现在的火爆有些相似,因此他认为,AI 几起几落,但“优化”始终如同不动点,各行各业都需要。
针对 AI 在大数据时代的商业决策,需要通过机器学习大量的数据,然后进行建模、决策。但决策过程,或许会用到一些很传统的优化模型和运筹学模型。反过来,AI 也对算法优化领域提供了一条新的思路:
以前我认为要搞出个万能的算法,解所有的线性规划都能解得快,但是后来反观 AI 研究者的思维并非这样,它是非常定制的,什么方法对某一类问题用的好就用那个方法,不追求某一个统一的算法,或者类别法。所以这点上,AI 对我们的思维有所改变。
* 蓝光辉
蓝光辉教授为佐治亚理工学院博士、佐治亚理工学院终身教授,他目前还担任计算优化和应用(2014年至今)、优化算法顶级期刊 Mathematical Programming(数学规划,2016年至今)杂志的副主编,是国际上机器学习和深度学习算法方向的顶级专家。蓝光辉教授的主要研究领域为:随机优化和非线性规划的理论、算法和应用,包括随机梯度下降和加速随机梯度下降,用于解决随机凸和非凸优化问题。
在论坛上,蓝光辉教授以“凸优化,机器学习及深度学习”为题做了演讲。在回顾了凸优化的历史之后,蓝教授讲解了优化和机器学习之间的关系。他认为,机器学习的本质,就是要建立模型、描述数据,输入和输出,模型和算法结合的部位那就是优化,用优化来解模型。
此外,他还介绍了优化的“黑匣子”:
除了机器学习用起来做预测以外,最重要是要做决策。建立模型再做决策,涉及到优化的系统集成,不管是在机器学习过程中还是在决策过程中,都需要用到优化模型或者算法,那么有没有一个工具,或者黑匣子能够解决这个问题,有,我们叫做求解器。
有了求解器可以帮助企业解决很多的问题,比如用在做前端数据分析和寻找规律,比如用来做局测问题,然后再用于经济、金融、军事、工业工程、管理、互联网领域的应用。根据问题的规模和问题的难度,求解精度的要求,可以设计不同类型的求解器,比如说中等规模的求解器,1000个到1000个变量或约束。更大规模的求解器你需要解10的9次方的这个变量或者6次方的变量,规模非常大,然后可能我们需要有不同的这个特定方法求解,加速算法、随机梯度算法、坐标梯度下降用来求解更大规模的问题。
顶级的机器学习求解器,第一个是H20,它发布最早,也是影响力最大的机器学习开源软件之一,重要的客户有思科、paypal、ebay;第二个是 TensorFlow,是谷歌全力开发并推的深度学习计算引擎,也可用通用的机器学习求解器,是 Github 排名第一的世界顶级开源项目,在语音识别、图像识别、机器翻译等AI领域随处可见,重要客户英特尔、高通、Airbnb等。
雷锋网了解到,杉数科技也自主开发了一个求解器,和 TensorFlow进行对比,在9个公开数据集上对两种求解器进行测试,比 TensorFlow 快了10倍-70倍。后续,雷锋网还将持续关注该求解器的详细消息。
* 陈溪
陈溪博士目前是纽约大学商学院助理教授,CMU机器学习系博士,也曾跟随 Michael I Jordan 做了为期一年多的博士后研究。同时,陈溪博士拿过 Google Faculty Research Award,在2017年还获得了福布斯杂志全美 30 under 30 最有影响力的青年科学家称号。陈溪博士的主要研究领域为:机器学习、高维统计和运筹学。
在论坛上,陈溪博士以“从学习到决策”为主题的演讲。陈溪博士最早就读于CMU的商学院,一年后转向机器学习的研究,并将机器学习的技术应用于商学院的传统问题中,尝试进行解决,在跟随 Michael I Jordan 做完博士后研究后,他进入纽约大学商学院,继续利用机器学习的技术和方法解决商学院关心的问题。他认为:
做大规模的统计推断,和运筹运营的管理,看似不相关,但其实非常有联系。最根本的联系是这些学科都是用数据驱动的,并且最后都是要为数据服务的,挖掘数据核心的价值。我认为这三个领域结合起来才能对数据有更深更好的理解,并且做出有效的决策。
此外,陈溪博士还认为,真正商业的问题是极其复杂复杂的,光有机器学习是不够的,要把机器学习和科学、统计结合起来,才会有新的数据产生。机器学习这几年的发展,有图像处理、文本处理的,通过数据可以得到更好的表现,这大大推动了机器学习的算法发展。但商业上,大规模的公开数据集还是非常少的,以后会有更多的这样的数据集,更多研究人员进入这个领域,这样我们就可以得到更多的知识,这样可以推动商业化下的机器学习或者说决策技术的发展。
* 李建
李建在美国马里兰大学取得博士学位,目前任职清华大学,是清华大学交叉信息研究院的助理教授。李建博士是 VLDB 2009 和 ESA 2010 最佳论文奖获得者,也是清华211基础研究青年人才支持计划以及教育部新世纪人才支持计划青年学者,他的主要研究方向为:算法设计与分析、机器学习与深度学习、随机优化与组合优化。
在论坛上,李建博士以“深度学习预测算法的思想及应用”为题做了演讲。在演讲中他讲道:
深度学习在图像识别、语音识别这些领域,都取得了比较成功的进展,也有很成功的商业化模式,但在时空大数据方面的研究,只是刚刚起步,还没有非常成熟的一套方法论。
李建博士认为,深度学习在时空大数据领域,有非常广阔的应用前景,例如网约车订单预测、出行时间的预测、商店选址等问题。
时空大数据的特点是有很多类型的数据,要解决一个可以用到方方面面的问题,比如说预测,网约车的订单供需量的应用,数据的类型包含GPS、订单数据、天气数据、路况数据等等,这跟原来深度学习所处理的问题不一样,做图像识别只需要图像就够了,做语音识别只需要语音就够了,现在有各种各样的数据,这些数据都是不同质的,需要组合起来,才能来进行学习和预测。
* 王子卓
王子卓博士19岁从清华毕业,24岁就拿到了斯坦福的博士学位,目前执教于明尼苏达大学,还担任杉数科技的 CTO 。他为 IBM 定制的定价策略系统获得两项美国专利,并且自上线以来,已为 IBM 创造过亿美元的利润,另外此项目也被美国运筹管理学会收益管理分会提名为 2015 年最佳实际应用奖。他的研究领域主要为:收益管理与运营管理、定价问题,优化算法设计。
在论坛中,王子卓博士以“数据驱动的定价策略系统详解”为题做了演讲。在演讲中,他认为,在比较广泛的意义上来说,一个好的定价策略,需要在正确的时间,正确的地点,以正确的价格,把正确的服务和商品卖给正确的消费者。这里包含很多需要做决策的地方,当然价格是其中的最的一部分,这对企业来说,是非常重要的。
在行业里,哪个企业能够利用有限的资源获得更大的收益,就很可能决定这个企业在行业当中能否脱颖而出,能否获得成功,而定价策略可谓是很多公司的“生命线”。这里有很多新的机遇,有很多的挑战,通过数据驱动的方法,利用机器学习、人工智能技术、运筹学的技术,就能来帮助新公司在新的时代更好的迎接挑战。
记者:工业界相对学术界来说,有更多的资源优势,美国高校如何应对学术人才流失的挑战?
陈溪:美国高校提供更灵活的制度,以前不允许教授到企业,而现在允许在学校工作3天,企业工作2天,像文本分析确实企业做的比学校好,学校会回归到更加基础的研究,更多理解深度学习为什么取得这么好的效果,有哪些局限性,根据我们理解,会开发出新的算法,以后有更加需要创新的,更加基础的东西会在学校里完成,而大规模的应用企业会推出。
记者:怎么看国内运筹学这一块人才紧缺这个事?
叶荫宇:我觉得不是人才紧缺的问题,而是导向的问题。我个人认为,中国学生学理工科都是很强的,但是,他们也是永远追那个最时髦的,我觉得这个风气要改一改。就像刚才讲的说不定,过几年 AI 就不那么火,所以我觉得学生还是要把基础打好,我非常赞成这个教育,进去不要就是搞 AI,或者搞机器学习,搞搞OR,搞搞统计(也可以)。
另外,理工科变得愈来愈受欢迎,这不仅在中国,在美国也是这样。我们斯坦福大学,原来大部分本科生都在文理学院,而现在也都转到工科学院,我觉得学文理学生去接触一些理工科的知识,也没有什么障碍。其实无非就是一些 1+1=2 这些简单的术语就可以了。我记得我们斯坦福商学院的院长,也叫他们 MBA 的这个学生去听机器学习的课。
蓝光辉:在我们学校(佐治亚理工学院)其实主体部分是运筹学,包括优化、学习过程、统计等等,我们那个系排名第一,我们整个学校 10% 的学生在我们系,在美国找工作非常好找,一般本科生毕业之后会有4-5个 offer ,我们需要创造这样的一个机会在国内,让大家知道这个是有很大的需求。
记者:人工智能三起两落,是不是又会带来人才的流动,任何产业的变化一定是基于人才的流动,怎么看这个趋势?以及国内产学研的结合,会不会对人才有新的要求?
李建:人才是一个很基础又很复杂的问题,比如说 AI 这一波火了,像我是在负责我们院的招生工作,明显的感觉到一半多以上的学生都想学 AI、机器学习,但其实其他学科的也都非常的重要,报名的学生马上就变少。
我觉得学生也是被媒体影响,比例有点趋高,并不是它有所突破这个比例应该增加,我的感觉是增加过多了,很多重要的方向就非常缺乏学生,但这些方向也非常重要。
学生面试的时候,我们会给他说这个方向非常非常的重要,大家都往这个方向来,我们做了很多开导的工作,重新疏导,虽然媒体没有人报道,但是你学这个,以后也有可能非常成熟。媒体铺天盖地的宣传,都想搞 AI,但是我们做的事情也都在做,至少对于我来说,即便跟我学深度学习、学AI,还是会让他学优化、学统计,把基础打扎实。我们有一个术语叫炼丹,其实我们在炼丹,不确定性很大。我们希望学生,把基础打好,从上到下,从理论到实际,都可以全面的应对。
记者:未来 AI 的发展趋势如何?
王子卓:这个其实是很难预测的,随着科学技术的发展,实际上更多不是线性的往上去,而是一个爆发性的,可能某个点就有一个突然的进度,而这个进度之后,有些人就会跟着潮流解决相关的问题,解决完了之后又会停留在某个阶段。
虽然这个事情很难预测,但企业需要提高效率的这个事情是永远都需要的,这里面应该用什么方法提高效率,AI 的领先技术肯定是一种,我们现有的方式帮助他们提升。
叶荫宇:我个人认为,AI 肯定会发展,至于还叫不叫 AI 我就不知道了。大家仔细想一想,其实 AI 要解决的问题,以前不叫 AI ,或者说叫 OR 要解决的问题,统计要解决的问题,或者说计算机要解决的问题,关键还是要服务于人类,提高效率,减少风险,而且应用大量的数学或者量化的工具,这个趋势是会越来越强的,在这点上,我说AI永远不会死,因为它和统计、运筹学都一样的,但是它会不会以另外一个名词来出现,我觉得这个也是有可能的。
另外,我觉得中国的媒体或者所有的媒体都不需要局限于,这个叫 AI 还是不叫 AI,关键是它确实是用到了基于科学的决策上。反过来说在美国,我们刚刚开过一个会没有多少人提 AI,国外根本还没有 AI 这种专业,我们的专业还是数学、物理、统计、优化,在我们计算机系,学生一样要学很多课程。所以在这点上,我觉得容易把一个名称去炒的很火热,以它来画线,好像非 AI不 可。
蓝光辉:我补充一点,我觉得还是需要一些本质的思考,因为在历史上,也是因为某一项技术,或者知名度,过于把期望值提高,导致它解决所有的问题都非常迫切。从研究角度来说,那只是一个名字而已,真正秉承的还是一些数据的办法、建模,不要去叫 AI 或者说不叫 AI 。
为什么在中国AI这么火,我觉得可能在某种意义上我们民族的浪漫主义,我们想到 AI。什么都可以做,有这样的感觉,我们小的时候看的动画片,都有这种民族的情怀,而很多的老美更加的实际一些。
雷锋网后续还将奉上此次演讲的全文整理以及对蓝光辉教授、陈溪博士的专访文章,敬请关注。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。