0
初识苏炜杰,他与许多青年学者一样,外表温文尔雅、略带腼腆,但一谈起学术和 AI 的未来发展,就充满激情。
看他的简历,成长经历一帆风顺:本科就读于富有盛誉的北京大学数学科学学院,接着在美国斯坦福大学攻读博士,师从美国国家科学院院士、麦克阿瑟天才奖得主 Emmanuel Candès 和美国国家科学院和工程院双院院士 Cynthia Dwork。紧接着跳过博士后阶段,执教于培养了埃隆·马斯克和沃伦·巴菲特的沃顿商学院,并联合指导常青藤名校宾夕法尼亚大学在机器学习领域的发展。
他的团队在机器学习优化算法、可信 AI 和高维数据分析等领域做出了许多原创甚至突破性的工作,部分成果已经应用于业界。但苏炜杰谦虚地说,和同一阶段的其他 AI 学者相比,他的论文数量算是少的。而事实是,他「相对较少」的工作已经让他赢得了 NSF Career Award、斯隆研究奖和 SIAM 数据科学青年奖等众多荣誉。能获得其中一个奖项已经堪称领域小牛,而苏炜杰获奖时的工作年限比平均还早两三年。显然,苏炜杰是以「质量取胜」。
他指导过的学生已经或即将执教于北京大学、罗切斯特大学和曼彻斯特大学等名校的计算机系,以及供职于 Google 和 Facebook 等硅谷大厂的研究部门。尽管离博士毕业只有 5 年多时间,但苏炜杰已经向「桃李满天下」的梦想迈进了一大步。
在这些成绩的背后,苏炜杰的研究经历是否一帆风顺?又有哪些故事值得有志于 AI 的学生借鉴?
1、田园的成长经历
尽管没有相关统计数据,但在农村长大的知名 AI 青年学者比例想必是极少的。而苏炜杰就是其中一员。
他谈起农村成长经历的话语中充满着快乐。苏炜杰从小就帮父母干农活,在夏天和秋天播种和收割水稻期间学校会放「农忙假」,这时候摸田螺和抓黄鳝是他的最爱。平时放学回家路上,苏炜杰要路过家里的两亩地,打开水渠给水稻灌溉。小学期间他家没有房子住,全家就暂住在村里废弃了的供销社老房子里。令他感到欣喜的是,这个老房子中间有块空地,他每天回家都能花很多时间种些花花草草。
在农村长大,几乎没有课业压力,苏炜杰有更多与自然亲近的机会。但这无法掩盖物质上匮乏的事实。相比于城区学校,苏炜杰就读的农村小学和初中教学资源要少很多,基础设施比较差。比如,他的初中操场没有400米跑道,体育课练跳远时全校连个皮尺都没有,更没有机会接触计算机,甚至初一开始学英语时都是用汉字注音。因此周围的同学对读书改变命运普遍信心不足、学习兴趣也不大,经济条件较好的同学经常中途转学到城区学校。
现在,苏炜杰曾就读的这两所学校因为农村适龄人口减少等原因,都已经关闭。
还有机会上的匮乏。他没有读过幼儿园,本应该开始读小学时,因为教学资源不足,农村孩子必须晚一年上学,因此后来在高中和大学他一般都比同学年龄大一些。苏炜杰笑着提到还出现过有人以为他是复读生的误会。
在匮乏中的成长经历,让苏炜杰从小认识到生活的艰辛,特别珍视机会,感恩他人的帮助。
苏炜杰所在的农村隶属于宁波地区的余姚市,这是中国经济最发达的县级市之一,有着浓厚的经商创业氛围。特别是在农村,大家觉得得早点做生意赚钱更好,读书是一种性价比很低的人生选择。这也是江浙籍中科院院士自建国初比例持续下降的原因之一。
这些经历,大概率会让苏炜杰走一条不一样的道路。
2、在追求知识中走向「丰富」
改变苏炜杰人生走向的第一个节点是在小学五年级。那一年,他的母亲从村里培养出大专生的邻居那借了两本教科书,一本关于微积分,另一本关于线性代数。在强烈的好奇心趋势下,经过一年时间,他在没有人帮助的情况下读懂了这两本书。之后,初一时父亲带着他去宁波和杭州买了不少高等数学和热力学、量子力学、狭义相对论等物理书。浸润在远超他年龄的知识海洋中,苏炜杰当时真正看懂的不多,但对知识的渴求已经在他心中深深扎根。
诚然,书籍是治愈匮乏最好的疗法。苏炜杰开始经常骑很久的自行车去市图书馆,借阅数学物理天文地理等各种书籍。通过阅读《古今数学思想》和《为了人类心智的荣耀》等数学家传记,苏炜杰为高斯、欧拉、黎曼、庞加莱的事迹而激动,为拉马努金和爱多士等近代数学家的故事而倾倒。有一次,他想买价格200多元的《中国大百科全书》精粹版,等了半年才向父母提出来。那次他把厚厚的一本书放在自行车后座,从新华书店回家,是他印象中最快乐的一次骑行。
知识的丰富,很快带来回报。从未接受过竞赛训练的苏炜杰,初二那年参加初三组数学竞赛获奖,收到城区一所初中的邀请转学。之后高中就读于家乡最好的余姚中学。从此虽然老家一直在农村,但苏炜杰的求学生涯永远告别了田园时光。
更大的回报很快接踵而至。高一第一学期,苏炜杰参加高三数学竞赛,「剑一出鞘」,就获得了省第六名,代表浙江省参加中国数学奥林匹克,这让这个质朴的农村男生兴奋得都不敢相信是真的。之后,苏炜杰去了杭州、福州等地参加培训,这也是他第一次真正意义上走出家乡余姚。跟来自全国各地的优秀同学交流过程中,他感受到了差距,特别是在见识和谈吐方面的不及,让当时的他对自己失去信心。
但最后苏炜杰在决赛中发挥出色,获得银牌,名列浙江省第二名,保送清华大学数理基科班。这是他家乡百万人口县级市第一次有高一学生保送清北,他还因此获得了「宁波市十佳学子」的称号,在家乡引起了轰动。苏炜杰至今在家乡仍有很高的知名度。
高三那年,苏炜杰再次代表浙江省参加中国数学奥林匹克,获得全国第二名,保送北京大学数学科学学院,并进入国家集训队。大多数集训队队员所在高中之前就有学长学姐进过国家队,而苏炜杰是其高中进入数学国家集训队的第一人,至今也是唯一一个。
因此,母校老师对他寄予厚望,希望他能成功进入 IMO 国家队,为余姚中学带来第一块学科竞赛国际金牌。但在集训队的最后两次选拔赛中,苏炜杰发挥不理想,一步之遥与国家队失之交臂。十多年过去了,他还对此略感遗憾,但不是因为个人荣誉的得失,而是因为辜负了高中母校的期望。
参加数学竞赛让这个农村男生获得了不敢想象的丰富机会,尽管也有不少失利,但这更让他珍视机会的来之不易。苏炜杰感到自己很幸运,因为这一路他并没有做任何规划,只是单纯地追随他内心对数学之美的热烈追求。
3、从数学梦到与AI结缘
在北大数院就读的四年时光里,匮乏随之远去,取而代之的是丰富的数学知识海洋。苏炜杰尽情地投入这场盛宴,不敢有一丝懈怠。他基本不玩游戏,每天就是跟在燕园第一周就在一起的女朋友、现在的妻子在图书馆自习中度过。
生活方面,北大给苏炜杰提供了助学金,加上他每年获得的最高奖学金,就可以完全承担学费和生活费。这份恩情他一直记在心里。
身处北大数院,就是与全国最优秀的同龄人共处一个集体。这种感觉是美妙的,有什么问题,跟同学一交流,马上就会豁然开朗,甚至意识到之前没有注意到的问题,而且还会有一点压力,这又会让你更加努力。
北大对苏炜杰的改变是多方面的,对他的思维方式打下深深的烙印。数学的思维是向深处探索的,直面真正有难度的问题,力求揭开事物的本质。苏炜杰日后的科研风格也正是如此,长期专注于若干重要且基本的问题,很少做推广别人的工作。
实现儿时数学梦近在咫尺,但随着大四出国申请季的到来,苏炜杰对未来产生了犹豫和陷入了抉择的困难。数学无与伦比的纯粹、简洁和普适性深深地吸引着他,而申请纯数学博士是成为一名数学家的必要条件,也是实现他数学梦的必经之路。同时,苏炜杰在北大数院的方向也正是基础数学,核心专业课平均分97分,名列年级第一,再加上他在丘成桐大学生数学竞赛的出色成绩,可以让他申请到最好的基础数学博士项目。
但此时的苏炜杰,随着年龄和阅历的增加,有了不一样的思考。
北大是综合性大学,他有机会选修机器学习、计算数学和统计等课程和参加相关讲座,还在林毅夫教授创办的国家发展研究院获得了经济学双学位。这些另一个维度的经历让苏炜杰了解到数学在其他领域的作用,可以帮助解决重要的实际问题。
另一个因素是苏炜杰在大三那年(2010年)暑假得到了在微软亚洲研究院实习的机会, 此时机器学习方兴未艾,在微软亚研,苏炜杰了解到机器学习的前沿方向和应用,产生了浓厚的兴趣。当时大家还不怎么使用 AI 这个词,但回想起来,他对 AI 的初印象确是来自于这段实习经历。这段经历还让苏炜杰结交了很多计算机专业的同龄人,体会到了不同学科之间思考方式的差异。
图注:2010年夏天,苏炜杰(最左)在微软亚洲研究院实习
但让苏炜杰决心走一条不一样的路的最终决定因素是他的成长经历。农村的成长经历,让苏炜杰希望未来事业能跟业界更紧密些, 有机会能改善父母的生活。经过一番思想斗争,最后放弃了纯数学作为个人事业。
苏炜杰后来选择了斯坦福大学统计系继续他的学术梦,就不再是狭义上的数学家。但他未来的学术风格、思考问题的方式以及学术情怀,从来没有离开过数学。
4、成熟于硅谷的 AI 学术风格
怀揣着对未来的憧憬,2011 年苏炜杰飞跃大洋来到硅谷,在斯坦福最高博士生奖学金(Stanford Graduate Fellowship)的支持下开启攻读博士之旅。苏炜杰所在的统计系有二十位不到的教授,但却有近十位是美国国家科学院院士,因此 「院士只是平均水平」。系里的老师普遍在电子工程系、医学院、计算机系、数学系有正式职位,是名副其实的数据科学。
此时的斯坦福和附近的谷歌等公司还处在 AI 即将快速发展的前夜。这种多元和动态完美结合的环境让苏炜杰能深入接触机器学习和数据科学的前沿。
在斯坦福众多顶级学者中,他选择了 Emmanuel Candès 教授作为他的博士导师。Emmanuel 是真正的天才,他曾获得麦克阿瑟天才奖等大奖,研究的内容横跨计算数学、机器学习、统计、信息论、信号处理和优化等众多领域,在很年轻的时候就当选为美国国家科学院院士。2020年,他还与陶哲轩一起获得了当年的「IEEE Jack S. Kilby Signal Processing Medal」(信号处理领域最高荣誉)。
2014年,苏炜杰在微软研究院硅谷分部实习,导师是美国国家科学院和工程院双院院士 Cynthia Dwork。她是一位初见就觉得是「我的朋友」的老太太,早年在密码学和分布式计算做出了奠基性的工作,开启了工作量证明这个研究方向,为后来的区块链奠定了部分理论基础。近几年 Cynthia 领导了可信 AI(特别是隐私数据保护和算法公平性)这个朝气蓬勃的领域,苏炜杰也在她的指导下进入了这个领域。从此,她一直给予苏炜杰学术上的指导和支持,是他实际意义上的导师。同时,Cynthia 还是早期的一代女性计算机科学家,早年作为女性学习计算机需要克服诸多困难,苏炜杰联系到自身从农村走来也多有坎坷,因此很有共鸣。
图注:Cynthia Dwork
这两位教授领域不同,但有相似的学术观点,共同塑造了苏炜杰今天的学术风格。这并不是说苏炜杰从 Emmanuel 和 Cynthia 处学到很多具体知识点,坦率地讲,作为北大数院的顶尖毕业生,他的知识储备在本科基本已经完成。但学术远远不止于知识的积累,更重要的是学术风格的建立,理解什么是好的学术。
首先,以解决问题为导向,而不因学科限制自己。Emmanuel当年与陶哲轩一起发明压缩感知(Compressed Sensing)的时候,就是为了加速磁共振成像这个实际问题。这个工作兼具数学之美与实际之美,是非常罕见的。而在研究的过程中,他用到了信号处理、信息论、优化和统计等多个学科的思想和方法。Cynthia 早年的领域是理论计算机,但近些年在开启隐私数据保护和算法公平性这些领域的时候深入引进了统计技术和社会学思想。
另一个很重要的一点是持久地做自己认为重要的课题。Emmanuel 告诉苏炜杰,他基本不看 arXiv 上最新的论文,而是做自己认为重要的问题,且不轻易因为外界的声音改变。如果过于紧跟潮流,总是在模仿,很容易迷失在浩如烟海的论文海洋之中,研究的内容很难有自己的特色,且无法产生深远的影响力。Cynthia 十多年前刚开启隐私数据保护这个领域时,领域内对此有不同声音,但经过十多年的持续耕耘,现在已经在业界广泛应用。
此外,要重质量而不是数量。苏炜杰回忆,Emmanuel 好几次跟他说自己不应该写某些论文,希望从简历里删掉。当时苏炜杰还挺惊讶,因为这些论文的引用量也有数百。独立工作后他才明白,现在学术圈的问题是论文太多,但真正高质量的论文比例却不高。Emmanuel 告诫他,一篇论文好不好,要看5年甚至10年以后是否还有参考价值。
这些言传身教让苏炜杰受益匪浅,体现在他做科研也不局限于某个具体学科,经常横跨机器学习、优化和统计等多个领域,以及习惯于持续地研究问题,注重「种树」而非「摘果」。「种树」的成功率固然不高,但这类工作一旦成功,往往能给本领域提供新的问题和机会。
因为带学生有压力,他也有一些纯粹只是为了发表而发表的论文,但他每年要求自己至少写一篇「5年以后还有人读」的论文。现在苏炜杰有40余篇论文,但他坦然说只有3、4篇是他真正喜欢的,具有长期价值。也正是这少量的几篇高质量论文,让苏炜杰赢得了众多荣誉,其成果已经在包括宾大、MIT、UC Berkeley、斯坦福、普林斯顿、耶鲁、北大、UCSD、UIUC等众多大学的数据科学和机器学习课程中讲授。有朋友跟他说:「未来可以写进教科书。」
除了学术,两位导师在生活上对苏炜杰也很关心。Emmanuel 有着法国学者常见的高冷气质,但内心却很关心学生,每学期都会邀请学生去他家参加派对,有一次得知苏炜杰遇到经济困难后曾提出经济上的帮助。Cynthia 则经常问苏炜杰工作开不开心,2017年她入职哈佛大学后,曾提到如果苏炜杰想来「波士顿的那两个学校」,随时跟她说。
5、丰收篇
2016年,苏炜杰博士毕业,论文获得了首届「斯坦福 Theodore Anderson 奖」。在 Emmanuel 和 Cynthia 两位导师的推荐下,入职常青藤名校宾夕法尼亚大学,开始了在东海岸的独立工作。
图注:苏炜杰和他妻子与Emmanuel Candes的合影
怀揣着对 AI 的热情,以及深厚的数学情怀,苏炜杰开始迎来学术上的丰收。
苏炜杰的一个主要课题是揭开深度学习背后的机制,理解为什么深度神经网络有时候效果好、有时候不好。或许是因为数学背景出身,他除了重视提升效果,也强调「知其然,也要知其所以然」。
他对 AI 科技评论谈道:
有人说深度学习是「炼金术」。这对于人脸识别、下围棋甚至蛋白质折叠等也许没有特别大的影响,但对于高风险的 AI 应用却是至关重要的。最近 DeepMind 将深度强化学习应用到核聚变,结果令人兴奋,但在没有完全理解深度学习的机制之前,即使成功率达到99.99%,我们能承受最后变成一颗小型氢弹的0.01%的可能性吗?
这是一个重要且非常活跃的科研领域,但还没有一个理论获得学界广泛认可。经过多年思考,苏炜杰和他团队提出了一个深度神经网络的「局域弹性」(local elasticity)理论,给神经网络泛化、优化等性质提供了一个简单的唯象理论。
这个理论可以用一个很简单的例子来介绍:神经网络看到一张波斯猫的图片后更新了其参数,然后我们观察神经网络更新后在另一张图片上预测的改变。实验发现,改变的大小取决于新图片跟波斯猫的相似度:变化在暹罗猫上最大,在老虎上其次,在汽车上最小。形象地说,深度神经网络像橡皮泥一样有局部的弹性。
直觉上,苏炜杰相信这个唯象理论是通向最终理论的必经之路,但现在还不完善,还需要大量后续工作来深入研究。
相关论文:
The Local Elasticity of Neural Networks
Neurashed: A Phenomenological Model for Imitating Deep Learning Training
苏炜杰认为数学理论还可以指导实际的 AI 问题。「There is Nothing More Practical Than A Good Theory」,一个好的理论价值的最直接体现在于能不能指导实际,节约人力物力。流体力学和空气动力学就是一个很好的例子,现在可以用仿真来替代真实的风洞试验。但 AI 领域很多方向还需要耗费巨大的人力物力来收集数据和训练模型,比如最近很热门的预训练大模型;另一个例子是自动驾驶,现在离实际的落地应用还有很长一段距离,需要逐个解决无数个"黑天鹅问题"。
学界在这个方向上的工作都还很初步,但苏炜杰团队最近的一个工作算是迈了一小步。这个工作发表在《美国国家科学院院刊》(PNAS),对深度神经网络进行了极大的简化,着重分析了特征与后继层参数在网络训练中的相互作用。
论文地址:https://www.pnas.org/doi/epdf/10.1073/pnas.2103091118
运用这个框架,苏炜杰发现了深度神经网络在训练数据不平衡时表现可能会非常差,特别是对数据量不够的类别,其预测能力会非常随机。这个发现完全是理论预测的,但通过实验完美地确认有这个现象,然后针对性地提出了解决方案。这个工作说明,在一定程度上,数学是可以指导深度学习的实际应用的,但像这样的工作目前在深度学习的研究中还是非常少见的。雷峰网
此外,数学对 AI 知识的梳理和传承也是有很大作用的。恩格斯曾说过:「任何一门科学的真正完善在于数学工具的广泛应用」。这句话或许稍有片面,但也可以看出数学对一个学科发展的重要性。为什么埃及金字塔、玛雅历法、以及中国古代的很多技术会失传?本质上是因为这些知识当时没有被「数学化」,其传承需要师徒手把手面对面教授继承。相反,我们现在还可以很好地理解两千年前的《几何原本》,因为一个知识体系在被数学化后就是精准的,其传承就可以超越时空。
但 AI 领域的许多知识目前处于一个「炼金术」的状态,知识是由大量的试错、经验总结起来的,缺乏体系,不完整,也存在相互矛盾的现象,这会造成年轻的学生很难掌握如此繁琐的 AI 知识和经验,很有可能再过几十年这些花费巨大资源获取的知识会被遗忘。
苏炜杰有一个工作对一类 AI 领域的现象作了梳理和简化。添加动量(momentum)是优化机器学习模型时常用的一个技巧,Hinton的一个重要工作指出添加动量可以显著地加快优化深度神经网络,目前也有很多解释的工作,但大家还是觉得这个现象很神秘。通过和美国国家工程院院士 Stephen Boyd 、以及导师 Emmanuel 合作,苏炜杰的一个工作指出可以用动力系统的连续观点很直观地解释复杂的加速现象。
论文地址:https://jmlr.org/papers/volume17/15-084/15-084.pdf
这个工作因为明显的几何直观性,在机器学习、优化和控制论等多个领域都有很大影响力,众多学者用这个方法设计新的加速算法,并做了大量推广工作。这其中就包括机器学习泰斗 Michael Jordan 和著名机器学习学者 Peter Bartlett。Michael Jordan 教授在 2018 年里约国际数学家大会的 1 小时报告中,以大篇幅介绍了这个工作。
图注:Michael Jordan在2018年国际数学家大会1小时报告上详细介绍苏炜杰的工作
苏炜杰参加 NeurIPS 等机器学习会议时,经常碰到不认识的人看到他胸前的名牌后问「Are you the Su of the Su, Boyd, Candès?」雷峰网(公众号:雷峰网)
苏炜杰本科期间曾选修过经济学双学位,经济学的思想体现在他近期一个旨在提高论文同行评议质量的工作。在这个工作中,苏炜杰把对于预测精度的追求和效用函数的最大化分离,因此在更广的意义上可以将博弈论的观点有机地引进到很多机器学习的问题。这个框架与Michael Jordan近几年倡导的「ML + Economics」不谋而合。苏炜杰对推广这个框架充满信心,欢迎感兴趣的学者和学生联系他。
相关论文:
You Are the Best Reviewer of Your Own Papers: An Owner-Assisted Scoring Mechanism
6、隐私数据保护
苏炜杰进入隐私数据保护领域的引路人是 Cynthia Dwork。这个领域是数据科学和机器学习的结合点,具有很多优美的性质。
数据隐私的重要性在于,在这个大数据时代,如何妥善获取和使用与真人相关的数据,渐渐成为亟需解决的问题。没有人愿意生个病、上个网、买件衣服都会被人随意知晓,更别提手机里没有修过的自拍了。在数据日益成为AI核心组成部分的今天,保护数据隐私的重要性是基建性的。
可能有种错觉是相比于中国用户,欧美用户更注重隐私,但这其实是不对的。苏炜杰曾和 Cynthia 讨论过这个问题,Cynthia 的观点是隐私的重要性是独立于文化的。几年前国内某 IT 大佬曾公开宣称中国用户不太注重数据隐私,第二天就导致其公司股票大降。随着我国公民意识个人权益的不断增强,数据隐私保护的重要性会越来越高。
差分隐私由 Cynthia 和合作者于 2006 年提出。除了差分隐私,现在隐私数据保护有安全多方计算、同态加密、联邦学习等技术。联邦学习是从「物理」上形式地保护了隐私,让数据实现在本地计算,从而让「散户心理上舒服」,但一般并不能在完全绝对意义上保护隐私,还需要和差分隐私结合。而差分隐私无论是理论还是实际应用,都是现在最成熟的的技术。硅谷众多的旗舰大厂都已经使用差分隐私多年,Apple 的 iCloud 也用到了这项技术,2020 年美国人口统计也大规模地使用了差分隐私。
简单地说,差分隐私要求数据集的单个用户的改变基本不影响算法输出,从而严格保护每一个用户的隐私。为了实现保护,需要给算法添加噪音,噪音加的越大,隐私就越安全,但是随之性能也会越差。在有限的隐私预算下,很多时候隐私算法的性能表现会不如人意。
关于这个问题,苏炜杰曾跟学术圈研究隐私的人交流,他们一般认为隐私保护是第一位的;但工业界的从业人员认为算法的性能与隐私保护一样重要,两者需要取舍。苏炜杰学经济学时常听到「everything has a price」(每一个物品都有一个价格),隐私也是。因此如果为了保护隐私而导致算法效率大幅下降,那么是不可取的。
在保证隐私的前提下,为了提高算法精度,苏炜杰和合作者提出的高斯差分隐私。
相关工作:
Gaussian Differential Privacy
Deep Learning with Gaussian Differential Privacy
这个工作的核心是从假设检验的角度来精准地刻画隐私程度,从理论上严格证明了这个新框架具有多个最优性质。苏炜杰的团队还把高斯差分隐私应用到深度神经网络的训练,在同等隐私保护程度的条件下取得了比 Google Brain 更高的预测精度。
这个新的隐私数据分析框架已经纳入TensorFlow,最近也受到了 Facebook(Meta)的关注。他的团队已经跟 Meta 合作,希望能将高斯差分隐私部署到他们的广告推荐系统中。这个工作既有理论上的优美保证,又能应用到实际提高机器学习算法的效率,对此苏炜杰感到非常兴奋的。
7、生活感悟
苏炜杰在 AI 学术上的探索历程,是一个寒门子弟从早期匮乏逐渐走向「丰富」的成功例子。但这背后也需要他克服更多的困难。
比如,博士第三年,苏炜杰和妻子突然迎来了他们的第一个孩子,而他妻子不久前辞去了在国内本很有发展前景的工作。随之而来的经济压力和科研时间的极大缩短,让苏炜杰只能迎头而上。
图注:苏炜杰与他的大儿子
这段时间是苏炜杰人生中最努力的时候,既要兼顾学术与家庭,又要解决物质与精神压力,就只能白天照顾小孩、晚上熬夜搞学术。当时脑海里就只剩下两个字:努力。幸运的是,他坚持下来了,做出了让 Emmanuel 和 Cynthia 非常欣赏的工作。
回想起那段时间,苏炜杰还有一种「一步走错则满盘皆输」的后怕感。那时他的学术刚刚起步,如果在压力下,做不出成果,就不可能找到好的教职工作,那之前一路坚守的学术梦想就没有意义了。
为了承担生育与抚养小孩的费用,以及支付她妻子读硕士的学费,苏炜杰还通过做额外的助教来减轻经济负担。但即便如此,博士毕业时他的银行存款已经是零,信用卡还透支了一万五千美元。临近毕业时导师建议他去做一年博士后,这对建立人脉和拓展研究方向都有帮助,但因为迫切需要一份正式工作的收入,苏炜杰没有考虑。雷峰网
基于这段经历,苏炜杰有一些对寒门子弟人生规划的建议。如果有志于学术,但来自农村或家庭经济一般,可能选择跟业界联系紧密、就业相对容易的领域是个明智的选择。除了个别领域,绝大多数领域的博士超过半数是无法在学术圈找到工作的,最终还是会在业界就业。而家庭经济一般,往往很难承受学术工作找不到、业界工作也不匹配的风险。
对于计划在业界就业的同学,苏炜杰的建议是择业时更要多地考虑这个方向是不是在上升期,因为处于上升期的领域更看重个人能力和拼搏精神,对社会关系的要求较低。从这个角度看,如果家庭经济一般的同学有机会从事AI方面的工作,是一个很好的选择。本科报专业的时候可以多考虑计算机、数学、统计与数据科学、电气工程等方向。黄国平博士是一个很好的成功例子,苏炜杰读过他的故事,深有共鸣。
8、展望
苏炜杰怀着儿时就有的数学情怀,做出了兼具理论优美和实际价值的工作。这在日益壮大的青年 AI 学者群体中是很少见的。对于有志研究 AI 的同学,苏炜杰建议可以多选一些数学基础课程。此外,在「AI+Science」这个趋势的背景下,也可以学一些生物、物理、化学等课程,增加知识维度。
苏炜杰在可信 AI、优化、统计与数据科学、深度学习等多个领域都有原创性贡献,这每一个标签加上他身上也都恰如其分。但苏炜杰并不喜欢被标签限制住,在 AI 被数据驱动的浪潮中,不同的领域其实是在解决同一类问题,只不过在前后端的侧重点有所不同。这些本应该在一起的领域由于历史的原因被不同的期刊、会议、基金项目和院系所分割。
他特别欣赏斯坦福和 MIT 这两所大学的模式。斯坦福通过正式的双聘制度让不同的学科交叉,而 MIT通过建立林肯实验室、媒体实验室等部门的方式打破学科壁垒,以解决具体实际问题为导向,这将是趋势,苏炜杰提到。
最后他对 AI 科技评论说道:
在这个激动人心的变革时代,每一位 AI 学者都在做同样一件事情。这件事就是 2018 年 Michael Jordan 和张亚勤在乌镇见面时说的同一句话:「我只是做数据分析的」。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。