0
本文作者: 杨晓凡 | 2019-07-19 10:24 | 专题:CCF-GAIR 2019 |
雷锋网按:7月12日-7月14日,2019 第四届全球人工智能与机器人峰会(CCF-GAIR 2019)于深圳正式召开。峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,深圳市人工智能与机器人研究院协办,得到了深圳市政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流博览盛会,旨在打造国内人工智能领域极具实力的跨界交流合作平台。
7 月 12 日上午,「人工智能前沿」专场在主会议厅举行。中国工程院院士、IEEE Fellow、香港中文大学(深圳)校长徐扬生任专场主持人。
徐扬生:今天上午有 4 个报告,第一位报告嘉宾是 James J.Heckman,他是 2000 年诺贝尔经济学奖获得者,是来自美国芝加哥大学的经济学教授。他在经济学方面非常著名,他主要是致力于帮助我们研究并且理解人类与社会方面的一些现象,以及了解如何打造未来所需的各项技能,并适应劳动力市场。James J.Heckman 教授除了获得了2000年的诺贝尔经济学奖,他还获得过其它的众多奖项,在科研领域、人工智能领域等等其它前沿科技领域都获得了非常多的奖项,今天他将会和我们介绍技术是如何助力儿童在早期的认知发展和一些衡量标准,欢迎 James J.Heckman 教授。
James J.Heckman:
非常感谢大家给我这个机会能够让我参加此次会议,虽然说我并不是最最厉害的人,但是我也想给大家分享一些内容。
今天我想给大家介绍的,是从一个生命周期的角度来看一下我们应该如何进一步积累以及增长我们的技能,我还会简单地介绍一下计量经济学在国际以及中国的发展。今天我为什么来到这里讲这些内容呢?因为我觉得那些成功的人之所以会成功,他们的技能包里一定是有一些共性所在的,比如说他们的成长路径,他们从幼儿成长为一个成年人是如何进行学习的,以及他们与世界的互动方式是怎样的,哪一种类型的互动方式是最为有效的。这些都是我们需要去关注的内容。我知道在座的各位有些是从事科研的,我想要强调的是,在互动当中如何去量化、如何去制定一个衡量标准。这是我今天要讲解的重点。
大家都知道中国的发展速度非常快,特别是在过去40年当中,它的发展速度是非常快的。为什么发展得那么快?大家都知道有一个重要的历史事件,就是中国制定了一个非常聪明的发展策略,引导民众注重学前教育。所以中国有大量的具备中等技能的劳动力。
我们也知道,尽管有这么快的发展速度,还是有很多欠缺的地方,比如说如何让劳动力的技能增长跟上中国的发展速度。我们来比较一下中国在 2000 年和 2016 年的人口情况,图中蓝色是女性,红色是男性。右边这个图表显示我们在劳动力技能的增长当中遇到了非常多的挑战,中国的老龄化程度正在不断地增加,未来会缺少大量的、中等年龄的劳动力。
今天我来到这里演讲的目的并不是来提一些批判性的意见,而是希望提一些有建设性的建议。因此我们需要了解如何打造这些技能,它的路径是怎样的,以及如何进行操作,这样才能帮助整个国家更好地在转型的过程当中做出更多的贡献。
中国还有大量的固定资产投资。有人认为中国的固定资产投资太多了,我不认为有证据证明它“太多了”。实际上,经济发展需要的并不仅仅是机器、机械化,还需要让人类在其中发挥更重要的作用,就需要科技对人文做出一些关怀。
中国城市和农村之间的人均收入差距很大,城市大约是农村的 2.5 倍以上;教育也很悬殊,高等教育的差距随着教育阶段增加而迅速扩大。
这带来了很大问题,农村留守儿童的教育程度要明显低于城市地区,他们的生活环境也和城市地区大有不同。我们再看看现在的儿童的教育背景,留守儿童的教育是受到很大影响的,他们主要是祖父母在带的,由于他们的祖父母没有受过多少教育,因此对他们的教育也不是很重视。比如说在广东,有很多孩子是在农村地区的,他们在教育方面是很落后的。在 2010 年的一项研究中,农村留守儿童的语文和数学测试成绩都要显著低于城市儿童。
这里有一张儿童在不同年龄的平均成绩的图表。从图里我们可以知道两件事,一个显著受到母亲教育程度的影响,母亲是本科毕业生的儿童成绩最好,母亲不到高中学历的儿童成绩最糟糕。留守儿童目前的教育问题很严重就归因于这一点。另外一个要素是儿童在家境比较好和家境不太好的家庭之间产生了差距,在3岁之前,我们可以看到两种家庭的差距很大,儿童的家境对他的发展起到很大的作用。
一个人需要具备的技能是多种多样的。在现代社会当中想要成功,需要很好的认知、非认知技能,需要情商、社交技能、好的个性和品味。这其中也包括了解决实际问题的能力。大家常提起的 IQ 仅仅是认知技能,而我们把以上这所有技能表示为 θt 。
我们逐渐地了解怎么样去衡量一个人的这些能力,更好地去理解需要哪些能力。不仅仅是聚焦于孩子的智商或者成绩,我们更多的关注于孩子综合的能力,包括认知能力和其它的社交和情商方面的能力,包括父母的认知水平、受教育程度等等,都会产生影响。一个人具备的技能在不同的状况中是稳定的,但是也会随着时间而不段增进。
我们进一步挖掘,有更重要的理解:一小组最核心的技能 θt 的水平高低决定了而儿童们在长大后的成功程度,不仅仅是职业的成功,还有他们的健康管理、他们自己的幸福指数等等,这都和他们所掌握的综合技能是正相关的。
这里是一个动态的发展历程,这里有相应的公式:后一年的技能水平,由前一年的技能水平(包括自我生产力和交互作用)、广义投资(包括父母和环境)和父母的技能水平决定。这些能力是通过动态的方式来形成的。因此在技能方面要尽早投入和投资,这些技能对这个孩子在将来人生的发展当中的历程起到至关重要的作用。
在这个过程当中,年龄越早,受到的影响越大。当然在孩子后期的发展当中也会产生一些影响,但是我们实际的发现是,在这样的一个补充作用当中,能够尽早地投资孩子的早期教育,它的产出成效越大。不同的早期技能的培养也会促进更多后来的技能的培养。
还有一点非常重要的是帮助我们更好地理解他的能力形成,也就是整个能力的形成是一个动态的过程,这样一个生产力的提升和能力的提升,是一个逐渐积累的过程。在整个过程当中都会发生积极的作用,所以我们把它称为是孩子整个生命周期的能力形成。
而家庭中父母的不同偏好、对于抚养过程的理解不同,会对能力形成的生命周期有不同的影响,不过这些因素可以对监护人、妈妈们进行干预,带来一些提升。
我们看到现在的技术怎么样来促进孩子在整个生命周期当中的成功。我们知道有基因,以及其它一些要素的影响,在这里我想把技术在孩子的技能形成当中的公式展示给大家,每一个技术都是基于前一个技术基础上的,所以对技能的投资也是呈现累加的效果,呈现一个马太效应,越早投入,在将来就会产生更大的效果。
这里还存在一个替代因子,它表明早期和后期的投入是存在替代关系的,后期的加大投入可以对早期的投入不足进行弥补。但这个替代关系也有两面性,早期没有做到的,后期需要花费更大的代价去做到;而且,有了早期投入以后,后期也要继续投入才能保证早期投入的效果。
这里显示出在整个生命周期当中的投资与回报的关系。随着年龄的增加,可以看到越是在孩子后期投入来增长他的某项技能,投入越大,而效果会越弱。所以非常重要的是在孩子的成长周期当中,我们要尽量充分地利用这样一个曲线。
这里也就引出了一个问题,如何适当地在后期增大投入补充早期投入的不足。在这个过程当中需要有很多的投资,但是关键在于我们对最有效的投资还没有完整的理解,这里面包括有经济研究、社会科学的研究,还有包括人工智能在内的技术研究的工作还要继续进行。
我们把这样一个技能矢量进行分解,包括认知、社会能力和情商,以及健康管理方面的因子,可以看到技能产生行为,我们看一下他执行的任务,他在某个任务的执行上是否成功,完全取决于他的努力程度和他掌握技能的熟练程度等等。努力程度的确很关键,还有其它的环境的因素,包括对他的努力的认可和激励机制等等都产生影响,这当中有大量的工作需要我们去考量,才能更好地去估算和计算他们的这样一些作用,包括非因子的一些要素模型等等,这样我们可以对一些技能进行评估,特别是前沿技术的技能。当然还有一些处于相对比较低维度的技能因子,也会产生行为上很大的改变,这对我们的技能形成也是很重要的一些估算因子。
这里已经向我们提出了一个挑战,我们要设置一个最优化的机制是有挑战的,当然我们已经有了一些能力的测量,还有一些考试的分数,但是分数只是分数而已,我们必须要去分解成具体的技能。
在这里有一个关键要素,到底投资多少才是合适的,怎么样去测量它的效果?怎么制定政策?怎么样把收集的观察数据用于优化这样的一些投资。这里有一个简单的例子向我们表明,教育在这个方面的作用,包括我们的初衷,在我们的认知能力和非认知能力方面的一些发展。这两者都是在教育当中对孩子的综合技能的形成有重要的作用。
我们的多种行为,包括和社会的交互,他的健康、收入、人员之间的信任都受到一些低维度的矢量很大的影响,还包括人们如何去为一些复杂的社会问题提供解决方案的能力等等。而且一个人的能力不是一成不变的,在整个生命周期当中不断地演化,很显然,环境和学校都是会发挥一定作用的,有些因子作用更大一些,在这个过程当中,我们可以看到他在年龄小的时候由于弱势的环境所造成的影响要去弥补,年龄越大效果越差,这样一个理论非常重要,这一点显示出我们要确保让孩子尽量早地不要处于弱势的地位,或者接受更好的教育,这样能够避免他们在后期花了大的力气又效果不好的情况出现。越早投资他们的教育,在将来会有很大的作用,它的优势明显,这样的投资使得他后面走的每一步都基于前面更强的基础,可以实现一个马太效应,这个过程中,后期的投资效果也会更好。
我们必须要有非常精准的策略,所以我们必须要了解越后面投资于孩子的教育,他的缺点是显而易见的。在这里看到的是,如果他在早期的时候认知和非认知能力比较弱,到后面需要大量的投资,还不考虑到一些相关的社会的政策,只是从投资的角度来说,这对社会的投资效率或者生产率的提升,把这个投资放到孩子后期来做,都是一种投资产出比更弱的方式。因此这里展现出早期教育的投资越高,其实对后期是很有帮助的。在这里我们可以部分规避这样的风险,以避免孩子在早期处于弱势的地位,到了大学,哪怕你非常用功,使出很多倍的努力,也是效果不如早期的阶段,我们需要联合社会各界的力量,来更好地了解这样一个教育投资的曲线,这样才能在孩子的技能形成过程当中有一个良性的发展,让孩子尽量小的时候就有一个好的学习环境,使他有一个竞争优势。比如说在美国最成功的一个项目,我们也是进行了一个随机性的实验,在这个试验项目当中,我们发现这些实验组的学生,他们能够更好地参与到学校和家长的互动当中,他们在这个过程当中有更多的自主性,而不是只是家长和学校很权威,孩子不敢发出声音。
这为我们带来的政策启示是:我们需要有精确指向的策略;政策制定者需要考虑如何分配全社会中的教育资源;调动家长的积极性,可以增强其它投资的效果;最优的策略应该在最落后的方面做最多的投资。
30 年前我们在 Jamaican 做过一个介入项目。不过中国还是有很大不同的,并不是所有地区的项目都适用。我们先来看一下 Jamaican 这个介入的实验是怎么做的,他们会选择一些孩子,来跟踪他们的情况,我们选择 129 个孩子,做一个随机性的介入测试。
简单介绍一下这些孩子和家长的互动是如何进行的,首先我们要理解一下,一个是从经验主义的角度来看,另外一个是从学术的角度来看,孩子和家长之间的互动。我们做了一个建模,我们认为它是一个非常动态的游戏型的互动,并且它是一个学习型的互动。
在早期的理论当中,我们做了建模,测试了一下技能的生成和这些被动性格的学生之间,它会产生一个怎样的反应。最近的一些行业内的工作是更加关注于孩子在学生技能的时候他这个动态过程的演进。我们来想象一下孩子在认知形成的过程当中,不管是孩子还是家长,有没有老师带他们,我们的目的都是希望能够让孩子获得一个个性化的教育,他这个学习的结构应当是个性化、定制化的。
我们这里也采取了一些数学的研究方案,我们首先设想了一个线性的过程,我们界定了很多的因素,包括技能的演进本质和孩子的行为,以及在观察的过程当中,他们有怎样的表现,这些因素的权重是不一样的,综合起来,我们可以把它算出一个投资回报比,这样一个计算公式里面所有的因子都是非常重要的,正因为有那么多的影响因素,这也映射了我刚刚强调的近来的研究都是非常强调这样一个动态化的学习过程,这不仅仅是取决于孩子一方的表现,而且也跟家长的行为以及整个环境的综合状况是非常有关的。尽管我们现在还有很多盲区没有覆盖到,这个公式不能解决所有的事情,也有很多不完美的地方,但是我们也从中得出了很多有效的结论,来支持我们下一部分的研究。
我们建立了这样一个矩阵公式,并且对它做了一些更新。我们现在的研究因素不仅仅是包括孩子、家长,还有导师,我们会把重点放在孩子身上,以他作为主体来做这样一个公式的运算。我们希望能够了解孩子在逐渐心智发展成熟的过程当中,他的各方面技能会发生怎样的变化,以及他的技能形成过程有哪些规律,这是我们所关注的重点。我们发现有两个综合公式是特别适用的,对照组是心智发展比较成熟的孩子,另外有心智发展较为不成熟的孩子,分为两组,然后来分别对他们进行一个调查研究。其中非常重要的一个事情就是时间这方面,你研究调查的时间,他是否是一个连续性的时间,以及家长对儿童的教育是否是连续的,这就是我们第一步所做的,抛开环境的因素不说,先研究儿童跟家长之间的互动关系,这里的两个公式就是分别描述了心智非成熟的孩子和较为成熟的孩子他们是有一个怎样的不同。我们看到心智较为成熟的孩子,他们的各方面表现会比对照组更快一些。
说到具体的不同,就要进一步研究一下环境的情况。另外我们也研究了对家长的行为是否可以做一个优化,使得他达到一个最佳的效果。我们就把它叫做贝尔曼方程。
这里是我自己比较感兴趣的一个地方,我也想跟大家分享一下,在这个故事当中IT和AT这两个变量,它所说的是你的投入和你的行为之间的关系。我来给大家解释一下,为什么这两个点是非常重要的,以及它的难点在什么地方,我也希望大家能够在后面加入我们,一起来做更多的研究。
下面我来解释一下,在中国的一个情况,我们在培养孩子的时候是怎样的现状。我最近在做一个项目,是在甘肃做的对孩子的研究,我们会把一些访学者送到孩子的家里面,去跟他们互动,然后来获得一些信息。
我们选了1500个孩子,他们都是在甘肃华池县这个地方,在2015年1月份的时候,他们的年龄是6—24个月。我们也选择了很多计算的变量,比如说一些体重、身高和其它的因素。这个地图展示的是我们做调查的地理位置,我们也在西藏现在了一些样本进行研究。我们目前也在进一步的进行研究,今天没有时间来一个一个说。我们大体来看一下,这些访问者到达孩子的家庭当中观察孩子和家长之间是如何互动的,这种互动的方式是非常重要的。我们看到它有一个模式,就是说下一次的互动他会基于上一次互动中孩子的反应来进行。我们追踪了几个星期,通过一些叠加的数据,我们可以生成一些模型,然后来评估孩子的认知能力和非认知能力,这些表现是怎样的情况。我们会看哪些孩子基于数据是有比较多的优势的,这些都是以量化的方式来呈现在我们的系统中,时间周期都是按每周来计算。同时我们也会去记录我们的引导者在整个互动的过程中,他们是如何进行引导的,这个引导的方式也是我们所关注的。
我们在这个列表中可以看到,在甘肃华池县的情况,虽然是随机抽查的,我们有抽查组和对照组,我们看到这个中位数,就会发现一些基本的规律,并且它的趋势也是非常明显的,我们会就语言能力、社交能力来进行主要的调查,这两项我们认为是非常重要的。我们看到有一个非常明显的情况,在每一个维度都做了调查。
首先是语言能力的分布,我们分了控制组和对照组,这两条线表示的是两个组不同的情况。我们也有一个样本的生成,来为后面的调查做铺垫。现在还存在一些问题,我希望能在后期进行研究,也希望大家能够加入进来。
哪些特定的互动方式是可以帮助孩子更好地、更有效率地去提高他们的技能呢?这是我想大家提出的一个问题,也是我们后期研究的重点。
我们设想一下现在是如何量化我们的技能成长过程的,我们在上海也有一些研究,上海是一个重点的城市,有一些在电脑上进行的测试,但是他们的动态程度并不够,他们的综合程度并不够,这个问题出现在也许他们的研究对象并不够广泛,以及他们选取的样本过于局限。另外他这个速度也是非常慢的,跟不上我们的更新速度,通常是以一年为周期。现代的测试方式其实在理论层面已经进步得非常快了,特别是在学术、教育这方面,我们可以用的工具也越来越多了,比如说GRE、ETS这些实验方式。在研究的前沿尽量地进行个性化、量身定制的可测量的学习,远离传统的考试。
在这个过程中,我们用人工智能的技术、机器学习来进行相应的个性化的测试、个性的辅导。看一下在他的人生当中哪些能提高他们的幸福指数,提高他们的能力,让他们执行一些复杂的任务,可以很好地完成,因此对互动的质量和数量都进行量化和分析。
这个过程当中是有挑战的,因为它都是涉及到一个又一个的前沿。好处当然在于它是实时的监测和测量,老师和学生都可以进行互动的测量,而且这是个性化的测量,处处了一些主观的因素,能够形成孩子早期复杂的综合能力。现在我们可以看到计算力和传感力无处不在,可以充分利用这样一些前沿的技术,更好地去了解双方之间的互动到底是怎样的,哪些互动能促进孩子能力的成长。是哪一种动态、哪一种方式、哪一种路线的互动,能够针对每个孩子的特点,量身定制适合他的互动方式。比如说基于游戏化的学习,其实不光小孩爱玩游戏,大人也喜欢游戏,我们在游戏当中迎接挑战,包括在美国和在中国开发出的游戏,不仅仅是孩子能够喜欢,而且在这个过程当中让孩子可以学习、可以成长,带孩子进入到下一步,更上一层楼,发现孩子现在的状态,打造属于他的技能,不断地能让他持续地成长,可以通过游戏化的方式来进行.
我们用前沿的工具来赋能,包括语音识别、自然语言处理等等。现在很多人也会用视频分析,视频分析有很好很酷的方式,很多人都喜欢拍视频,然后分析出这个家庭里面和课堂上是怎样的互动,可以客观地分析,而不带过多主观的因素,看哪些因子起到更大的作用。目标是用可穿戴的传感器,以游戏为基础的方式,面向未来的教育方式,通过这样的方式,用计算机、人工智能,或者说游戏化的方式来为孩子未来的能力赋能。就像军队训练那样,让他们能用各种各样的设备,在这个过程当中,我们主要去分析这个个性化、游戏化的方式,来帮助我们分析这个互动当中出现了哪些问题,分析这个视频,基于游戏化来检验它的效果,对这个孩子来说,这样的项目是否可行,效果在哪里。这样就把分散的一些因子整合起来,来找到个性化的行之有效的方法,来提升孩子的成长.
这个活动的目标就是为了去除人的编程、程式化的方式。2019年做了相关的研究,包括个性、孩子的压力,包括相关的互动等等,身体的接触起到的作用等等,父母和孩子之间互动的作用,充分地利用了视频、机器的技术等等来进行监测,对这样一些互动的方式进行监测和评估,而且是实时的方式进行,不是一周、一年以后才进行评估和分析,而是在当时实时的分析,看一下和父母的关系,在这个过程当中,包括每年都评估语言学习的效果,有很多可穿戴的设备、音频、视频的技术,很多前沿的技术,大家应该已经是耳熟能详了。
我们看看孩子在这个过程当中的表现,它的作用何在。最重要的是大人和孩子的互动,包括我前面讲过的这样一种动态的、良性的互动的作用。这些前沿的技术作用不言而喻,我们也在不断地研究过程当中,包括技能的分析和评估都有很多很好的例子。这个案例很有名,大家可以关注一下。
(播放了一个视频)这是来自麻省理工的实验室的一个研究,他们录下了孩子的声音,是从家里拍的一个视频,录了非常长的时间,看看小孩是怎么学英语的,从一开始说得比较模糊,到最后完整地讲出一个词,很好地释放了孩子学习语言的过程。当然这样的要求还是非常严格的,在过程当中也有一些挑战,但是让我们很兴奋。他们做了大量的工作,做了很多的演讲和分享,在两个人互动的过程当中,了解里面的一些本质。当然要在中国和世界各地进行这样的项目,也是有一些挑战的,它可以帮助我们了解哪些方式是最有可能成功地促进孩子在成长周期当中的发展。
这里还有一些10年前的老的技术,就是录下人的语音。现在有更先进的语音识别的机器,包括在日常也可以使用,可以用视频和音频的方式来记录下大人和孩子的互动场景和方式,包括现在还有手势和动作的识别和跟踪设备,大量的可穿戴传感器,包括在麻省理工的实验室当中,有些小的传感器、可穿戴设备,声音的识别装置、蓝牙设备等等。在课堂上我可以作为孩子的良师益友,和几个小孩进行互动,在这个过程当中,这样的一些前沿的技术也帮助我更好地去了解这些互动的作用和价值。在芝加哥大学最近也是在用这样的设备来更好地了解物理上的接触,孩子和大人之间身体上的接触所带来的互动的价值。
有一些互动测量和评估的工具,都对我们的前沿科学研究有很大的促进作用。我们可以实时地进行测试,它的价值很大,可以在这个过程当中学习这个内容可以加速一点,我们可以实时监测。有时候我们可以让孩子在这个过程当中及时的调整,加快或者减慢,可以让孩子更好地学习,因为我们的监测是实时的。
在美国,这样一种基于游戏化的学习越来越流行,在玩游戏的过程当中,使得孩子能够掌握一些先进的技术、综合的技能,这样的教育方式也是很成功的,不仅学习,而且让他们觉得有趣,而且能够实时地给到教学过程当中的反馈,让我们调整我们和孩子互动的策略。
现在有很多大的AI和技术的公司做这方面的研究,包括在芝加哥大学,他们有一些教育技术。
可以建立教育平台促进大人和孩子之间的互动,非常好地跟踪学校里面的大数据,我们可以存储这些大数据,这样我们的教师就有足够的数据来进行教学效果的评估,来改变教学的策略,每周对教学的情况进行评估,现在小孩的学习状态怎样,他们更多需要什么,下周教学安排,基于他们的现状应该怎么样去进行改进,这可以解决很多的问题,我们可以让教学变得更加轻松,给到我们一个良好的数据库,不仅仅是有算法,而且是个性化的,每个孩子的学习状态数据都能够进行存储和分析。
总结:
我们现在面临社会高技能劳动力人才短缺的问题,教育要跟上是很大的挑战,中国也在努力解决这方面的问题,尽管任重而道远。家庭的环境、父母的技能有很大的作用,在孩子的早期教育中发挥至关重要的作用;早期的教育的投资能够起到很好的效果,在政策上各方面也可以起到更好的支持。当然,大人和孩子之间的互动是至关重要的,这当中有很多的评估标准,我们要确保这样的互动是行之有效的,要找到成功的配方,孩子和父母的交互、孩子与孩子之间的交互、孩子和老师之间的交互,要去了解哪些互动是很好的,这是一个很大的挑战,就是要去了解怎样的互动才是更好的方式,我们需要持续地研究。我们有一些具体的论文,有一些详细的细节,非常有意思。在这个过程当中也需要我们的人机互动,用客观的方式来对互动的效果进行测量,了解孩子对它的反应,有很多的研究正在落地当中。
我认为在这个过程当中人工智能可以发挥很大的作用,所以我也非常迫切地想从各位那里学到人工智能的前沿技术,很显然,对个性化的孩子的教育,人工智能可以发挥巨大的作用。再次感谢各位的耐心聆听,感谢大家。
雷锋网整理。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。