0
本文作者: 于胜越 | 2019-04-12 20:07 |
【大咖Live】AI自适应教育专场第三期,朗播首席科学家贾艳明带来了关于“AI+大数据落地语言学习的实践和思考”的主题分享,详解朗播在AI+教育方面的实践经验。目前,本期分享音频及全文实录已上线,「AI投研邦」会员可进「AI投研邦」页面免费查看。
本文对本次分享进行要点总结及PPT整理,以帮助大家提前清晰地了解本场分享重点。
AI在教育行业的应用,以及朗播的看法;
AI在朗播语言学习的体系中如何具体落地;
教育新零售,以及在教育新零售下,AI学习助理是怎么样更加有效地帮助大家学习;
AI在未来教育场景中的展望。
以下为朗播首席科学家贾艳明的部分实录摘取,雷锋网【AI投研邦】在不改变原意的基础上做了整理和精编。
大家好! 我是来自朗播的首席科学家贾艳明,在朗播主要人工智能和大数据工作,也完成了自主知识产权的口语评分以及作文评分引擎,并在今年完成了AI学习助理的研发,发表了很多相关的论文,申请了一些专利。
感谢雷锋网「AI投研邦」给予机会和大家交流。朗播成立于2007年6月,是一家基于智能学习技术和行为大数据分析,以语言培训行业的标准输出为核心的英语教育科技公司。产品已经覆盖出国留学考试,以及国内四六级考试和通用学习产品,并且能够提供课程练习测评问答社区等一站式服务。
贾艳明提到,教育是什么呢?教育本质上来说,是以知识为工具,教会他人思考的过程。它分成两部分,一部分是以知识为工具,指的是知识的传递过程。第二个是教会他人思考,意思是,你把知识学会以后,能够把它吸收内化成自己的能力,这样的话你才会思考,才会用你学到的东西去解决问题。
实际上AI+教育真正重要的是什么?他认为教研很重要,另外一个就是数据和技术。
首先教研是根本,如果有一个好的教研,它可能会产生一个伟大的教育公司。但是如果没有好的教研,只有高超的技术,它肯定也做不成一个好的教育公司,因为教研是根本。
第二个是数据和技术,其实数据更重要,因为数据相当于原料。它相当于你现在可以看到石油和煤,而技术只是一个加工原料的工具。而且随着开源工具的发展,技术重要性远远不如数据那么重要。因此总结下来,如果一个公司没有教研和数据是有问题的,因此我总说,没有教育和数据谈AI+教育就是耍流氓。
总结下来,AI+教育的关系是AI技术辅助教育,帮助我们改善学习效果,提高学习效率。再加一条的话,就是他可以改善大家学习的体验,让大家学得更加舒服,更加轻松。
二、 AI在朗播的实践
朗播提供的是什么?朗播提供是一个专家经验加能力图谱为基础的标准化产品。解释一下为什么说能力图谱很重要,因为之前可能大家听到的更多的是知识图谱,为什么要强调能力?因为无论是实践或者考试,能力是最根本的东西。所以我们是以能力突破为基础,并且也是以提高真正的语言能力为目标,而不仅仅是应试。第二个是标准化,标准化意味着这个东西可以量化,可以控制的。
朗播提供的是标准化产品,在这个基础上,我们会有基于AI和大数据的个性化的学习平台。简单说一下,相当于我来这里学习,首先是能力量化,进行能力测评,知道你哪里有问题并测评出来,然后就会给你做针对于个人能力不足的地方进行能力训练的计划,然后你去做练习,再来测评,以此反复循环并直到达到目标。
中间会有智能的评测技术和行为数据来辅助个性的学习,让过程更加顺畅,比如我们做完练习时,我并不知道我做得怎么样,但是加了智能测评之后,我就知道我到底做的怎么样,从而系统会智能地引导我继续再往下做。
有了数据之后,我们也能够说清楚哪块和哪块之间的关系是什么样的,词汇不好还是语法不好,都能够通过数据看出来的。我们通过这样的平台,就能够为每个人提供属于自己的个性化学习的方案。
具体来说,首先AI第一个应用场景,就是基础的智能评测技术,它是更加客观更加及时的。比如基于语音识别的口语评测技术,这块主要是来评测发音质量的,相当于测评发音标准与否的技术。
我们还有基于声学空间的发音评测。左边是一个学生在读中国汉字时候的发音,大家可以看到他发U的时候,这几个音都挨得很近的,那就说明发的比较标准,因为他每次发出来的声音总能够集中在某一个区域内。所以说它相对来比较标准。再看右边,同样是同一个学生,他在读英语时可就不一样。 这样的话就相当于发音控制的并不太好。同时我们也可以通过每个音的聚集的大小,以及每个音之间聚集的中心距离,判断出学生的音到底更容易发成什么样子,从而指出他问题所在,帮助他改正。
除了口语评测,我们还有一些主观题评块,主要是用到自然语言处理方法。我们强调能力训练系统,很多题是我们自己的。教研老师出的非常好,就是为了真正的把能力锻炼起来,而不仅仅像普通的考试题,它其实起不到能力训练的作用,而只是在简单的刷题。
其实我们更多的是在作文的评分上会有自然语言的使用。比如说我们可以对学生写的作文结构进行评分,比如说他的论点是否明确,论述的如何,理由段怎么样,是否有让步段,结论是不是很清晰,结构是不是完整。
我们会请教研专业老师做一些标签,通过机器学习模型训练出来结构评分模型。内容方面,我们也通过主题模型、相当于学生写的论文是不是跟主题相关,能否支持当前的论点。教研老师会帮我们做一些标签,然后我们去训练模型。
最后就是语言能力,它包括了拼写检查以及语法检查。拼写检查用的是winnow算法加上语言模型。我们使用了综合的语法检查的模型,包括基于规则的模型、分类模型、神经网络翻译模型,进行了语法的检查。
为了让大家能够更加清楚的看到自适应学习过程是测学练的过程。在测的过程中知道你哪块能力不行,提供一些快速精准测评模型。测完之后就是要学,在平时的传统学习中,它应该叫教学,相当于老师帮助你制定出学习计划,然后你按这个计划学习,叫学习路径的规划。
规划好了之后就去学,即练习的过程,这也就是能力训练的过程。中间我们会有知识追踪模型,告诉我们练习的进展和成果如何。大家可以了解一下这几个模型。
第一个,我们首先介绍快速的测评模型,因为其实我们还有一个更加精准的模型,它时间比较长,需要两个多小时的,评测也更加的准确。
但因为我们有时候其实需要一些快速测评模型,也要相对准确。那么这时候我们就使用了一个基于信息增益的快速测评模型,基本上就是做少数的题就能够得到你的能力点的基本范围。其实它的原理并不那么复杂,但是我们需要很多的数据。相当于我们能够通过线下的大量学生做题,看到有一部分的题目是跟能力点评价有很强的相关性,从信息的角度来讲,它们的贡献更多, 剩下的提供信息少,这时候我们就会在线下把信息量提供最多的这些题选出来,并且我们把这些题做对做错的关系跟能力点之间的范围都记录下来。
当我们到了线上的时候,相当于学生只需要做刚才记录下来的那些信息量最大的题。做完之后,因为大量的学生已经帮助我们统计出这些题到底对应能力关系是怎么样的,这两个东西一结合,就通过少量的题就能够知道能力会落在什么范围内。
第二是基于贝叶斯方法的能力水平预测,我们能够在很短的时间用很少的题帮助学生把他的能力水平测出来,剩下就根据能力进行推荐了。
根据能力推荐有很多种方法,比如贝叶斯方法、强化学习、KNN等方法,各有适用的场景。这里我给大家讲讲利用贝叶斯网络实现学习路径规划的基本原理。贝叶斯网络简单讲相当于每个节点之间有一定的相关性,节点之间的相关性是通过条件概率来反映,相当于当我的某个能力点高的时候,跟它相关的下一个节点的能力点高低的概率是多少。
整个的网络通过专家经验把节点和网络结构确定下来,剩下通过数据把条件概率算出来,作为一个基础模型。当某个学生来了之后,我们根据他输入的当前情况、未来目标、中间通过测评能够得到的能力点和对应分数的关系,我们就能够推出来,在这样的条件下,他的其它一些节点到底个什么情况?相当于他能力点低的概率有多少,高概率有多少。我们就能够选择出来适合于这个学生学习的最优路径。
当他的学习路径规划好之后,就开始练习。练习的时候,就会有一个知识追踪模型,它其实是根据学生答题序列,通过知识追踪模型得到知识掌握的概率,这是知识追踪的概念。那么传统知识追踪,如图所示,左边是贝叶斯模型,后边是深度学习的知识追踪。左边模型相当于它只是针对一个知识点的话算得很准,后边深度学习的知识追踪模型需要大量的数据。
我们提出了贝叶斯深度学习的追踪模型,把以前深度学习上面得每个参数点,变成了概率分布。这样的话模型会更加准确,它相当于是利用了所有的学生推断下一个学生到底做得怎么样,而不仅仅是当前模型的固定点去推断。
总的来说,朗播的语言学习体系中AI大概是这样的结构。首先会通过方法课进行知识传递的过程,然后自适应学习系统就会有知识吸收内化变成能力的过程。AI和大数据会在每个环节发挥作用,让学习模型更加精准,让学习效率更高,让学习体验更好。
我们怎么样解决双师问题。教育新零售其实是基于新零售,马云在16年提出来的利用线上服务和线下体验,进行新的零售模式。对于教育来讲的话,朗播提供的线上就是中央厨房式的内容标准化产品供给,线下是本地化标准流程的服务,主要是辅导反馈和陪伴,中间是通过数据去打通的。
如果没有AI,线上就是学员通过方法课和自适应学习系统,首先进行线上学习。接下来就是线下的导师帮助他做一些归因分析,提供解决方案,并且还有一些是可以给他陪伴、监督他学习。中间通过数据打通就可以了。有了AI之后,在基于学员数据的基础上,通过AI技术对学员的学习过程和能力提升情况进行更精确的评价,从而给他提供更客观准确的归因和解决方案。线下导师可以利用AI学习助理进行简单督学,更多的是陪伴,让人机接口更加明确,各自发挥自己的优势,帮助学员更高效地学习。
第一个是学习的内容和过程应该是标准化的,但是每个人也有个性化,因为标准化才能量化,之后我们才能够为每个人都提供个性化的东西。第二个是教育新零售,利用大数据和人工智能打通了线上线下的隔阂,是更加有效的学习方式。它会解决双师模式存在的问题,而大数据和人工智能就会给学生提供一个线上线下一致的服务。
最后一点是人工智能不能取代教师,因为教育是一个有温度的职业,它是不能取代教师的,但是教师的角色会发生变化,有一部分能力高的水平高的进行知识传授,有一部分水平稍微差一点的或者刚入门的就可以做简单的辅导。那么剩下的就是像朗播这样的学习产品,就需要教师变成一个产品经理,进行系统设计。 基本上我觉得未来AI跟教育也是这样的关系。
完整内容和视频查看可进入雷锋网「AI投研邦」查看。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。