手机淘宝是「千人千面」的,即根据每个人的数据,看到的购物首页有所区别;依靠自适应学习的产品,有机会在学习的过程中让孩子也感受到「千人千面」 —— 可以理解为大规模实现「量身定制,因材施教」。
本文具备以下观点:
- 自适应学习不基于的特定规则来选择路径,而是需要通过对学习行为的解构、对比,推测学生的真实掌握情况,匹配内容推荐。
- 自适应系统的迭代过程,就是推理能力变强的过程。
- 除学习测评,保证提分效率之外,能在解题过程中为学生提供足够多支持的学习系统具备更广泛的适用性。
「通过计算机算法来协调给予学习者的内容和活动形式」,这是对「自适应学习」的基本简单描述。有人跟我举过这个例子:根据学生近期的测评情况,系统能算出想达到目标分数,要刷哪些题、刷题的先后顺序、需要刷多久……这就是自适应学习系统的一种理想状态了。
自适应的内容推荐
比如洋葱数学的答题对战系统,就是一个简单的自适应进行内容推荐的例子:我在对战中的错题被解构为了对于一部分知识点的不理解,在对战结果中推荐相应的知识点视频。
自适应的评估
在松鼠AI 的测试题产品中,有针对是否掌握知识点的判定,并且形成针对后续学习的建议。
其实体验过这两种形态之后,会自然有个疑问:
判断和推荐只能基于已有的学习行为结果吗(要刷很多题)?
让学习者在前期把时间浪费在对于一个领域知识点的穷举测试上,这显然是有问题的,因为很多知识严格意义上来说是用不到的。除了看到基于知识点的学习建议之外,学习者能否得到更具整体性的学习反馈和建议?——学习者关注如何更快进步。
优秀的自适应系统具备比较和推理能
先来理解计算机测试学习者水准的最简单方式:
- 计算机优先预估一个学习者技能水平的最大值与最小值(能力区间)
- 给用户抛问题(该问题在能力区间范围之内)
- 用户答对则重新分配最小值、答错则重新分配最大值
- 逐步缩小范围,得到结论
但实际的情况是:
- 存在学习者蒙对的情况,比如判断题,总是有50%的概率做对
- 即便掌握程度相同,表现的可靠性也有区别:A 围绕一个知识点做了10次练习,正确率100%;B 做了100次练习,正确率98%,很难说 A 的掌握程度就高于 B,这是置信度的问题
针对学生的知识图谱进行估算、基于概率去推测「学习者可能掌握了哪些知识图谱」就是一个可行策略;在这个评估的过程中,算法还可以抓取一群学生的数据进行比对,从而调整测试的策。
具备对于学生知识图谱的推理能力和积累不同学生在同一知识点、题目上的表现之后,自适应系统就是一个高效、动态发展的学习伙伴了。
自适应系统的迭代过程,就是推理能力变强的过程
下图从左到右的三个蓝色矩形描述了低级到高级自适应学习系统的特点:
- 低级系统仅通过判断学生的学习行为来调整学习内容,比如根据某个题目错了,就新增对应的知识点练习,更像是一个被提前预设好问题的剧情游戏
- 系统内存在一套难度递增的课程,表现好就给你难度更高的学习内容,反之给更简单的,具体例子是一些答题类产品的规则:每个人的题目都不一样,上一道答对了,下一道题就更难
- 具备更强的推理能力,且能够找出知识点之间的关联,可能把错误知识点的若干个上下级知识点都会推送给学习者加强一遍
适应系统越高级,学习路径越非规则化,在知识图谱的分布上呈现为:
这种不规则化在不同学生之间的学习路径上呈现为:
为学习者设计「脚手架」而不是「算法上帝」
这里有两个关于自适应产品的反馈,仔细想想问题在哪:
- 某开发者:假设这名高二的孩子未来想高考xx分上xx学校,我的系统能做到为他规划接下来一年做哪些题,频率如何。
- 某自适应系统用户:我就跟着系统完成推送过来的题目,一年之后我从班级中游到了前三名。
他们都在塑造一个「算法上帝」:即学习者跟着我的规划来就行了。但是:
- 「选择以何种方式学习哪些内容」——这种重要能力被计算机替代了
- 剥夺了学习者的选择权利,不利于学习动机
- 只有数学、物理这种高度标准化、客观化的科目适合这种练习方式;对于存在主观判别的科目,很难落地
- 用户依然难以判别「给我的题目是预设好规则的还是灵活调整的」?
- 自适应产品没有直接在理解知识、尝试解决问题的过程中具备用户感知
面对开放性的问题,自适应学习能够直接参与到解题步骤环节(而不是只测试+内容推荐),通过不同媒介为学生提供解决问题的内容提示、活动建议(脚手架),就是一个非常理想的状态。
例如网易的Python 编程学习游戏极客战记,左下角的3D 人物会根据操作,在过程中给出一些提示,这就是承当「脚手架」功能的产品特性。
这是最近关于 人工智能教育 的学习笔记的第二篇内容,第一篇请见:除了刷题提分,教育行业还可以怎么用知识图谱技术?