教育

题库F4的下半场,阿凡题选择了最难的路

名师+AI,从最难的高三辅导开始

2019年06月25日
调研 | 刘馥亮 撰写 | 刘馥亮
  • 教育
  • 人工智能
题库F4的下半场,阿凡题选择了最难的路

曾几何时,拍照搜题被认为是技术对教育渗透的最佳范例,而变现的困难使得题库工具公司纷纷寻找新出路。曾经的“题库F4”,猿辅导、作业帮选择做在线大班课,学霸君选择了在线一对一,而阿凡题选择了最难的一条路:名师AI课。

阿凡题创始人陈李江表示,“阿凡题从做题库起便是技术立身,我们不想放弃AI技术,名师AI课很好地利用了此前我们的技术和数据积累”。

题库F4的下半场,阿凡题选择了最难的路

建知识图谱的核心是数据

阿凡题名师AI课的底层是知识图谱,虽然教培行业内不少玩家都在说知识图谱,但阿凡题做图谱的最大优势在于过亿用户积累的数据。陈李江对爱分析表示,“知识点之间的关系网络是没有门槛的,因为拿着教材和考试大纲,每一个老师都能提炼出来”。

但是,阿凡题的知识图谱是“知识点-题目-能力”之间的关系网络,要将知识点和题目、能力之间建立关系和模型,需要有大量的学生数据,而这恰恰是题库类公司的优势

题库F4的下半场,阿凡题选择了最难的路

由于学生多数是不会的题才需要搜题,因此阿凡题积累的是学生的错题数据,而且这些数据不连续、是离散的,因此需要二次挖掘。掌握了知识点的关系图谱和学生的错题,阿凡题还利用AI给海量题目贴上标签,通过题目的标签将题目、知识点、学生能力关联上。

知识图谱之上搭建“诊-教-测-评”完整闭环

拥有“知识点-题目-能力”的知识图谱之后,阿凡题可以给学生做出比较准确的学情诊断和学习路径规划。

题库F4的下半场,阿凡题选择了最难的路

阿凡题的愿景是利用技术将教育变为数据驱动的个性化学习。个性化学习分为三个环节:第一是诊断,对每个人的情况有清楚的了解;第二是个性化学习规划,基于诊断为每个学生生成学习路径;第三是教学,将学生从“不会”教到“会”的过程。

有了大量数据训练出来的知识图谱,阿凡题做到了第一和第二个环节。而第三个环节,则是阿凡题推出名师AI课的核心原因。

名师+AI+服务=名师AI课

阿凡题的名师AI课也是“AI伪直播”,由名师录制成几分钟、十几分钟的最小知识点单元的短视频,在阿凡题给学生定制的个性化学习路径中,可以对于学生薄弱知识点进行讲解。

阿凡题录制视频的老师都是所在学科的顶级名师,这些老师本人在学期间即是学霸、毕业于名校,且毕业后都在公立校或知名培训机构担任多年教学/教研骨干。陈李江表示,这些名师上1对1的课酬是5000-6000元/次,而阿凡题将这些名师的课程定价降到原本的十分之一。

对于AI伪直播的质疑,多会来自互动性的缺失。阿凡题1.0版本是做到录制的知识点讲解清晰,2.0会对单一知识点录制更多的版本,满足不同层级学生的学习需要,同时也会对学生高频互动的节点录制针对性解答,而判断哪些节点学生问题较多则来自于做题库和即时辅导积累的数据。随着产品迭代和用户数据的积累,互动和个性化路径会越来越丰富,伪直播的效果会越来越接近真人1对1。

而如果出现未预料到的问题,阿凡题会通过“即时答疑”产品去解决。在题库产品变现时,阿凡题推出了“即时答疑”产品,学生拍照搜题如果没法理解,可以再寻找到真人辅导老师进行讲解。通过这项服务,阿凡题连接了三四万老师,这些老师在名师AI课上依旧能贡献力量。

除了互动性问题,AI伪直播的另一大质疑是完课率问题。没有完课,再厉害的名师也不会见效果,阿凡题采用助教答疑和班主任督促的方式,做深做重服务,来确保完课率。

2018年,阿凡题潜心打磨名师AI课的产品。经历近一年的测试,2019年1月开始上线,阿凡题将一学期的课单价定在了5000元左右。而且,阿凡题名师AI课选择从高三开始切入,相比打低龄语培的AI伪直播,阿凡题无疑选择了最难啃的骨头。目前,阿凡题已经覆盖了高中三个年级的课程内容,将逐步延伸到初中和小学。

从2019年1月到目前,已经数千名学生在使用名师AI课产品,各个环节的体验、转化率都让陈李江感到满意。再跑一段时间的数据,在验证完“家长愿意为之买单”和“教学有效果”两个核心问题之后,阿凡题的名师AI课将迎来规模放量。

题库F4的下半场,阿凡题选择了最难的路

近日,爱分析专访阿凡题创始人陈李江,就阿凡题的最新进展和战略进行交流。

爱分析:阿凡题整体的定位是怎样的?

陈李江:我们起家做拍题,是一直在做AI的技术公司,整体定位是做AI技术在教育行业的应用,构建个性化的教育体系。我们不是在最核心的环节去替代老师,而是在诊断、量化、智能推荐、学习路径规划这些方面用更量化的方式来做,因为我们有强大的技术基础和数据量。

我们有独立的人工智能研究院,且一直在做AI技术的研究,仍在高级别的会议上发论文。我们跟微软是战略合作伙伴,微软在教育行业很多教研教学的深度应用模块,是用的阿凡题,因为微软做底层,上层的深度应用不做。

爱分析:教育行业的知识图谱是如何构建起来的?

陈李江:图谱在我这是“知识点-题目-能力”的关系,不是一个描述的关系,是表达的关系。比如一元一次方程,是自带描述的,有它的含义,但我们还会给他组建一个关系,围绕这个定义,会有一元一次方程的理解、应用,为了掌握这个知识点需要的能力等等。这个图谱对后续的自适应学习的规划,对学生的诊断,是很有必要的,可以从题目推断出他某些知识点和能力点有没有掌握。

大部分公司说知识图谱都是个概念,因为抽象出我们这个知识图谱是极难的事,需要大量的数据。最基础的是知识点之间的关系图谱,这个谁都能做,拿一本教材就可以。在这个之上,是题目和知识、能力和题目的关系,这要从用户行为中得出。

怎么知道学生哪个知识点有没有掌握,学生很难告诉我,她只会告诉我哪道题不会做,因此需要做推断,做推断就需要数据。只有题库工具的公司才有这么大量的数据。题库工具是离散的数据,因此需要二次挖掘。

爱分析:题目的标签如何去做标注?完全靠人工吗?

陈李江:我们是用AI来贴题目的标签,现在能贴20多维度的标签。AI刚开始准确率不如人工,怎么办呢?全中国80%的作业来自辅导书,于是我们跟教辅机构合作,教辅书上的题目已经有标签,只不过维度很少,后面我们慢慢用算法去延伸,贴更多的维度。

算法贴标签的逻辑是,我用5个算法去贴,如果有3个算法得出相同的结果,就以那个结果为标准,再用算法去训练;如果算法无法得出一致结果的题目,就用人工去贴,算法再去训练逼近人工结果,我们做了很多年才做到现在的准确度,现在标签能到95%的准确度。

爱分析:名师AI课的版本迭代规划是怎样的?

陈李江:1.0版本是比较初级的录制,知识点会录制得比较细,追求清晰。后续会把一个节点做很多的细分,讲的程度有浅、深,还可以有不同的老师风格,为了满足个性化需求。

3.0版本是仿真人物,是真正的AI,是真人的脸和模型,是按脚本来组织和呈现的,老师只需写脚本,不用做内容,AI会把内容做出来。如果学生有临时问题,我会做在线答疑,因为我有几千分钟的真实数据,高概率问题我是能预测的;对于低概率问题,可以从在线答疑的数据里面挖掘,如果是没有覆盖、没有预设的临时问题,我就告诉他对接哪个助教,这都可以用算法驱动。

爱分析:做高中阶段,高中生应该能看出老师是“伪”直播?

陈李江:我们是高三数学起步,现在铺完了整个高三,做最难的如果能跑通,其他就更容易了。另一点,低龄小朋友会注重互动、注重趣味性,但高中阶段,家长和高中生在购买的那一刻会在意名师,使用后更在意的是效果,因为他时间宝贵,只要能在几分钟、十几分钟内教会一个知识点,是直播还是录播就没那么重要。

爱分析:课程都录制成了短的教学视频,怎么保证体系化?

陈李江:教学的体系性是靠我们的图谱和学习路径来做到的,跟着学习路径去学习、练习,就能让学生比较全面地掌握。

爱分析:名师AI课目前怎么获客?

陈李江:获客有我们自己的题库用户,同时也做投放和建电销团队。

我们发现,使用过我们“即时辅导”产品的用户,转化率是最高的,因为他已经认知了阿凡题的品牌。