教育

考拉阅读独创智能分级体系抢占学校语文教育流量入口,致力于重新定义中国少儿阅读整体生态

一年时间打磨底层技术架构,考拉阅读的野心不止于中文分级阅读的标准制定者?

2018年06月26日
调研 | 刘馥亮 赵雅晨 连丽霞 撰写 | 连丽霞
  • 教育
  • 中文分级阅读
  • 考拉阅读

英文分级阅读在国外已有40年历史,覆盖美国90%学校,在以Lexile分级(蓝思分级)和GE分级为代表的英文分级阅读标准之上诞生了数家过亿美金的分级阅读教育产品公司。而中文分级阅读在中国仍属市场空白。一直没有一套量化的中文分级阅读标准,难度主要在于中文的复杂性。

成立于2016年9月的享阅教育,选择了这一条新赛道——中文分级阅读,打造中国版的蓝思,助力语文教育。

考拉阅读是享阅教育旗下主要产品,是其倾力打造的K12分级阅读品牌,主要通过自研一套中文分级阅读标准,让学生能够根据自身阅读水平选择适宜难度的读物。

在产品形态上,考拉阅读以APP形式呈现,分为管理端、教师端、学生端和家长端。学生可以在平台上进行阅读能力自测,随后通过APP推荐个性化阅读内容和针对性阅读训练提升阅读能力;教师可以通过平台发布阅读任务,跟踪学生的阅读进度,跟踪学生的阅读进度,查看学生阅读能力变化曲线;管理端则可以实时监测全校阅读情况,进行更为有效的掌握和管理,调整校园的阅读培养策略。

截至2017年底,考拉阅读底层标准准确率达到93%,已达到商用水平。

2018年初,考拉阅读开始进入规模化获取和运营用户的2.0阶段,首先从2B切入,与各级教育主管部门合作,覆盖一到四线学校,抢占学校流量入口。

关于未来,考拉阅读创始人赵梓淳表示,将会在现有2B之外探索2C模式。

瞄准AI,建立基于ERFramework的中文分级阅读系统

通过AI技术助力中文分级阅读,难度在于汉字的复杂性。

基于此,考拉阅读技术团队从字、词、句、段、篇五个大维度提取上百维特征打造算法模型,实现对中文文本难度的分级。同时通过对全国一至四线城市三十万小学生进行数据采集打造中文阅读能力测评,准确评估学生的阅读能力,实现二者的精准匹配。

经过一年半时间的打磨,享阅中文分级阅读标准的效度和信度经过大量的实践检验,已经比较理想。

首先是对中文文本难度的分级。考拉阅读邀请了各界专家参与分级阅读底层标准和系统的研发,在阅读材料的评级上,通过对文本进行各维度的特征提取,前期由专家提供有标签的样本供机器进行训练,后期更多地通过机器学习和数据挖掘,实现系统对中文文本的自动评级,文本难度用ER值来衡量,范围在200ER到1,300ER之间,值越大代表难度越高,比如《道德经》的ER值超过1,200。

另一维度是对学生阅读能力的评估。考拉阅读对一至四线城市的60余万小学生进行了阅读能力数据采集,为保证数据的有效性,团队成员需亲自参与现场监测孩子答题状态,排除无效数据,多方协调确保测试顺利进行。通过大样本的数据采集,考拉阅读打造了学生中文阅读能力的量表。

学生在考拉阅读上进行阅读评测,根据答题情况得到自己的阅读能力ER值及适宜阅读的图书ER值范围。据此考拉阅读进行相应的推送,比如阅读能力在600ER的学生,可推送321ER-626ER范围的文本。

以学校切入,抢占B端流量入口

打造好分级阅读底层标准和系统之后,考拉阅读进入规模化获取和运营用户的2.0阶段。

在获取用户上,考拉阅读选择从B端学校突破,已与几千余所小学建立了合作关系,覆盖一到四线城市,产品已被上百万的学生使用。

从学校切入的优势在于用户稳定,学校的生源会有毕业也有新入学,总体生源较为稳定,而2C投放广告获取流量则容易陷入价格战。此外,学校能为未来考拉阅读走向C端起到一定背书作用,在学校已经接纳的情况下,家长付费也更为容易。

为更好地服务好学校,真正让师生用好考拉阅读,考拉阅读和学校合作开展了针对教师的培训课程,通过线下集中辅导和线上远程支持两种方式,更好地帮助教师使用工具,真正做好帮忙不添乱,成为教师的有益助手。

近日,考拉阅读创始人赵梓淳接受爱分析专访,就行业与市场趋势、公司业务与战略等进行了深入对话,摘取部分内容分享如下。

深耕垂直深度阅读,全面助力语文教育

爱分析:公司发展经历了哪些阶段?

赵梓淳:我们可以分为三个阶段,第一个是天使轮阶段,主要是在做底层技术上的储备,做底层标准(比如如何测文本难度,阅读理解的能力),这一阶段招人基本上都是研发人员,如算法、语言学、心理学、测量学等人才。

现在是在第二个阶段,处于产品化和规模化,获取用户和服务用户阶段,产品化之后面临的问题是如何快速推向市场,规模化获取用户,保证客户的活跃度和留存率,这是我们需要去验证的事情。

第三个阶段是商业化,这是在规模化获取和运营客户之后的事,目前在探索中。

爱分析:建立分级阅读底层标准1.0阶段,大概持续了多长时间?

赵梓淳:从2016年成立,到2017年12月A轮之前,过程持续了一年多,现在已经在从APP应用里获取数据了。

初步的数据模型需要线下做测试,获取比较扎实的数据,测试中比较耗时耗力,要与学校交流,挨班测评需要找相关负责人员,多方协调配合;另外源于孩子的天性使然,集中度难以维持,要大量的人员跑到线下,观看孩子的集中状态,确保数据的有效性等问题。

截止目前,我们积累了60余万的样本量,把标准打造好了。

爱分析:用于测试的文本类似于一篇文章的阅读理解吗?

赵梓淳:可以理解为像托福考试,只不过模式以阅读为主,考察孩子整体感知、提取信息、形成解释、作出评价、实际运用等五大维度的能力。

爱分析:考拉阅读可以评测文言文吗?

赵梓淳:可以评测文言文,比如道德经这篇文章在系统里是1200ER的难度,其中一句“道可道非常道,名可名非常名”,字虽然简单,但理解难度较高,这时我们用一些主题模型进行测试。

爱分析:第二阶段从2017年底到现在为止,用户量增长情况如何?

赵梓淳:用户增长比较猛,现在已有上百万用户了,注册用户日活的比例达到过1/5。

爱分析:心理测量的专家用于评判标准,算法技术人员主要做哪些工作?

赵梓淳: 从两个维度来走,测读者能力的这块儿,更多是跟心理测量学和阅读测量学相关;文本难度这块儿,更多是跟数据挖掘和运算有关,主要是NLP自然语言处理。

比如说非洲鬣狗的鬣,这个词在中文里是出现频率相对较低的,但孩子理解起来并没有那么难。另外比如说句长,中文的句子可能是句子越短,反而理解起来难度越大,比如“道阻且长”。

基于如上原因,我们将语料依据字、词、句、段、篇五个维度提取了上百维特征打造算法模型,来表征一段中文文本的理解难度。

爱分析:测试材料的是需要人工判断还是直接用机器算法?

赵梓淳:测中文文本的难度,一开始肯定是专家经验,机器学习也需要有学习对象,我们以专家团队标注的语料和中文的语文教材作为机器学习的对象:比如一二三年级的课文等。

爱分析:现阶段,孩子做完题,可以用机器判断,还是需要人的判断?

赵梓淳:现阶段孩子做完题,系统可以自动评判他的答题结果并进行分析,给出量化的阅读能力ER值及适宜阅读范围ER值,确保孩子对推荐阅读材料的理解程度在可接受范围,比如说测出来是600ER的孩子,我们做了大量的现场试验,他们比较适合看405ER--719ER之间的难度,这样保证他们对文本的理解程度在60%到90%之间。这是一个范围,类似于俄国心理学家维果斯基提出的“最近发展区理论”。

爱分析:机器判断到了可商用的地步,判断标准是什么?

赵梓淳:已经达到商用阶段,测中文文本的准确率基本可以达到95%以上。用专家来判断这个文本难度范围,和机器判断的难度范围进行对比,对应值的范围大概是95%。

抢占学校流量入口,规模化获取用户

爱分析:对学校来讲,学校用考拉阅读的最大动力是什么?

赵梓淳:简单概括是,帮忙不添乱。我们主要切课后,小学生下午三点放学,老师可以通过工具,在空余这段时间让学生更好的去学习,就是可以辅助语文教师教学。

爱分析:合作的学校有多少?都分布在哪些地域?

赵梓淳:目前有几千所学校。我们对地域上没要求,不一定是一线或者经济发达的城市,我们更希望三四线城市用起来,他们整体的教学水平不是很理想,所以这个帮助意义更大。

爱分析:是否考虑把产品拓宽到其它场景?学校的场景有很多,比如切入到教研或考试?

赵梓淳:看数据,如果说用户的留存很高,比如用户每天的活跃时长很高,是一个刚性需求,那么可能会考虑,但还是要有自己的核心优势。

爱分析:现阶段专注于小学阶段,未来会考虑高中模块吗?

赵梓淳:未来会考虑,但就不是以现在的这种形态来上了。相比较高中,我们更多针对的还是一到六年级,对于阅读而言,这个需求更多,学生群体也更大。

爱分析:做产品推广时,是以收费的形式进入学校吗?

赵梓淳:12月份之前是以收费进入学校,主要有两个考量:一个是收费的学校配合度较高;第二个是验证市场需求。如果我们的产品收费都能进入学校的话,证明商业模式是可行的,大家是接受这种产品的,对于以后的扩张更有利。

爱分析:在规模化获取用户这一阶段,跟校长或教育局接洽时,最大的困难是什么?

赵梓淳:获取用户挺快的,但其实跟我们能去触达的用户相比还是少的,主要涉及到产品的支撑和服务;现在没有达到一个量级还没有办法全铺,先要保证服务质量。

着重提升APP日活 提升客户粘度

爱分析:小学生需要用家长的手机来阅读?家长怎么看待这个事情?这会不会是日活时长的瓶颈?

赵梓淳:从两方面来考虑,动力系统和压力系统。

动力系统就类似于凯叔讲故事,孩子喜欢,家长觉得不错,就订购了。我们是一样的道理,打开之后,如果孩子喜欢,又能提高阅读能力,家长也不会拦着。

另一方面就是压力系统,就是老师要求在上面完成作业。

爱分析:内容在APP端,经常盯着手机是否会影响孩子的视力?

赵梓淳:对。我们之前也有这个考量,但实际上,一起作业的日活时长,家长对其也没有排斥,所以他已经证明了。就像我们每天学生的使用时长是30分钟,也在正常范围之内。对于家长来说,孩子学习成绩更重要。

爱分析:考拉阅读中的内容,主要是课外阅读,还是会与校内课本相结合,哪个占比较大?

赵梓淳:我们的阅读不与课本有那么强的挂钩,其中一部分阅读是跟老师布置的作业相关的阅读,非作业的模块是海量阅读,目的主要是培养孩子的阅读兴趣。

爱分析:通过考拉阅读布置作业,和教师通过其它工具布置作业有什么区别吗?

赵梓淳:我们对孩子做了测评,了解每个孩子阅读能力值,知道孩子背后的技能缺失点。这样在留作业的时候,老师给每个孩子留的是适合他阅读能力范围之内的作业,而且批卷子也是自动批,这都依赖于我们长时间的底层核心技术的积累,否则没有办法布置这样的作业。

爱分析:为学校提供的支撑服务有哪些?

赵梓淳:我们会以线上和线下相结合的方式为客户提供帮助,我们的运营团队会定期开展一些教育活动,及时与老师进行沟通,在线实时解答老师的问题,同时相近区域的学校举办相应的线下培训,增加老师的互动和经验交流,更好的提高客户粘性。

爱分析:商业化的探索有哪些发现?

赵梓淳:商业化还在内部探索中,B端的变现我们已经探索过了,C端的变现也有了比较清晰的路径想法,学校和家长都是能接受付费的。但这不是我们现阶段的战略重点,目前还是完善产品,拓展学校渠道,将我们的智能阅读体系推向更多的学生和家长,更快的建立考拉阅读在大语文赛道的品牌认知度和影响力,帮助下一代孩子养成优质的阅读习惯。