摘要:考拉阅读打造首套中文分级阅读标准

建立中文分级阅读标准,考拉阅读的野心不止校内市场 | 爱分析访谈-爱分析

调研 | 张扬 东起

撰写 | 东起

2016年成立的享阅教育选择了一条新赛道——中文分级阅读

中文分级阅读赛道几乎还没有开启,其中一个主要原因在于中文本身的复杂程度,使评测体系难于建立。享阅教育创始人赵梓淳介绍,中文分级阅读的难点主要在于三点:一是汉字数量庞大,对于英语基础组成的26个字母,中文常用汉字约有3500个;二是分词,中文没有天然的分词界限,如何分词影响词频,进而关系到难度的定义;三是句法,中文句法结构随性,增加了分析难度。

考虑到使用传统语言学加统计学的方法需要大量的时间、人力和物力,享阅教育通过机器学习的方式搭建中文阅读分级标准。

解决这一技术难题,依赖于享阅教育一支极为“性感”的核心技术团队,CTO任易博士毕业于北京大学,曾在IBM、搜狐大数据部门和微软亚洲研究院工作,有多年数据挖掘经验,首席数据科学家Jake Zhao,师从人工智能“大牛”Yann LeCun教授。

目前,享阅教育已构建起自己的中文分级量化标准(ER Framework),从字词句段篇五个维度,以及下面更细分的几十维特征,对中文文本进行分级。

基于底层技术,享阅教育目前有3款产品:阅读能力测评、考拉阅读和中文分级阅读标准。目前,公司的商业模式主要是To B,为学校提供以上3款产品:阅读能力测评面向学生,提供测评和结果分析报告;考拉阅读包括学生端、家长端、教师端和校长端,教师可以通过软件为学生布置个性化的阅读任务,学生在线上或线下阅读、通过软件完成练习并留下学习数据;中文分级阅读标准则是所有产品的基础。目前,To B产品根据用户数按年收费。建立起品牌背书后,公司也将向C端拓展。

相对于国内,美国分级阅读市场已经十分成熟,其原因主要在于三点,一是社会对于阅读的重视程度较高,二是技术积累,例如被广泛使用的蓝思分级标准已经有30年积累,三是英文的特点和语言学研究积累。据赵梓淳介绍,Renaissance,Newsela和Lightsail等公司都已经得到市场认可。

随着用户意识转变,中文分级阅读市场将逐渐走向成熟,而自主搭建了底层标准的考拉阅读,已经在市场中占得先机。

赵梓淳先后在芝加哥大学和哥伦比亚大学获得硕士学位,是连续创业者。近日,赵梓淳和爱分析分享了对行业和公司商业模式的思考,现节选部分内容,供大家参考。

建立中文分级阅读标准,考拉阅读的野心不止校内市场 | 爱分析访谈-爱分析

爱分析:创业之初,对市场如何判断?

赵梓淳:阅读在美国是特别大的产业,无论重视程度还是产业支持都很好,其中分级阅读领域比较亮眼的公司有Renaissance,Newsela和Lightsail。

Renaissance1984年成立,曾拿到Google Capital的4000万美金融资,2014年以10亿美金被收购。公司产品线很丰富,有用于测评的Star Assessment,通过20-30分钟的测试,将孩子的阅读能力量化,判定问题所在,用数据驱动教育发展;有承接测评产品的Accelerated Reader,通过他们自己的一套分级体系测出文本阅读难度,与之前测评的学生阅读能力匹配,保证学生读到最适合自己的文字。

Newsela做新闻分级阅读,B轮是扎克伯格投资,累计融资2600万美金。公司的底层标准是用蓝思分级,核心技术点是有一部分机器辅助新闻改写,同样的主题以不同的阅读难度提供给相应理解能力的孩子;产品大概已经覆盖美国70%以上的公立学校,每所学校收取4000-7000美金。

Lightsail做iPad端的个性化图书馆,B轮是亚马逊创始人Bezos投资,累计融资超过4000万美金。它也是基于蓝思分级,可以在线看书是跟其他机构最大的区别;在中国通常是跟相对高端的辅导班以及国际学校合作。

在美国,分级阅读市场其实已经很成熟。相比来看,国内之前有公司在做分级阅读,但是没做起来,这条赛道基本上没有开启。

因为无论什么样的公司做,其实背后都要有底层标准做支撑,去评估、测量出文本阅读难度。国内迟迟没有开展,是因为缺乏中文阅读评级标准。

爱分析:这个难点在哪?

赵梓淳:首先最大的问题是中文太复杂,传统统计学加语言学的方法有些无能为力。

第一方面是汉字数量多,英语基础组成是26个字母,但中文最常用汉字大概3500个,中华辞海收录的汉字超过8万个,这导致了复杂构成的稀缺性,使我们分析汉语的时候需要更庞大的语料库。

第二方面是分词,英语有天然的分词界限,但中文其实是模糊的,如何分词会极大影响最后对难度的理解。

第三方面是句法,英语句式有先行词和严谨的句法结构,更便于分析语法树和嵌套深度等,但中文其实很松散,结构很随性,这都导致了更大的分析难度。

当时跟很多教授沟通,他们说如果用传统统计学加语言学的方法做这件事情,大概需要10-20年。

建立中文分级阅读标准,考拉阅读的野心不止校内市场 | 爱分析访谈-爱分析

爱分析:考拉阅读是怎么做的?

赵梓淳:我跟合伙人任易博士在做这件事的时候,也受到Google Translation的一些启发,通过机器学习来实现。因为直接用深度学习的问题在于没有那么大量的数据,从语料库到学生行为数据等,国内都是一片空白,其实整个都是我们在搭建。

首先,我们打造了大概几百万字的非平衡语料库,主要取材于各种语文教材。语言学家洪明教授和来自人民日报的十几个人组成的标注团队,从字词句段篇五个维度、几十维特征,给文本进行标注。

第二步,用机器学习方法去学习这个语料库中专家打标签的规则,其实这也得益于现在技术的发展,现在有大概处理了几亿次的一个平衡语料库。

再下一步要得出分数,像英语主要考察词频和句长两个特征,它们用手写规则就可以得出公式,但在中文里这两点其实都不太靠谱,所以我们最后需要几十维特征来表征中文的阅读难度,把大概将近五十维的特征,拟合进AI系统,最后得出从200-1300ER的分值。

随着产品层面的数据越来越多,可以反向校准这个标准,类似于AlphaGo,实现自我进化。

这也是我们这套系统相比于英文分级系统的一大优势。

爱分析:K12领域做语文的比较少,是不是也是因为这个技术原因?

赵梓淳:对,K12主要做的就是数学和英语,因为语文无从抓起,没有任何的抓手,传统的话或者是线下培训班,或者是为语文老师提供教案、视频或微课等。但如何通过数据驱动语文教育,提升阅读能力,其实是没有先例的。

我们在做的,就是将本没有被收集的海量语文学习数据进行捕捉、整合以及分析,把语文学习变成自适应学习的过程。

爱分析:现在考拉阅读的分级系统进展如何?

赵梓淳:现在我们打造出了第一套中文分级量化标准,与Yann LeCun教授等行业内专家沟通过,大概可以达到93%的精度。

爱分析:给学校提供的产品包括哪些?

赵梓淳:首先就是考拉测评,从各个维度考察孩子的阅读能力,生成测评报告提供给学校、班级和老师。

我们现在测评了将近十万名学生,覆盖一线城市到四线城市,得到了中国学生阅读能力第一份量表。我们不但能测出学生的阅读能力水平,还能测出背后哪个技能点有欠缺。

爱分析:对孩子的测评结果如何与文本分级标准对应?

赵梓淳:需要用数学模型,将两者拟合进一个体系,使测评分值和ER值对应。同时,还需要大量的实证性研究。

这部分验证研究是测量心理学专业的李国超博士负责。学界做分级阅读主要是认知心理学和语言学专业的人,认知心理学其实一直在做这件事情,之前主要研究方向是测孩子的阅读认知障碍,以及对其的干预,设计各种实验测量信度、效度等。

爱分析:进校产品在测评之外还有?

赵梓淳:考拉阅读,包括学生端、教师端、家长端和校长端四个端口。

通过老师端,老师可以根据每个人的最适发展趋势一键布置阅读任务。目前考拉阅读有几千本课外书,每本书后面有30-100道题目,验证学生是否读懂。另外还有朗读任务,帮孩子纠正读音。

公司的人工智能主要应用在三个层面,一是打造底层分级标准,二是自适应学习系统,就是学生端的自学功能,根据阅读能力推荐相应内容,三是智能语音,在老师和家长没那么多时间的情况下,帮助孩子解决读音问题。

爱分析:基于现在的产品体系,对于商业模式有哪些规划?

赵梓淳:首先是To B,通过To B建立品牌背书;To B站稳后,这条赛道基本就关闭了。

第二步是2C,我们其实是天然适合2C的,阅读产品并不像背单词和学数学,孩子每天晚上要听睡前故事,是客观存在的场景。如何让阅读变得更有乐趣,让孩子读到他们能读懂的东西,获得成就感,从而建立激励体系,这是我们要做的事情。