摘要:音乐笔记致力于用技术取代广义教育测评领域的低效重复劳动,并以钢琴测评为切口,面向C端提供机器叠加真人的在线陪练服务。

音乐笔记是一家渗透传感器、图像识别等AI技术的教育服务公司,致力于用技术取代广义教育测评领域的低效重复劳动,并以钢琴测评为切口,面向C端提供机器叠加真人的在线陪练服务。

从传感器到图像识别 智能测评场景广阔

音乐笔记成立之前,团队主要做传感器在运动培训领域的应用。在此技术基础上,2015年,音乐笔记面世的初代产品是一款智能腕带,由内嵌传感器捕捉钢琴演奏者腕部和手臂运动,结合算法软件反馈其动作、指法等是否规范。

2016年起,为解决钢琴评测中更为核心的音准、节奏的纠错校准,团队开发出基于图像识别技术,实现智能评测的软硬件解决方案。

使用时,用户将专属摄像头置于琴身上部用于拍摄琴键界面,将摄像头与pad连接后,弹奏过程图像将实施传输至终端,经过图像算法处理,与内置标准曲谱比对后,评测结果以毫秒级反馈至屏幕。

这一垂直应用于钢琴评测的产品已打磨成熟,由OEM供应智能硬件,面向2B琴行、代理商、机构和2C家庭消费者直接输出。去年,公司和全球最大钢琴厂商珠江钢琴已达成数千万订单的合作。

团队在底层技术的积累,已沉淀为可对外输出的智能测评解决方案,应用于各大考评场景。比如,在近期与其战略投资方ATA(全美在线)合作中,部署了基于动作图像识别的考试机器人,可替代监考教师,支持考场防舞弊行为。

未来,这一技术还可应用到音乐、美术、舞蹈等其他领域的考级场景中,辅助人力专家评审。而在考试刚需带动下,机器参与的测评活动,有机会延伸到更加高频的日常练习环节。

AI加持在线陪练 师资效能可极大提

从这套以技术驱动的评测方案出发,2017年,团队开发了智能钢琴教室,引入陪练教师在线同步辅导,推出家庭场景下的在线一对一真人陪练服务。

陪练采用“教师+AI”模式。进入在线教室后,通过外置摄像头、pad前置摄像头,师生两端的音视频演奏场景双向可视。遇到网络环境不佳、音视频丢帧时,教师这一端还可以在机器测评结果的辅助下,判断出有学生有无音准和节奏错误,节省不必要重来。

在线陪练的运营、服务属性偏重,对技术型团队是个考验,但变革在线一对一模式,挖掘教师效能最大化,恰恰能凸显技术发挥的空间。

基于硬件和算法的智能测评系统,已经能精准解决音准、节奏、手指力度等陪练核心需求,替代传统陪练教师80%以上工作,为提升教学效果,降低师资成本,扭转一对一不良财务模型提供可行性。

在线陪练服务从去年底推出,半年多来,累计招生数千人,续费情况良好。目前,通过技术和教研改良后的1对多模式正在小范围测试,顺利的话将在未来一年内规模化推广。

近日,音乐笔记创始人闫文闻接受爱分析专访,就公司业务、运营、战略等进行了深入对话,摘取部分内容分享如下。

AI专业判断可取代教师 识别精度高达99.5%

爱分析:公司发展的内在业务逻辑?

闫文闻:基于团队在信号处理、软硬件结合方面的技术基因,我们最早创业就是围绕传感器及不同场景的应用展开,通过机器与真人结合提供服务,机器会替代其中重复性的部分,从而达到远超纯人力的服务能力和效率。

沿着硬件研发-叠加场景-叠加服务的演化路径,我们寻找客单价比较高、市场规模比较大的领域切入。

在教育领域的切口就是测评。去年我们完成了硬件传感器销售,和全球最大的钢琴生产厂商珠江钢琴合作,实现几千万收入。在这个基础之上,我们又开发了测评服务,然后加入真人互动,形成了提供教学服务的在线陪练业务。

爱分析:机器评测的精度能达到什么水平?

闫文闻:作为一个严肃的学习产品,要达到98%、99%的识别精度才能满足应用级别。最初我们采用音频分析,但本身技术特性导致精度很难做到产品级,后来我们加入了视觉,通过图像识别的算法对音准、节奏、手指下降速度这些维度进行识别和判断。

爱分析:图像处理过程在哪里完成?

闫文闻:算法都在pad里完成。这也是AI领域的典型趋势,把算法写在本地终端里,用户体验和反馈速度会变得更好。

爱分析:内置素材库是自有版权吗?

闫文闻:内置2万多曲谱都是我们自己打谱的,所有的示范演奏音视也是我们邀请了40多位雅马哈、珠江的钢琴家艺术家录制的。

爱分析:在线陪练1对多怎么实现?难点在哪?

闫文闻:传统依靠老师对声音产生判断,肯定无法1对多。但我们把算法写到本地,每个孩子手里其实相当于拿到一个答题器,就像上数学课一样,老师直接看到结果,就不用听了。而以往的在线陪练,学生一遍遍弹,老师一遍遍听,恰恰占用最长时间。

而且在线一对多支持多个孩子一起,相互间有pk,更能激发他的兴趣。

解决1对多,技术不是最大的难点,但涉及到的服务体系、用户报告解读、教师的标准化上课流程等都需要相应调整。现在还处在实验阶段,大概有一百人左右的学生在测试。

爱分析:技术未来能完全取代在线陪练教师吗?

闫文闻:对于技术驱动的公司,机器取代人工是我们的终极目标。而且陪练这一应用场景天然很收敛,而且需要不断重复,所以是非常适合机器的。

但每个领域都有进化的过程,就像无人驾驶的level1-level5.我们前期通过数据积累、标准化流程的打磨,认为可能在未来12个月的窗口期内,将80-90%的人力劳动交给机器,这个阶段保守估计,大概能达到level4。

我们现在已经有课程在以趋近与level4的方式进行。机器承担所有的专业性判断,教师主要负责结果反馈、激励、监督等。

爱分析:智能测评技术在其他领域是如何落地的?

闫文闻:我们年底会推出其他学科的测评产品,并与考级单位、权威测评机构达成深度合作。对于他们而言,诉求在于解决专家人力成本的问题。这其中机器可以发挥的作用在于,前期把测评内容采集回来,并在评审阶段做辅助评判。

往后当机构采用了我们的测评算法,延伸到C端会成为他们的练习工具。简单来说,考试如果要求用2B铅笔,平时练习肯定也会需要。

在线陪练主打增量市场 技术变革想象空间巨大

爱分析:目前营收主要来源?

闫文闻:硬件部分,现阶段和多家琴行合作,每年靠销售设备就有几千万收入,而且利润率不错。一对一陪练刚刚起步,师资和获客成本还很难打平。

但如果采用1对多,供给端的成本降低到1/3以上,肯定能跑出利润,规模也自然能做很大,因为成本结构被完全改变了,我的服务模式、销售模式都会有很大变化,升级整个行业。

爱分析:未来对硬件、技术输出、在线陪练几块业务如何布局?

闫文闻:硬件会带来比较稳定的收入,而且有较高利润率。如果没有加入教学服务的业务,我们现在作为一家AI公司已经实现盈利了。

但从收入规模上来讲,陪练这块肯定会增长的速度会更快,每年预收款,商业模式好。

对外输出会存在两种模式,一是提供持续性服务,二是在机构经费充足情况下,也会考虑将技术买断。

爱分析:怎么预测在线陪练的市场规模和行业增速?

闫文闻:三分学七分练,学的市场大概有七百个亿,练的市场原本是空白,现在刚刚有几家冲进来,我认为至少有一千个亿以上规模,从0到3-5%的渗透率在增长,速度很快。

学钢琴的核心就在于练,每周上一次课,回家练五天,如果你练不下去,也基本意味着学不下去了。

爱分析:行业里还有哪些其他模式?

闫文闻:主流机构本质上都是VIPKID模式,组织大规模老师上课,一对一在线沟通。

而我们的模式,用户体验和其他同行差异很大。第一,我们是音视频双向四路沟通,有些可能只有音频,没有视频。

第二,我们的机器能更多替代人的重复性、专业性判断,到目前没有任何一家的产品能实现。

爱分析:技术对行业的变革方向?

闫文闻:首先,从流动性角度,技术是仅次于资本的。团队有一半以上是工程师,用三年多时间,形成了三十多项发明专利。接下来,我们会基于在图像识别领域的优势,发挥到考试、考评等更多场景。

第二,对于在线陪练,我们会通过机器极大提升供给端生产力,使成本有进一步压缩,有机会让在线一对一钢琴陪练变得有利润。

其实现在市场上各类一对一,天然就是在冲规模,而不是在冲利润。我们就是要通过技术手段降成本,随着行业越来越火,技术会越发有价值。