三次转型的音乐笔记，正将AI融入在线钢琴陪练-爱分析

音乐笔记是一家渗透传感器、图像识别等AI技术的教育服务公司，致力于用技术取代广义教育测评领域的低效重复劳动，并以钢琴测评为切口，面向C端提供机器叠加真人的在线陪练服务。

从传感器到图像识别智能测评场景广阔

音乐笔记成立之前，团队主要做传感器在运动培训领域的应用。在此技术基础上，2015年，音乐笔记面世的初代产品是一款智能腕带，由内嵌传感器捕捉钢琴演奏者腕部和手臂运动，结合算法软件反馈其动作、指法等是否规范。

2016年起，为解决钢琴评测中更为核心的音准、节奏的纠错校准，团队开发出基于图像识别技术，实现智能评测的软硬件解决方案。

使用时，用户将专属摄像头置于琴身上部用于拍摄琴键界面，将摄像头与pad连接后，弹奏过程图像将实施传输至终端，经过图像算法处理，与内置标准曲谱比对后，评测结果以毫秒级反馈至屏幕。

这一垂直应用于钢琴评测的产品已打磨成熟，由OEM供应智能硬件，面向2B琴行、代理商、机构和2C家庭消费者直接输出。去年，公司和全球最大钢琴厂商珠江钢琴已达成数千万订单的合作。

团队在底层技术的积累，已沉淀为可对外输出的智能测评解决方案，应用于各大考评场景。比如，在近期与其战略投资方ATA（全美在线）合作中，部署了基于动作图像识别的考试机器人，可替代监考教师，支持考场防舞弊行为。

未来，这一技术还可应用到音乐、美术、舞蹈等其他领域的考级场景中，辅助人力专家评审。而在考试刚需带动下，机器参与的测评活动，有机会延伸到更加高频的日常练习环节。

AI加持在线陪练师资效能可极大提升

从这套以技术驱动的评测方案出发，2017年，团队开发了智能钢琴教室，引入陪练教师在线同步辅导，推出家庭场景下的在线一对一真人陪练服务。

陪练采用“教师+AI”模式。进入在线教室后，通过外置摄像头、pad前置摄像头，师生两端的音视频演奏场景双向可视。遇到网络环境不佳、音视频丢帧时，教师这一端还可以在机器测评结果的辅助下，判断出有学生有无音准和节奏错误，节省不必要重来。

在线陪练的运营、服务属性偏重，对技术型团队是个考验，但变革在线一对一模式，挖掘教师效能最大化，恰恰能凸显技术发挥的空间。

基于硬件和算法的智能测评系统，已经能精准解决音准、节奏、手指力度等陪练核心需求，替代传统陪练教师80%以上工作，为提升教学效果，降低师资成本，扭转一对一不良财务模型提供可行性。

在线陪练服务从去年底推出，半年多来，累计招生数千人，续费情况良好。目前，通过技术和教研改良后的1对多模式正在小范围测试，顺利的话将在未来一年内规模化推广。

近日，音乐笔记创始人闫文闻接受爱分析专访，就公司业务、运营、战略等进行了深入对话，摘取部分内容分享如下。

AI专业判断可取代教师识别精度高达99.5%

爱分析：公司发展的内在业务逻辑？

闫文闻：基于团队在信号处理、软硬件结合方面的技术基因，我们最早创业就是围绕传感器及不同场景的应用展开，通过机器与真人结合提供服务，机器会替代其中重复性的部分，从而达到远超纯人力的服务能力和效率。

沿着硬件研发-叠加场景-叠加服务的演化路径，我们寻找客单价比较高、市场规模比较大的领域切入。

在教育领域的切口就是测评。去年我们完成了硬件传感器销售，和全球最大的钢琴生产厂商珠江钢琴合作，实现几千万收入。在这个基础之上，我们又开发了测评服务，然后加入真人互动，形成了提供教学服务的在线陪练业务。

爱分析：机器评测的精度能达到什么水平？

闫文闻：作为一个严肃的学习产品，要达到98%、99%的识别精度才能满足应用级别。最初我们采用音频分析，但本身技术特性导致精度很难做到产品级，后来我们加入了视觉，通过图像识别的算法对音准、节奏、手指下降速度这些维度进行识别和判断。

爱分析：图像处理过程在哪里完成？

闫文闻：算法都在pad里完成。这也是AI领域的典型趋势，把算法写在本地终端里，用户体验和反馈速度会变得更好。

爱分析：内置素材库是自有版权吗？

闫文闻：内置2万多曲谱都是我们自己打谱的，所有的示范演奏音视也是我们邀请了40多位雅马哈、珠江的钢琴家艺术家录制的。

爱分析：在线陪练1对多怎么实现？难点在哪？

闫文闻：传统依靠老师对声音产生判断，肯定无法1对多。但我们把算法写到本地，每个孩子手里其实相当于拿到一个答题器，就像上数学课一样，老师直接看到结果，就不用听了。而以往的在线陪练，学生一遍遍弹，老师一遍遍听，恰恰占用最长时间。

而且在线一对多支持多个孩子一起，相互间有pk，更能激发他的兴趣。

解决1对多，技术不是最大的难点，但涉及到的服务体系、用户报告解读、教师的标准化上课流程等都需要相应调整。现在还处在实验阶段，大概有一百人左右的学生在测试。

爱分析：技术未来能完全取代在线陪练教师吗？

闫文闻：对于技术驱动的公司，机器取代人工是我们的终极目标。而且陪练这一应用场景天然很收敛，而且需要不断重复，所以是非常适合机器的。

但每个领域都有进化的过程，就像无人驾驶的level1-level5.我们前期通过数据积累、标准化流程的打磨，认为可能在未来12个月的窗口期内，将80-90%的人力劳动交给机器，这个阶段保守估计，大概能达到level4。

我们现在已经有课程在以趋近与level4的方式进行。机器承担所有的专业性判断，教师主要负责结果反馈、激励、监督等。

爱分析：智能测评技术在其他领域是如何落地的？

闫文闻：我们年底会推出其他学科的测评产品，并与考级单位、权威测评机构达成深度合作。对于他们而言，诉求在于解决专家人力成本的问题。这其中机器可以发挥的作用在于，前期把测评内容采集回来，并在评审阶段做辅助评判。

往后当机构采用了我们的测评算法，延伸到C端会成为他们的练习工具。简单来说，考试如果要求用2B铅笔，平时练习肯定也会需要。

在线陪练主打增量市场技术变革想象空间巨大

爱分析：目前营收主要来源？

闫文闻：硬件部分，现阶段和多家琴行合作，每年靠销售设备就有几千万收入，而且利润率不错。一对一陪练刚刚起步，师资和获客成本还很难打平。

但如果采用1对多，供给端的成本降低到1/3以上，肯定能跑出利润，规模也自然能做很大，因为成本结构被完全改变了，我的服务模式、销售模式都会有很大变化，升级整个行业。

爱分析：未来对硬件、技术输出、在线陪练几块业务如何布局？

闫文闻：硬件会带来比较稳定的收入，而且有较高利润率。如果没有加入教学服务的业务，我们现在作为一家AI公司已经实现盈利了。

但从收入规模上来讲，陪练这块肯定会增长的速度会更快，每年预收款，商业模式好。

对外输出会存在两种模式，一是提供持续性服务，二是在机构经费充足情况下，也会考虑将技术买断。

爱分析：怎么预测在线陪练的市场规模和行业增速？

闫文闻：三分学七分练，学的市场大概有七百个亿，练的市场原本是空白，现在刚刚有几家冲进来，我认为至少有一千个亿以上规模，从0到3-5%的渗透率在增长，速度很快。

学钢琴的核心就在于练，每周上一次课，回家练五天，如果你练不下去，也基本意味着学不下去了。

爱分析：行业里还有哪些其他模式？

闫文闻：主流机构本质上都是VIPKID模式，组织大规模老师上课，一对一在线沟通。

而我们的模式，用户体验和其他同行差异很大。第一，我们是音视频双向四路沟通，有些可能只有音频，没有视频。

第二，我们的机器能更多替代人的重复性、专业性判断，到目前没有任何一家的产品能实现。

爱分析：技术对行业的变革方向？

闫文闻：首先，从流动性角度，技术是仅次于资本的。团队有一半以上是工程师，用三年多时间，形成了三十多项发明专利。接下来，我们会基于在图像识别领域的优势，发挥到考试、考评等更多场景。

第二，对于在线陪练，我们会通过机器极大提升供给端生产力，使成本有进一步压缩，有机会让在线一对一钢琴陪练变得有利润。

其实现在市场上各类一对一，天然就是在冲规模，而不是在冲利润。我们就是要通过技术手段降成本，随着行业越来越火，技术会越发有价值。