iPIN创始人&CEO杨洋：认知计算的未来应用-爱分析

嘉宾简介：创办iPIN前，杨洋曾在美国国家旅游与电子商务实验室（NLTeC）从事搜索引擎研究，曾师从世界著名信息科学家Rajiv Banker和Pei-yu Chen从事多年大规模众包集智数据分析和研究。

公司简介：iPIN是国内依靠认知计算提供智能情报分析和信息匹配的典型代表，目前已经在招聘、法律、建筑等领域实现商业化落地。

3月9号，「爱分析 | iTalk 」第21期邀请iPIN创始人&CEO杨洋先生做客iTalk栏目，跟爱分析的读者们进行互动交流，现将文字精华版整理如下：

Q：认知计算和机器学习一样吗？如何区分？

A：关于认知计算的概念在学术上是有争议的，因为涉及到什么是认知的问题，认知又涉及到好多学科，比如心理学、社会学、神经学以及信息学等等交叉学科。

认知计算分为以下几块，一是认知是人类的事情，如果你关注人的话，就要像人那样去思考问题。二是属于模拟，让计算机模拟人的思考方式。三是尝试搞懂大脑对于信息怎么处理。

目前我们公司做的认知计算是很简单的，因为我们要解决的是商业分析的问题。所以我们模拟人对信息处理的全过程。其实认知计算和机器学习没有必要区分，因为认知智能是人工智能的第三层级，它更多属于对抽象信息的理解、分析和决策。

Q：深度学习需要做大量训练，认知分析在计算量上和深度学习是一个量级吗？

A：我觉得没有什么好比较的，因为认知分析依然是用大量的深度学习做的，其实认知最关键的点，不是在于用不用深度学习，而是在于如何将抽象的东西，变成可以计算的数字化。

比如当我说到“爱分析”这三个字的时候，大家脑海里一定是联想出来各自理解的爱分析，如何用数字刻画这些东西，然后再去做深度学习，这个才是最难的点。

所以计算量是非常大的，这就涉及到自然语言理解的一个难点了。目前自然语言理解可以说人工智能的一个天花板吧。

图像本来是数字的，声音如果用录音笔录下来，那它也变成数字的了。但是文字就不一样，比如你写了3个字“爱分析”，它是抽象的，它背后所代表的含义根本就不是这三个字。中国有大量的AI公司，在用深度学习做图像和声音，但是做文字的就少的可怜，不做的原因难就难在这。

Q：iPIN目前跟高校合作主要集中在高考志愿这块，未来的重点是什么？认知计算能够帮助高校新生在入学第一年就根据自己喜好和能力，建立未来四年的学习库以及知识体系吗？

A：目前中国在推进新高考，生涯规划这块必然是iPIN很重要的部分。因为iPIN的愿景是辅助人或辅助企业的成长。在人的成长这一块，是帮你规划未来的东西，这块分为教你计划自己，同时也要教你怎么提升自己。

高校新生在入学第一年就根据自己的喜好和能力，建立未来四年的学习库以及知识体系，这块也是我们在做的，简单的来说分为四大块，一是我适合做什么；而是我喜欢做什么；三是我擅长做什么；四是我怎么养活自己。

根据以上说的四个来确定自己的职业发展目标，然后我们可以辅助他找到达到目标的人生捷径，想要达到这个人生捷径，中间肯定会涉及到学习的过程，这块又涉及到跟生涯规划相辅相成的学习规划。

其实学习规划就是自适应学习的部分，也就是“AI+教育”，是目前非常热的一块，很多教育公司都在做自适应学习这块，这应该是未来对整个教育行业最大的一个颠覆。

跟高校的合作的话，不仅仅是高考志愿填报，因为高考志愿填报只是进入高校的开始，大学这部分就有很多地方，比如招聘、教学体系的评估等等。

Q：认知分析在教育领域的应用除了高考志愿填报，在k12教育体系中还有哪些应用呢？

A：iPIN最开始并不想渗透教育领域，我们就想分析人以及人的发展，高考志愿填报正好就是属于一个职业跟教育挂钩的连接点，所以很多人把我们分在了“AI +教育”的公司。

生涯规划是非常大的一块，这是国家政策导向的。但同时自适应学习这块是未来非常颠覆的一块，Newton在国外已经成气候，百度的作业帮在国内做得比较强，我也看到很多公司，有的是在做自动解题、搜题，但搜题的门槛技术并不高。

回到自适应学习这块，我非常赞同Google原来的CEO说过的一句话，未来的教育会像玩游戏一样，而不会是一个苦逼的过程。其实是已经把自适应学习分为三大类，一个是通过做题，然后我对你掌握的知识点的精度广度做精准定位，然后再去判断接下来我该个性化的给你下一道题去帮你提升；二是通过相同的练习题，对一些老的知识点做巩固，三是把做题的过程游戏化。

Q：您认为认知分析技术本身还存在哪些问题？在应用落地上还有哪些困难？

A：认知分析不是一个纯工程问题，它是交叉的学科。从事研究这方面的学者很少，说实话我也是误打误撞。

我们现在能够解决一般的通用认知问题，但是在很专业的认知上，数据量还太少，理解的不深。

在应用落地上，比如法律那个问题的话，就体现的比较明显。比如我们做高考志愿，做招聘。一般人都比较容易理解，但是做法律这块我们就遇到了很大的天花板。做出来的结果自己根本无法判断是对还是错，机器学习是需要依赖反馈的，没有反馈没法往下做。

认知分析需要应用到专业领域的话，就一定需要认知分析科学家，再结合行业专家一起完成。所以这是目前我们在做很多专业领域，要花很长时间去跟对方沟通和了解，专业领域一些非常特别的问题，尝试去搞懂背后的逻辑，然后再去学习，才能学得好。

Q：认知计算未来在法律领域的应用前景如何？在决策一个案件过程中起着什么作用？

A：最近有篇文章，可能大家都看到了，文章里提到人工智能第一个干掉的就是律师。这话我觉得说的有点夸张，但在助理律师这个层面上，人工智能确实是已经做得不错了，我们平台调出的已经能够解析大量的法律文书，能够将文书拆解，把核心部分提取出来。

至于未来前景如何，这块是非常明朗的。原因在于法律是一套强逻辑体系，未来的法官严格执法的话，那就干脆用机器人来执法好了，它是绝对不会法外开恩的，所以从这个层面来讲，是非常适合机器人来做的·。

不过话又说回来，人工智能在逻辑上还是存在很多问题。虽然法律是个强逻辑，但是目前人工智能对于逻辑的理解，还有很多方向、不同的方法在做。我们也是选择其中一种方法在做，采取跟行业专家把复杂的情况，拆分成很多人理解的过程，再去串联。我们要求机器人在每个过程判断的准确率至少在95%以上，这样串联的结果是比较准。

为什么准确率是95%呢，其实人在很多场景下的判断准确率大概就是95%。如果低于这个，那就是比人差，如果高于这个，串联起来就做的比人好。

Q：认知计算除了进行信息匹配和辅助决策，还能用来做哪些事情呢？

A：认知其实就是模拟人对信息处理的过程，所以认知最大的好处，就是能够模拟将人处理信息的过程。所以认知计算除了信息匹配和辅助决策还能用来做点别的事，基本上人做的事情，有相当一部分除了感知智能，就是认知智能在做这个事情。可以说这个业务面是非常广的。基本上任何一个行业都存在分析，比如说医疗诊断，Watson就是在做这块，其实他做的是专家系统。

Q： Watson将认知计算用于医疗领域，并且已经开始在中国落地，国内公司在这方面您认为还有哪些机会呢？

A：Watson是在杭州吧，有一个合作方尝试落地医疗，不过听说在实际的落地过程中遇到很多问题，包括Watson自己从医疗往别的领域切的时候，其实它的系统就遇到了通用性问题，由于他们早期是专家系统的底子，专家系统想往别的领域切的话，难度是非常大的，所以他们需要先将自己从专家系统变成真正的基于认知智能的系统，这个是他们需要付出成本的，另外更大的障碍是，Watson在美国服务美国政府，在中国想要服务政府，这块几乎是不可能的。

我自己认为中国的人工智能的水平，其实跟美国差距是不大的。上个月去美国开AAAI的会议，中国的学者参会人数大概在整体的参会人数的60%，所以中国在人工智能这方面的人才储备可以说是非常多的。

有几个原因，一是中国留学生的人数庞大，二是中国人的数学很好，三是在人工智能的学术发起，相对来讲比较开放，所以它特别适合中国人。

但是中国分析类的优秀人才是非常少的。如果你想进入认知这一块的话，需要学术上有交叉的综合背景，可能绝大多数做人工智能的学者很难在短期转过去的，尤其随着深度学习的门槛降得越来越低，我觉得中国的学者应该努力提升自己在分析这块的实践应用能力。

理论知识要有，同时要接触真实的案例分析的背景，然后再配合认知智能的东西，我觉得就会做得比较出色。

Q：国内有一些做大数据分析的公司，服务于精准营销、风控等领域，大家在技术上有差别或者差别大吗？

A：在精准营销这块我是有涉猎的，因为我原来跟广告公司打过交道，包括现在我们做些项目也是属于精准营销。

首先是在不同的公司里，他们都有自己的独家数据，说实话有些独家数据真的是非常有价值的，比如一些供应链的数据、今日头条等等这些独有的数据。

然后是分析的方法，这块就要看分析人的个人能力了。同样的数据，好的分析师和普通的分析师差距还是蛮大的。

风控领域并不是我擅长的方向，尤其是在金融保险方向，原来也因为好奇看过这方面分析的方法论，这种经典模型我没搞明白怎么回事，但是用AI也基本能够算的差不多，如果简单用来做风控预测的话，其实我觉得是AI类的这种技术是够了。