摘要:「爱分析 | iTalk 」第21期文字精华版新鲜出炉~

分享 | 杨洋

整理 | 京京

嘉宾简介:创办iPIN前,杨洋曾在美国国家旅游与电子商务实验室(NLTeC)从事搜索引擎研究,曾师从世界著名信息科学家Rajiv Banker和Pei-yu Chen从事多年大规模众包集智数据分析和研究。

公司简介:iPIN是国内依靠认知计算提供智能情报分析和信息匹配的典型代表,目前已经在招聘、法律、建筑等领域实现商业化落地。

3月9号,「爱分析 | iTalk 」第21期邀请iPIN创始人&CEO杨洋先生做客iTalk栏目,跟爱分析的读者们进行互动交流,现将文字精华版整理如下:

Q:认知计算和机器学习一样吗?如何区分?

A:关于认知计算的概念在学术上是有争议的,因为涉及到什么是认知的问题,认知又涉及到好多学科,比如心理学、社会学、神经学以及信息学等等交叉学科。

认知计算分为以下几块,一是认知是人类的事情,如果你关注人的话,就要像人那样去思考问题。二是属于模拟,让计算机模拟人的思考方式。三是尝试搞懂大脑对于信息怎么处理。

目前我们公司做的认知计算是很简单的,因为我们要解决的是商业分析的问题。所以我们模拟人对信息处理的全过程。其实认知计算和机器学习没有必要区分,因为认知智能是人工智能的第三层级,它更多属于对抽象信息的理解、分析和决策。

Q:深度学习需要做大量训练,认知分析在计算量上和深度学习是一个量级吗?

A:我觉得没有什么好比较的,因为认知分析依然是用大量的深度学习做的,其实认知最关键的点,不是在于用不用深度学习,而是在于如何将抽象的东西,变成可以计算的数字化。

比如当我说到“爱分析”这三个字的时候,大家脑海里一定是联想出来各自理解的爱分析,如何用数字刻画这些东西,然后再去做深度学习,这个才是最难的点。

所以计算量是非常大的,这就涉及到自然语言理解的一个难点了。目前自然语言理解可以说人工智能的一个天花板吧。

图像本来是数字的,声音如果用录音笔录下来,那它也变成数字的了。但是文字就不一样,比如你写了3个字“爱分析”,它是抽象的,它背后所代表的含义根本就不是这三个字。中国有大量的AI公司,在用深度学习做图像和声音,但是做文字的就少的可怜,不做的原因难就难在这。

Q:iPIN目前跟高校合作主要集中在高考志愿这块,未来的重点是什么?认知计算能够帮助高校新生在入学第一年就根据自己喜好和能力,建立未来四年的学习库以及知识体系吗?

A:目前中国在推进新高考,生涯规划这块必然是iPIN很重要的部分。因为iPIN的愿景是辅助人或辅助企业的成长。在人的成长这一块,是帮你规划未来的东西,这块分为教你计划自己,同时也要教你怎么提升自己。

高校新生在入学第一年就根据自己的喜好和能力,建立未来四年的学习库以及知识体系,这块也是我们在做的,简单的来说分为四大块,一是我适合做什么;而是我喜欢做什么;三是我擅长做什么;四是我怎么养活自己。

根据以上说的四个来确定自己的职业发展目标,然后我们可以辅助他找到达到目标的人生捷径,想要达到这个人生捷径,中间肯定会涉及到学习的过程,这块又涉及到跟生涯规划相辅相成的学习规划。

其实学习规划就是自适应学习的部分,也就是“AI+教育”,是目前非常热的一块,很多教育公司都在做自适应学习这块,这应该是未来对整个教育行业最大的一个颠覆。

跟高校的合作的话,不仅仅是高考志愿填报,因为高考志愿填报只是进入高校的开始,大学这部分就有很多地方,比如招聘、教学体系的评估等等。

iPIN创始人&CEO杨洋:认知计算的未来应用 | iTalk-ifenxi

Q:认知分析在教育领域的应用除了高考志愿填报,在k12教育体系中还有哪些应用呢?

A:iPIN最开始并不想渗透教育领域,我们就想分析人以及人的发展,高考志愿填报正好就是属于一个职业跟教育挂钩的连接点,所以很多人把我们分在了“AI +教育”的公司。

生涯规划是非常大的一块,这是国家政策导向的。但同时自适应学习这块是未来非常颠覆的一块,Newton在国外已经成气候,百度的作业帮在国内做得比较强,我也看到很多公司,有的是在做自动解题、搜题,但搜题的门槛技术并不高。

回到自适应学习这块,我非常赞同Google原来的CEO说过的一句话,未来的教育会像玩游戏一样,而不会是一个苦逼的过程。其实是已经把自适应学习分为三大类,一个是通过做题,然后我对你掌握的知识点的精度广度做精准定位,然后再去判断接下来我该个性化的给你下一道题去帮你提升;二是通过相同的练习题,对一些老的知识点做巩固,三是把做题的过程游戏化。

Q:您认为认知分析技术本身还存在哪些问题?在应用落地上还有哪些困难?

A:认知分析不是一个纯工程问题,它是交叉的学科。从事研究这方面的学者很少,说实话我也是误打误撞。

我们现在能够解决一般的通用认知问题,但是在很专业的认知上,数据量还太少,理解的不深。

在应用落地上,比如法律那个问题的话,就体现的比较明显。比如我们做高考志愿,做招聘。一般人都比较容易理解,但是做法律这块我们就遇到了很大的天花板。做出来的结果自己根本无法判断是对还是错,机器学习是需要依赖反馈的,没有反馈没法往下做。

认知分析需要应用到专业领域的话,就一定需要认知分析科学家,再结合行业专家一起完成。所以这是目前我们在做很多专业领域,要花很长时间去跟对方沟通和了解,专业领域一些非常特别的问题,尝试去搞懂背后的逻辑,然后再去学习,才能学得好。

Q:认知计算未来在法律领域的应用前景如何?在决策一个案件过程中起着什么作用?

A:最近有篇文章,可能大家都看到了,文章里提到人工智能第一个干掉的就是律师。这话我觉得说的有点夸张,但在助理律师这个层面上,人工智能确实是已经做得不错了,我们平台调出的已经能够解析大量的法律文书,能够将文书拆解,把核心部分提取出来。

至于未来前景如何,这块是非常明朗的。原因在于法律是一套强逻辑体系,未来的法官严格执法的话,那就干脆用机器人来执法好了,它是绝对不会法外开恩的,所以从这个层面来讲,是非常适合机器人来做的·。

不过话又说回来,人工智能在逻辑上还是存在很多问题。虽然法律是个强逻辑,但是目前人工智能对于逻辑的理解,还有很多方向、不同的方法在做。我们也是选择其中一种方法在做,采取跟行业专家把复杂的情况,拆分成很多人理解的过程,再去串联。我们要求机器人在每个过程判断的准确率至少在95%以上,这样串联的结果是比较准。

为什么准确率是95%呢,其实人在很多场景下的判断准确率大概就是95%。如果低于这个,那就是比人差,如果高于这个,串联起来就做的比人好。

iPIN创始人&CEO杨洋:认知计算的未来应用 | iTalk-ifenxi

Q:认知计算除了进行信息匹配和辅助决策,还能用来做哪些事情呢?

A:认知其实就是模拟人对信息处理的过程,所以认知最大的好处,就是能够模拟将人处理信息的过程。所以认知计算除了信息匹配和辅助决策还能用来做点别的事,基本上人做的事情,有相当一部分除了感知智能,就是认知智能在做这个事情。可以说这个业务面是非常广的。基本上任何一个行业都存在分析,比如说医疗诊断,Watson就是在做这块,其实他做的是专家系统。

Q: Watson将认知计算用于医疗领域,并且已经开始在中国落地,国内公司在这方面您认为还有哪些机会呢?

A:Watson是在杭州吧,有一个合作方尝试落地医疗,不过听说在实际的落地过程中遇到很多问题,包括Watson自己从医疗往别的领域切的时候,其实它的系统就遇到了通用性问题,由于他们早期是专家系统的底子,专家系统想往别的领域切的话,难度是非常大的,所以他们需要先将自己从专家系统变成真正的基于认知智能的系统,这个是他们需要付出成本的,另外更大的障碍是,Watson在美国服务美国政府,在中国想要服务政府,这块几乎是不可能的。

我自己认为中国的人工智能的水平,其实跟美国差距是不大的。上个月去美国开AAAI的会议,中国的学者参会人数大概在整体的参会人数的60%,所以中国在人工智能这方面的人才储备可以说是非常多的。

有几个原因,一是中国留学生的人数庞大,二是中国人的数学很好,三是在人工智能的学术发起,相对来讲比较开放,所以它特别适合中国人。

但是中国分析类的优秀人才是非常少的。如果你想进入认知这一块的话,需要学术上有交叉的综合背景,可能绝大多数做人工智能的学者很难在短期转过去的,尤其随着深度学习的门槛降得越来越低,我觉得中国的学者应该努力提升自己在分析这块的实践应用能力。

理论知识要有,同时要接触真实的案例分析的背景,然后再配合认知智能的东西,我觉得就会做得比较出色。

Q:国内有一些做大数据分析的公司,服务于精准营销、风控等领域,大家在技术上有差别或者差别大吗?

A:在精准营销这块我是有涉猎的,因为我原来跟广告公司打过交道,包括现在我们做些项目也是属于精准营销。

首先是在不同的公司里,他们都有自己的独家数据,说实话有些独家数据真的是非常有价值的,比如一些供应链的数据、今日头条等等这些独有的数据。

然后是分析的方法,这块就要看分析人的个人能力了。同样的数据,好的分析师和普通的分析师差距还是蛮大的。

风控领域并不是我擅长的方向,尤其是在金融保险方向,原来也因为好奇看过这方面分析的方法论,这种经典模型我没搞明白怎么回事,但是用AI也基本能够算的差不多,如果简单用来做风控预测的话,其实我觉得是AI类的这种技术是够了。