iPIN杨洋：现在的AI才两岁半，基本没有智商可言-爱分析

2017年才刚过了两个月，国内就上演了两场人机大战，先是小度判案，后是汪仔答题，机器人的战斗力似乎像越来越强了。

那么，实际情况果真如此吗？机器真的已经能从眼神、听力、智商上秒杀人类了吗？下围棋、识别嫌犯、百科问答，这些技能背后的实现原理到底有多高深？人工智能离超越人类到底还有多远？现在究走到哪一步了？

近期，爱分析在对iPIN创始人兼CEO杨洋进行调研访谈的过程中，无意间获知了关于以上问题的一些“真相”，与您分享如下。

图：iPIN创始人兼CEO杨洋

iPIN是国内依靠认知计算提供智能情报分析和信息匹配的典型代表，它基于庞大的社会经济图谱和认知分析框架，一方面为人和企业的发展提供情报分析，通过完美志愿等生涯规划产品直接服务广大用户，另一方面向各行各业输出大数据分析的标准化技术，提高信息匹配效率，目前已经在招聘、法律、建筑等领域实现商业化落地。（具体可参考爱分析文章《到底什么是AI+？揭开iPIN的神秘面纱 | 公司调研》）

Q：有人说，通用智能需要解决知识表示的问题，而知识表示又依赖知识图谱的成熟，您认同这种观点吗？

A：首先通用智能现在不存在，最后会以怎样的形式存在，我觉得是一个很大的疑问。

知识怎么表示？我们距离通用智能到底有多远？我觉得这里面最大的问题不在于知识图谱，而在于现在AI到底什么地方比人差。

毫无疑问，深度学习解决的最大问题就是在分类计算上能够做得比人好。《最强大脑》上小度所做的事情就是一个图像判断的分类问题，语音识别做的也是分类问题。在这块，机器人已经做得比人好了，这点毋庸置疑。

我们说人工智能，就是希望机器能比人强，那现在它哪点比人弱？其实就在于推理，推理跟知识图谱肯定是相关的，但是推理现在还没解决的一个更重要的问题，是逻辑。

但关键是什么逻辑这个问题就有很多学派。人工智能早期在八九十年代陷入困境，就是因为在逻辑这块突破不了，现在逻辑还是没有突破。那逻辑到底该怎么去克服？这个问题不同学派有不同意见。

拿我自己来说，我自己有两个小孩，他们的出生非常适合我去观察人的学习过程。Baby learning也是人工智能很重要的一个环节，就是看人如何去学习。比如我的儿子是先会叫“爸爸”，然后会叫“妈妈”，但是它叫“爸爸”是需要帮助，叫“妈妈”是饿了，也就是说他叫的时候并不知道什么是“爸爸”，什么是“妈妈”，它对这两个词的理解跟我们是不一样的，只有随着以后沟通多了，它才会慢慢修正对它们的理解。

我们平时判断一个人聪不聪明，主要是看他对信息分析的逻辑能力强不强，IQ测试里面很多都是逻辑测试题。那小孩的逻辑到底是什么时候形成的？说实话，他们最开始都是浅逻辑。

有一次我去我女儿幼儿园给他们教课，我就给他们讲了一个故事。讲完之后，我就问所有小朋友：你们从这个故事里面得学到了什么？结果，那些基本都是5岁的小朋友里面，只有一个小朋友告诉我，他从这个故事里面学到什么，其他小朋友都是把故事重复了一遍。这其实就是一个归纳总结的能力。

我们之前说小孩子在5岁智商发育成熟，其实从这个事情上看来，不是的，他的一些高层次的逻辑推理和归纳能力，基本上还是很弱很弱，或者不具备的。我们说现在AI的智商相当于2岁半的小朋友，那5岁的小孩儿都还不具备这种推理逻辑的话，机器就更远了。我们现在所做的推理分析，基本都还是跟行业专家一起做的。

Q：Alpha Go不属于逻辑推理吗？

A：不属于，它其实就是算法，他算的是获胜的概率。我所说的推理有两点，一个是归纳总结的推理能力，另外就是跟人对话、像人一样思考的能力。如果它不具备这样的能力，它只会自己下，但没办法跟人解释，就还是不行。

Q：iPIN的社会经济图谱和普通的知识图谱有什么区别？

A：我们的社会经济图谱本身也是一种知识图谱，只不过它更复杂、更深。社会经济图谱，首先跟这个社会紧密相关，其次所有数据都是量化的，这是普通的知识图谱所不具备的。普通的知识图谱不是用来做计算分析的，而我们是用来做计算分析的。Business Intelligence里面要用到一个数据仓库，这个东西就属于数据仓库的升级版，它是整个社会的数据仓库，目的是为了做高精度的可量化分析和预测。我们这里面全是量化数据。因为你要你要解释，就必须要量化。

Q：非量化数据为什么不能做解释呢？

A：这个问题涉及到人对信息的处理。人的大脑只能做加减法，不能做乘除法。一般来讲，人对信息理解透的话，大脑一定要做理解记忆，而理解记忆很重要的一点，就是要把外部信息跟内部认知计算结合。

大脑对信息的存储是以一种memory schemata（图式记忆）的方式去存储。要让机器模拟人的认知计算过程，就必须要让机器通过量化信息去做逻辑推理，通过逻辑推理实现对信息的理解，才能实现认知计算的过程。

Q：iPIN产品中也涉及到问答，基于数据分析的问答跟客服类问答区别在哪？

A：问答是一种形式，它背后包含的技术是多种多样的，包括对话背后的技术也是千差万别的。客服问答相对来讲是最简单的一种，所以现在做客服机器人的公司很多，而且客单价低，就是因为它的技术门槛并不高。它本质就是训练一堆FAQ（常见问答），然后根据你问的问题找出最接近的答案，或者告诉你找不到，或者转到人工。我们也用的是问答形式，但我们的问答输出的是分析结果，背后的技术比客服问答更复杂，门槛更高。

Q：要让机器对话和问答更自然、更准确、更像人一些，需要在哪些方面努力呢？

A：问答涉及到三大环节，首先是对问句的理解，然后是答案的检索，最后是答案的输出。

理解方面，我们之所以做社会经济图谱，就是为了提升机器的理解能力。客服问答基本都没有对句子背后深层次的意思去做理解。

比如为了让机器人理解什么是华为，我们给华为建了一个模，包括华为做什么、有哪些人、每个人有哪些特点、某个部门的教育和工作背景、客户信息等等。这是我们社会经济图谱的一个可视化的部分，其实整个图谱远远比这个复杂。做这个的目的，就是为了让机器理解华为，下次遇到华为这两个字时，它就能自动回溯到这里，去提取它所需要的信息。

第二步是查找答案，包括主线和辅线的查找，这里面也涉及到一些复杂的技术。第三步是输出，要让机器用人类的语言去组织，也就是说人话。这三步都不容易。

而且这里面甚至还涉及到大量的transfer learning（迁移学习），就是当机器遇到一个问题，这个问题在这里没出现过，但是在别的领域出现过，这时候机器该如何去自动去解决这个问题。

对话系统只是一种表现形式，但它所涉及到的技术基本覆盖了AI的所有领域。所以一家公司如果说他们做对话，其实并没有回答其背后所用的技术。对话这个东西绝对是可大可小的，比如Google所做的对话肯定涉及到上下文的理解，我们的对话会涉及到大量的认知分析，其他某些公司的对话可能就是从一个答案库里面去找答案。

Q：如何看待AI+在各行各业的应用？

A：我们所做的AI+应该跟Watson是一样的，Watson是从医疗切入，然后逐渐延伸到金融、法律等领域。我们是从生涯规划切入，然后发展到招聘、法律、建筑建筑等各个方向。未来在其他各个行业的应用我认为是一个自然而然的过程。

因为我们做的是情报分析，从信息层面上看，每个行业的信息通用性比较强，比如智能情报检索，各行各业都会有这个需求，所以比较容易落地。

但是像那种用AI简化工作流程、升级工作方式的应用模式，我觉得相对来说可能会稍微缓慢一些。