人工智能

iPIN杨洋:现在的AI才两岁半,基本没有智商可言

小度和汪仔真的智商超群吗?

2017年03月08日
指导 | 凯文 撰写 | 京京
  • 人工智能
  • 通用智能
  • 对话问答
  • 知识图谱

2017年才刚过了两个月,国内就上演了两场人机大战,先是小度判案,后是汪仔答题,机器人的战斗力似乎像越来越强了。

那么,实际情况果真如此吗?机器真的已经能从眼神、听力、智商上秒杀人类了吗?下围棋、识别嫌犯、百科问答,这些技能背后的实现原理到底有多高深?人工智能离超越人类到底还有多远?现在究走到哪一步了?

近期,爱分析在对iPIN创始人兼CEO杨洋进行调研访谈的过程中,无意间获知了关于以上问题的一些“真相”,与您分享如下。

图:iPIN创始人兼CEO杨洋

iPIN是国内依靠认知计算提供智能情报分析和信息匹配的典型代表,它基于庞大的社会经济图谱和认知分析框架,一方面为人和企业的发展提供情报分析,通过完美志愿等生涯规划产品直接服务广大用户,另一方面向各行各业输出大数据分析的标准化技术,提高信息匹配效率,目前已经在招聘、法律、建筑等领域实现商业化落地。(具体可参考爱分析文章《到底什么是AI+?揭开iPIN的神秘面纱 | 公司调研》)

Q:有人说,通用智能需要解决知识表示的问题,而知识表示又依赖知识图谱的成熟,您认同这种观点吗?

A:首先通用智能现在不存在,最后会以怎样的形式存在,我觉得是一个很大的疑问。

知识怎么表示?我们距离通用智能到底有多远?我觉得这里面最大的问题不在于知识图谱,而在于现在AI到底什么地方比人差。

毫无疑问,深度学习解决的最大问题就是在分类计算上能够做得比人好。《最强大脑》上小度所做的事情就是一个图像判断的分类问题,语音识别做的也是分类问题。在这块,机器人已经做得比人好了,这点毋庸置疑。

我们说人工智能,就是希望机器能比人强,那现在它哪点比人弱?其实就在于推理,推理跟知识图谱肯定是相关的,但是推理现在还没解决的一个更重要的问题,是逻辑。

但关键是什么逻辑这个问题就有很多学派。人工智能早期在八九十年代陷入困境,就是因为在逻辑这块突破不了,现在逻辑还是没有突破。那逻辑到底该怎么去克服?这个问题不同学派有不同意见。

拿我自己来说,我自己有两个小孩,他们的出生非常适合我去观察人的学习过程。Baby learning也是人工智能很重要的一个环节,就是看人如何去学习。比如我的儿子是先会叫“爸爸”,然后会叫“妈妈”,但是它叫“爸爸”是需要帮助,叫“妈妈”是饿了,也就是说他叫的时候并不知道什么是“爸爸”,什么是“妈妈”,它对这两个词的理解跟我们是不一样的,只有随着以后沟通多了,它才会慢慢修正对它们的理解。

我们平时判断一个人聪不聪明,主要是看他对信息分析的逻辑能力强不强,IQ测试里面很多都是逻辑测试题。那小孩的逻辑到底是什么时候形成的?说实话,他们最开始都是浅逻辑。

有一次我去我女儿幼儿园给他们教课,我就给他们讲了一个故事。讲完之后,我就问所有小朋友:你们从这个故事里面得学到了什么?结果,那些基本都是5岁的小朋友里面,只有一个小朋友告诉我,他从这个故事里面学到什么,其他小朋友都是把故事重复了一遍。这其实就是一个归纳总结的能力。

我们之前说小孩子在5岁智商发育成熟,其实从这个事情上看来,不是的,他的一些高层次的逻辑推理和归纳能力,基本上还是很弱很弱,或者不具备的。我们说现在AI的智商相当于2岁半的小朋友,那5岁的小孩儿都还不具备这种推理逻辑的话,机器就更远了。我们现在所做的推理分析,基本都还是跟行业专家一起做的。

Q:Alpha Go不属于逻辑推理吗?

A:不属于,它其实就是算法,他算的是获胜的概率。我所说的推理有两点,一个是归纳总结的推理能力,另外就是跟人对话、像人一样思考的能力。如果它不具备这样的能力,它只会自己下,但没办法跟人解释,就还是不行。

Q:iPIN的社会经济图谱和普通的知识图谱有什么区别?

A:我们的社会经济图谱本身也是一种知识图谱,只不过它更复杂、更深。社会经济图谱,首先跟这个社会紧密相关,其次所有数据都是量化的,这是普通的知识图谱所不具备的。普通的知识图谱不是用来做计算分析的,而我们是用来做计算分析的。Business Intelligence里面要用到一个数据仓库,这个东西就属于数据仓库的升级版,它是整个社会的数据仓库,目的是为了做高精度的可量化分析和预测。我们这里面全是量化数据。因为你要你要解释,就必须要量化。

Q:非量化数据为什么不能做解释呢?

A:这个问题涉及到人对信息的处理。人的大脑只能做加减法,不能做乘除法。一般来讲,人对信息理解透的话,大脑一定要做理解记忆,而理解记忆很重要的一点,就是要把外部信息跟内部认知计算结合。

大脑对信息的存储是以一种memory schemata(图式记忆)的方式去存储。要让机器模拟人的认知计算过程,就必须要让机器通过量化信息去做逻辑推理,通过逻辑推理实现对信息的理解,才能实现认知计算的过程。

Q:iPIN产品中也涉及到问答,基于数据分析的问答跟客服类问答区别在哪?

A:问答是一种形式,它背后包含的技术是多种多样的,包括对话背后的技术也是千差万别的。客服问答相对来讲是最简单的一种,所以现在做客服机器人的公司很多,而且客单价低,就是因为它的技术门槛并不高。它本质就是训练一堆FAQ(常见问答),然后根据你问的问题找出最接近的答案,或者告诉你找不到,或者转到人工。我们也用的是问答形式,但我们的问答输出的是分析结果,背后的技术比客服问答更复杂,门槛更高。

Q:要让机器对话和问答更自然、更准确、更像人一些,需要在哪些方面努力呢?

A:问答涉及到三大环节,首先是对问句的理解,然后是答案的检索,最后是答案的输出。

理解方面,我们之所以做社会经济图谱,就是为了提升机器的理解能力。客服问答基本都没有对句子背后深层次的意思去做理解。

比如为了让机器人理解什么是华为,我们给华为建了一个模,包括华为做什么、有哪些人、每个人有哪些特点、某个部门的教育和工作背景、客户信息等等。这是我们社会经济图谱的一个可视化的部分,其实整个图谱远远比这个复杂。做这个的目的,就是为了让机器理解华为,下次遇到华为这两个字时,它就能自动回溯到这里,去提取它所需要的信息。

第二步是查找答案,包括主线和辅线的查找,这里面也涉及到一些复杂的技术。第三步是输出,要让机器用人类的语言去组织,也就是说人话。这三步都不容易。

而且这里面甚至还涉及到大量的transfer learning(迁移学习),就是当机器遇到一个问题,这个问题在这里没出现过,但是在别的领域出现过,这时候机器该如何去自动去解决这个问题。

对话系统只是一种表现形式,但它所涉及到的技术基本覆盖了AI的所有领域。所以一家公司如果说他们做对话,其实并没有回答其背后所用的技术。对话这个东西绝对是可大可小的,比如Google所做的对话肯定涉及到上下文的理解,我们的对话会涉及到大量的认知分析,其他某些公司的对话可能就是从一个答案库里面去找答案。

Q:如何看待AI+在各行各业的应用?

A:我们所做的AI+应该跟Watson是一样的,Watson是从医疗切入,然后逐渐延伸到金融、法律等领域。我们是从生涯规划切入,然后发展到招聘、法律、建筑建筑等各个方向。未来在其他各个行业的应用我认为是一个自然而然的过程。

因为我们做的是情报分析,从信息层面上看,每个行业的信息通用性比较强,比如智能情报检索,各行各业都会有这个需求,所以比较容易落地。

但是像那种用AI简化工作流程、升级工作方式的应用模式,我觉得相对来说可能会稍微缓慢一些。