人工智能

到底什么是AI+?揭开iPIN的神秘面纱

iPIN的布局远远不止志愿填报和招聘。

2017年03月06日
指导 | 凯文 撰写 | 京京
  • 人工智能
  • 招聘
  • 法律
  • 生涯规划
  • 志愿填报
  • 认知计算
  • 大数据分析

在2月刚刚结束的AAAI大会上,iPIN作为唯一一家受邀参会的中国创业公司,赚足了国内外媒体眼球,成为中国人工智能领域一颗亮眼新星。

不过,在很多人印象里,iPIN还只是一家做高考志愿填报的数据公司,后来涉足招聘、法律等领域,其所宣称的社会经济图谱以及AI+各行各业,似乎神乎其神,却又不明觉厉。

近期,爱分析对iPIN创始人兼CEO杨洋进行了调研访谈,从创业背景、技术逻辑、业务布局、商业模式等角度,对这家公司进行了全面了解,为您揭开iPIN的神秘面纱。

一个问题引发的读博和创业

杨洋是位不折不扣的连续创业者,从小就跟着妈妈摆摊,卖过烟酒、棒冰、气枪、炮竹、板栗,还有毛衣毛线,可以说是同一种模式,跨越多重领域。不过严格意义上的创业,在iPIN之前,还有过两次。

第一次是04年,当时杨洋在美国读物理学博士,希望把国内的东西卖到国外去,就做了跨境电商。第二次是搜活网,和猪八戒一样的早期自由职业平台。在这个过程中,杨洋发现,这一领域信息匹配效率很低,导致平台很难做大。

为了解决信息匹配效率问题,杨洋去美国读了第二个博士。最开始是在美国国家旅游电子商务实验室做搜索,认为搜索可以解决这个问题,后来做深了发现,搜索是个工程技术,并不能解决信息匹配效率问题。于是又转到信息系统方向,也由此进入了“Collective Intelligence”(集体智能)领域。这一领域早期研究如何汇集信息、利用信息,提升信息效率,但现在已经被用于认知计算(cognitive computing)方面,因此杨洋也就误导误打误撞地进入了AI领域。

博士毕业后,杨洋去了哈工大做副研究员,期间承担了一个国家十二五重点项目,获得了大量社会就业数据。在Collective Intelligence领域,最重要的就是通过分析和研究细小信息来理解整体。要让机器理解整个社会,就要从理解社会最小单元——人开始。人通过职业发展与社会紧密联系,而分析就业数据就是洞悉这张社会之网的关键所在。彼时,在杨洋的脑中,基于社会经济图谱的商业计划已雏形初现。

任教期间,杨洋曾听管理学院老院长叶强教授提起,每年高考前后,会有很多高中生家长找到高校,希望大学老师帮忙解决志愿填报问题,他们以为,大学老师对不同专业毕业生就业之后的发展情况最为熟悉,但事实并非如此,学生毕业几年之后的信息学校根本无从知道。

高考志愿填报的问题一直存在,每年都有将近千万的考生在父母、老师、亲朋好友的“建议”下稀里糊涂地报了一些专业,然后稀里糊涂地被其中一个“选中”,读了四年甚至更长。在很可能决定人生未来走向的这件大事上,大多数人都把选择权交给了不靠谱的经验。互联网发展这么多年,却一直没能出现一款能够解决这一问题的产品。

而这个问题,正是杨洋致力于解决的信息匹配效率问题。有了数据、技术和市场需求,2013年,杨洋召集了中山大学教授、原美国HP实验室数据科学家潘嵘,以及前MSN、腾讯技术总监李训耕和赵泛舟作为合伙人,一起成立了iPIN。

从志愿填报到生涯规划,iPIN要做你的人生导航仪

把高考志愿填报作为首个切入点,除了上述原因,还在于杨洋所要构建的社会经济图谱中,人的职业发展经历是重要一环,而高考志愿填报,是最基础的一步。

这一步,看似很小,却极其复杂。完美志愿主要解决两个问题:你能上什么学校、能学什么专业。

学校方面,要综合考虑各省政策变动、招生计划、录取数据以及实时博弈等问题,过程十分复杂;专业方面,iPIN在原有职业测评体系基础上做了很大改革,把真实的就业数据和测评结果打通,开发了一整套新的测评体系。为了满足大数据分析的精确要求,iPIN把原有16个传统专业分类做成了12000类,就连蓝翔挖掘机专业也没漏掉。

起初两年,完美志愿就在官网上免费为用户提供服务,去年上线了APP,并开始尝试付费,累计服务用户超过400万。据杨洋介绍,每年900多万考生中,完美志愿可以覆盖1/4。从用户反馈情况来看,完美志愿以较高的准确率,已经成为考生填报志愿的“定心丸”。

然而,由于国内用户普遍缺乏付费习惯,加上完美志愿的免费功能已经基本满足考生需求,而大多用户又没有机会体验付费版的高级功能,因此整体付费率较低。今年,iPIN会对产品进行优化,不仅可以让用户体验付费功能,还定了3个价位,满足不同层次需求。

当然,完美志愿只是iPIN社会经济图谱的第一步应用,今年上半年,iPIN还会推出另一款生涯规划产品——人生导航仪,提供人职匹配服务。虽然听起来跟招聘类似,但人找工作和企业招人逻辑完全不同。企业招人只要符合要求就行,而人找工作需要先搞清楚“下一步要做什么”,而“下一步要做”跟“现在所做”未必有很强的联系。

在人生导航仪的Demo版中,用户只需上传自己简历,系统便可从各大主流招聘网站中搜索出相匹配的职位,并根据个人背景和经历提供分析结果。杨洋表示,和即将发布的正式版人生导航仪相比,罗盘的功能只占到了5%。

那么,在完美志愿和人生导航仪背后,是什么东西在支撑其运作?

以社会经济图谱为基础的认知分析框架

iPIN通过提炼数亿人的教育和工作经历,绘制了中国首个社会经济图谱,它聚合了来自高校、政府、企业等方方面面社会经济数据,来提供高精度的可量化分析预测。

在这个图谱之上,是iPIN的认知分析框架。它模拟人的信息理解和处理过程,从字、词、句义的识别,到关系认定,再到具体场景和语境理解、案例分析,最后到多维度排序,形成方案,让机器能够以人的思维进行分析和推理。同时,还要让机器能够通过文本方式与人进行交互。这个过程用到了知识图谱、语义分析、深度学习等多项AI技术。

要让机器自然地与人交互,准确回答人的问题,需要经过三步:理解句义、答案检索、答案输出。iPIN通过构建庞大的知识图谱,使得每一个词背后都有一张与之关联的知识网络,机器通过主线和辅线两条路线对答案进行检索,最后以人类可理解的自然语言进行输出。实现这个过程需要机器对知识图谱进行大量的学习训练。

此外,无论是完美志愿,还是人生导航仪,iPIN提供给用户的,不仅仅是分析结果,还有基于量化数据的分析过程和解释。能够做到这一点,正是因为iPIN的认知分析框架是用人的思维去思考,而不是用机器的思维去思考。

Alpha Go通过机器学习算法战胜人类,但我们只能看到结果,无法知道其决策过程和理由,机器也无法向我们做出解释,更不用说教授给别人。在商业决策里,没有解释就没有说服力,就像川普Twitter治国引来众多非议,就是因为他只喊口号不做解释。

iPIN的认知分析方法跟IBM Watson类似,通过说理(reasoning)做到分析过程可解释,这也是认知计算中很重要的部分。iPIN在分析过程的解释上花费了大量精力,通过动态交互界面或详细分析过程,力求做到每一步都能让用户知晓其分析理由,从而辅助用户做出科学理性的决策。

招聘、法律、建筑、金融等行业逐步落地

依靠这套认知分析框架,iPIN一方面为人和企业的发展提供情报分析,一方面将底层通用技术输出给各行各业。

包括完美志愿、人生导航仪在内的生涯规划是关于人发展的情报分析,明年,服务于企业发展的情报分析也会逐步走向市场。

而在技术输出方面,由于整个认知分析框架在底层相对比较通用,越往上越具有行业特性,越难以通用,因此iPIN会和行业巨头合作,由合作公司提供专家,依靠专家行业经验对技术做出调整,促成目标最终达成。目前,iPIN已经把这套框架用于招聘、法律、建筑、金融等不同领域,而且只提供标准化技术,不提供定制服务。

招聘领域,iPIN主要服务一些大的招聘和猎头公司。从去年6月推出至今,已有两家主流招聘网站接入iPIN技术,和以往数据库相比,iPIN的系统可以大大提高简历检索和匹配效率。

法律领域,iPIN合作了两家法律公司,并投资孵化了一家公司——法律谷,主要解决找律师、找案例的行业痛点。比如要找酒驾方面的律师,可以在搜索栏输入案情“喝酒开车撞人”,系统就会输出处理过相似案件、胜诉率较高的律师列表,还会提供涉案金额、执业地等多维度信息。

建筑领域,iPIN投资了一家建筑行业知识分享平台——马良行(MAHOOOO),为其提供建筑信息匹配技术支持。

金融领域,iPIN从去年下半年开始,为两家金融机构做征信技术支持,提供一些个人和中小企业信贷方面无法量化的信息,帮助他们提高判断准确率。目前尚处于验证期。

收费模式方面,和Watson类似,iPIN提供了两种方式,一种是按照接口调用次数收费,一种是对于调用量大的公司收取年费。由于iPIN每年成本较高,因此主要聚焦大客户,年费基本都在百万级以上,招聘行业客单价甚至超过500万,服务客户80%以上都是上市公司或行业龙头。

让决策更智能,知识工作自动化前景广阔

杨洋表示,iPIN的愿景是利用最尖端的AI和大数据技术,在专业领域让机器拥有媲美人的认知和分析能力,以帮助人们更好地完成工作,实现知识工作自动化。

互联网的诞生已经取代了一部分传统职业,而人工智能技术的发展会在更大范围内改变现有职业状态,尤其会取代大量知识性工作。

根据麦肯锡发布的《驱动未来经济的12种颠覆性技术》研究报告,知识工作自动化有望成为既移动互联网之后可能对经济产生颠覆性影响的第二大技术。到2025年,其经济规模预计会达到5.2-6.7万亿美元,市场前景广阔。

IBM Watson是全球认知计算领域的代表,它最早从医疗领域切入市场,目前也开始进入商业领域。近日,IBM宣布将利用Watson的认知计算能力,提升会议室白板的交互性,辅助商业决策。

作为“中国版Watson”,2016年,借助完美志愿的付费业务,以及在招聘、法律、建筑等行业的技术输出,iPIN已经取得了一些商业化成果。杨洋表示,2017年,公司目标营收1个亿,并且实现净利润。

对于接下来的规划,杨洋指出,iPIN不会各个行业都做,人和企业发展的智能情报分析是其核心所在,这两方面会一直由公司主导。而在其他方面,iPIN会基于其认知分析框架去做技术输出,逐步配合各行业巨头公司推动行业变革,同时为他们提供各行各业的数据支撑。

按照目前已经或正在落地的四个行业客单价来算,iPIN只要在每个领域拿下3-5家行业大客户,加上C端完美志愿等生涯规划产品付费率提升,贡献小几千万营收,实现1亿目标并不难。接下来,在标准化技术输出方面,无论是拓宽服务领域,还是从大客户向中小客户延伸,都是可行的营收增长方式。而在主导业务方面,只要把产品做好,扩大用户覆盖面,提高付费率,就能实现良性发展。

图:iPIN CEO杨洋

近期,爱分析对iPIN创始人兼CEO杨洋进行了调研访谈,现将部分精彩内容摘录如下。

Q:咱们公司现在一共有多少人?结构如何?

A:一共大概120人,全职100人,实习生20人。研发团队占80%,其中数据团队占60%左右,包括数据工程团队、数据分析团队以及机器学习团队,另外还有5个人负责BD,其余是品牌、财务、行政等。

Q:您认为对于完美志愿这样的C端产品来说,哪些方面比较重要?

A:首先一定是品牌,如果鱼龙混杂,用户没有品牌认知,只会去选便宜的,最终问题也不会得到很好的解决。而要把品牌打响,最重要的就是解决问题的效果和结果。

效果体现在交互方面,作为一款C端应用,交互对于用户体验非常重要。对于没有硬件的公司来说,交互就是提升科技感很重要的一个方式。我们原来专注提升技术,从去年下半年开始专注提升人机交互。

结果好坏取决于数据质量和分析技术。很多公司对数据质量没有太多要求,捞一笔钱就完事儿了,我们公司把数据放在最重要的位置,有近百人在做数据,包括让机器学习过去十几年的录取情况,成本巨大,很多公司负担不起。

Q:社会是不断发展变化的,在志愿填报上,基于过去历史数据所做的统计的分析会不会存在滞后问题?

A:这个问题我们也有考虑过,所以在今年新出的版本中就会正式解决这个问题。办法很简单,就是做预测。

社会是不断变化的,但一个职业五六年之后的状态是可以预测的。当然这种准确率跟天气预报一样,是个概率问题。举个例子,假如某个职业群体特别庞大,但是供需严重失衡,供给方面人才非常缺乏,某些高校又提供了相关方向的人才培养,那短期之内肯定是很难补全,未来几年这种需求一定会持续下去。这种社会经济数据是很容易预测的,因为我们对社会基础信息的监控投入非常大。

当然有些东西也是比较难预测的,比如政策因素。我们2013年开始做高考志愿填报,2014年国家推出新高考,2017年浙沪两地首先实施,2019年全国大部分地区都会施行。新高考会给生涯规划带来很大的市场,这些都是我们之前没预料到的。

Q:社会经济图谱需要包括个人、企业、以及政府、高校统计的大量数据,这些数据咱们是如何获取的?

A:最开始承担国家项目,因为学术研究之便就从中获取了很多数据。数据无非分为几类,一类是公开数据,就是政府和企业对外发布的数据,获取这些数据很简单,就是爬;还有一类是非公开数据,我们会跟政府或者企业合作一些项目,通过项目就可以获得大量数据。非公开数据中除了合作数据,还有一些别的数据。

当然,我们合作的时候会签合作条款,不会对外直接发布原始数据,而是分析后的数据,所以我们已经对这些数据进行过脱敏处理了。通过这些方式,我们现在汇集的数据越来越多。

Q:公开和非公开数据分别占多大比例?

A:肯定是非公开数据占比更大,但是具体比例我们没有做过统计,我们倾向于关注数据覆盖面、覆盖准确率、更新频率等等这些指标。

Q:咱们现在在数据获取上没有太大困难吧?

A:我认为对于一家分析技术出众的公司来讲,数据恐怕不是它的瓶颈,因为中国存在大量有数据没有技术的公司,然后有分析技术但没有数据的公司相对较少,所以我们很容易从别人那里获得数据。很多人以为,没有数据没法做,但这反而不是我遇到的困难。

Q:咱们的数据分析技术壁垒有多高?

A:我可以这样讲,在collective intelligence领域,会我们这种分析方法的人很少很少,即便是别的公司跟我们有完全一样的数据源,也做不到我们这一步。在全球范围内我对于这个领域比较早的一批人,而同批其他人要么已经不做了,要么还留在高校里面。

说实话,中国不缺AI工程师,但特别缺数据分析高手,这也是我们公司在招人时遇到的很大一个问题。另外我们公司数据分析师中,超过一半都是海归,因为国内不培养这方面的人才。

Q:生涯规划方面未来会有哪些应用?

A:生涯规划是个基础模块,它可以服务于完美志愿、完美生涯、人生导航仪这样的产品,所以2C和2B都会有,更多的会跟场景相关。比如学校给学生做职业规划,可以提高学生目标感,增强学习动力;企业给员工做成长计划,可以提升员工成长性,为企业创造更多价值。所以它的应用场景非常多,能够覆盖社会上的大部分人群。

Q:服务企业方面有哪些规划?

A:企业这块我们已经开始跟几家企业在做尝试了,具体规划现在还不方便说,明年应该会有一个大范围的应用。

Q:进入不同领域需要做很多工作吗?

A:应该说,在进入某个行业的第一家时,还是会有一些工作,但是这家做出来之后,就会越来越快。我们最开始从生涯规划和招聘这两个领域切入,虽然二者之间有一定差别,但也有很多联系。一旦换到法律行业,还是会有很大跨度,比如很多法律专业术语我们人都很难看懂,更何况机器。所以当我们新进入到某个行业时,还是需要针对这个行业的特性,跟行业专家一起去做一些定制化工作。AI在各行业的应用,一定是人工智能的技术专家、数据科学家,跟行业专家一起紧密合作,才能做成事儿。

Q:那提供给同一行业不同公司的接口一样吗?

A:一样,但是他们能够拿去做不同的事情,做出不同的界面。

Q:进入新领域开发周期大概多久?

A:法律我们花了3个月。但是前面的生涯规划和招聘,就花了很长时间去做,当然后面时间会越来越短,因为我们做得越来越多,也在不停地总结这里面的通用性在哪里。其实我们为什么会做不同的领域,就是在看通用性在哪里,因为我们尽量是只在通用的范围内去做,超出的部分就让别人去做。

Q:未来进入其他行业会主要考虑哪种方式?

A:合作和投资我们都会考虑,比如现在我们对外合作最知名的就是教育行业的新东方。法律谷和马良行是我们投资的,其他目前都是合作。

Q:成本方面占比最大的是哪一块?

A:硬件部署成本很高,我们光一台服务器成本就已经上百万元了。

Q:法律谷是如何盈利的?

A:他们会向律师收费。律师通过提供自己的背景和案例信息,可以提高自己的曝光率。法律谷是我们孵化的一个项目,现在已经独立出去了。

Q:咱们的2B业务是如何获客的?

A:现在有很多人会主动找我们,所以本身已经很忙了。当然我们也有自己的BD团队,也会在行业内做一些推广。另外我还有一些特殊的获客方式。我是混沌研习社的导师,以前也是哈工大的老师,经常会去给企业高管讲课,就会有企业直接来找我们合作。

Q:iPIN是以标准化的技术接口服务于一些行业,如何跑赢细分领域垂直型公司?

A:垂直公司肯定有它的优势,但是数据公司有一大特性,就是数据的网络效应,这也是为什么我们决定跨多个行业去做。在高考志愿填报领域其实我们做的时间并不长,但是能够做到最好,就是因为我们不是专门做这个领域的,我们有大量其他领域的数据可以服务这个领域。同样的,招聘也需要高校各个专业方向的数据,法律也需要招聘的数据,各行各业的信息汇集起来,就会形成巨大的网络效应,也会带来更大的价值,所以说这是我们的一个优势。

当然,垂直领域肯定有决定性优势,它会在它所服务的行业里做得更细,无论是专家、还是流程化设计,都会做得比较好。但是在信息覆盖面和跨领域信息方面就会比较弱。所以各有优缺点,但至少我们有独家优势就行了。而且我们也没有想要把所有行业全部吃掉,只会专注自己擅长的领域。

Q:咱们切入这么多领域,重心方面会有安排吗?

A:会,从研发角度讲,我们分三步走,第一步是社会经济图谱,这是一切的根基,也是我们头两年在做的事情;第二步是以人为本的人的成长情报分析;第三步是企业成长情报分析,这块从去年3月份开始,已经做了大半年了,有了大量的技术储备。

从市场角度来讲,我们今年专注在人发展的情报分析上,甚至也包括服务政府。从明年开始,我们服务企业成长的情报分析就会开始商业化。

Q:现在AI领域人才稀缺,咱们在吸收人才方面有没有一些特殊的策略?

A:一方面我们正在跟国内两大TOP高校合建实验室,另一方面我们也在全球范围内签约了很多联合研究院的大学教授,用我们的数据去帮他们做科研。比如我们的生涯规划项目中,就有9位来自清华、中山大学、哈工大、港科大、美国亚利桑那州立大学等国内外高校的教授。通过这种合作,我们也更容易接触到一些他们学校很多优秀学生。

Q:目前融资进展到哪一步了?

A:B轮已经确定了,预计今年3月底完成。