知因智慧创始人任亮:产业知识图谱是AI在金融领域落地的最佳路径

构建产业链关系网络,应用场景丰富

2018年05月29日
调研 | 刘馥亮 唐靖茹 撰写 | 唐靖茹
  • 人工智能
  • 金融科技
  • 知识图谱

受政策环境、产业环境等多种因素影响,中国企业集团谱系错综复杂,风险传导机制颇具中国特色,存在大量依靠内评方法难以识别的关联风险。鉴于此,监管层也十分重视利用科技手段防范金融市场风险。

知因智慧的创始人任亮曾在2004年“德隆系”问题爆发后参与最高金融监管机构启动的“客户风险预警工程”。期间任亮就曾考虑新一代信用风险计量模型的商业应用前景,又经过10年的积累与沉淀终于等到各方面条件成熟,于2016年成立了知因智慧。

技术对金融行业的深刻影响远超想象。如今,知因智慧建立的产业知识图谱不仅可以运用于金融监管,更拓展到金融环节,延伸出多种应用场景。

首先,仍然是基于金融风险控制需求所产生的应用,以银行等金融机构为主体客群。金融风险的传导可以非常迅速,这就要求银行具备较好的企业信贷风险预警能力。利用知识图谱技术,可以透视银行企业客户在产业集群中的定位,每个节点发生的内外部事件都能从图谱中解析出对特定对象的影响,从而度量出风险程度。

再者,包括银行在内,2B公司有大量获客及客户关系管理需求。自然语言处理技术能够识别传达出商机的事件,基于知识图谱和既有模型量化判断商机,形成价值排序,使客户经理优先关注价值最高的商机,从而提高获客效率和线索转化率。客户关系营销在获取企业客户中也颇为重要,利用图谱识别客户关系链,更有机会批量获取客户。

最后,大型集团企业往往具有复杂而庞大的供应链体系,进行供应链风险控制,甚至自行开展供应链金融服务,对于挖掘供应链上下游企业关联关系的需求也十分强烈,兼具了风控和营销属性。并且,对金融涉足较少的集团企业无论是风控经验还是系统能力都较为缺乏,对科技手段的需求比银行更加迫切。

基于以上的种种应用,待客户群体壮大之后,融通其中的上下游关系也将成为一大卖点。

知因智慧的产品体系以底层的知识仓库KW为基础,囊括加工好的各类数据和关联关系;中层搭建KE模型平台,持续积累各类场景模型和算法;上层打造KG可视化分析应用平台,具体展现场景应用,为客户分析提供可视化工具。

任亮表示,知因智慧的模型库里已经建立了37个模型,风控和营销领域所涉及的更多场景应用还将不断被发掘出来,知识图谱技术的应用范围远不止于此。

近期,爱分析专访知因智慧创始人兼CEO任亮,就产业知识图谱技术应用及知因智慧业务发展进行了交流,精选部分内容与读者分享。

时机成熟,知识图谱技术分析企业高效而深入

爱分析:您创立知因智慧的契机是怎样的?

任亮:其实在新一代信用风险计量模型出来的时候,我就已经有好多次机会创业。当年监管体系内部、银行业内,都认为这个领域将来必然是一个全新的方式,所以当时曾考虑创业。但经过慎重的分析我们觉得当时条件还不够成熟,方法论的接受还需要一定时间,外部数据还没有那么充分,云计算等各方面的技术能力也没那么好,所以一直在等这个契机。

直到我从IBM出来以后,2016年的时候看到三个要素都具备了。首先客户需求,大家已经普遍接受了这套方式。第二个是大数据,政府类数据的开放度已经很高了。然后包括云计算的能力,特别是Palantir的窜红和AlphaGo深度学习的火爆,Palantir知识图谱的概念和AlphaGo的深度学习把AI推向高潮,使得金融机构的风险部门、业务部门,甚至是科技条线,都有AI创新需要。

2016年需求处在爆发期,我们就顺势成立了知因智慧。

爱分析:如何理解知因智慧所运用的知识图谱技术?

任亮:知识图谱的概念有很多,像语义网,是在自然语言处理方面的概念。把实体连在一起的图计算或者复杂网络,又是另外一个领域的体系。后来谷歌提出知识图谱的时候,其实是在语义网的基础上再往前走一步,把实体之间的关系建立起来,基于关系路径去做一些推导,称为知识图谱。

知因智慧是借用知识图谱的概念,建立了产业知识图谱。产业知识图谱里,实体就是企业、商品、也包括个人,或者是供应链里的节点,就是产业实体。关系就是企业之间的资金往来、投项、担保、贸易关系。要素还包括企业本身的属性、标签、事件,都符合知识图谱的定义,以知识图谱的形式把它们组装在一起。知识图谱本身也是一个网络,所以可以用到复杂网络或者图计算的特性去提炼一些关系,或者提炼一些规则。

所以知因智慧是用产业知识图谱的概念,把原来通用的知识图谱、图计算、自然语言处理、深度学习的技术,打包综合在一起,运用在金融领域。

金融机构经过这些年的实践,意识到了AI在金融行业落地的最佳路径就是知识图谱。通过知识图谱能够整合大数据,能够让机器读得懂,在此基础之上才能谈到算法优化和预测。

爱分析:如何利用知识图谱高效实现关联分析?

任亮:以服务银行为例,假设一家银行有1万个企业客户,原来需要针对这1万个企业逐一做分析,现在基于外部数据,可以批量分析关联关系。

例如已经拥有了5000万企业的数据,就可以先构建一个图谱,然后用这个图谱跟这1万个企业做匹配,这样可以定位出每个企业在哪个集团星系里面,这是第一步。

然后,基于定位好的1万个企业和图谱中关联的,可能一百多万个大大小小的企业,监控每个节点发生的内外部事件,包括互联网舆情新闻报道、各种公检法产生的负面事件等等。

最后,将事件带入到图谱中,测量这些事件对于企业自身和周围企业的影响。

爱分析:这种关联分析相比常见的企业关系查询网站有哪些优势?

任亮:会更深一步。

第一个,基于工商数据的网站展示的只是投资股权关系,与知因智慧的算法不同。知因智慧提供的产业图谱是内外结合的,还有很多扩展关系,比如说担保、资金往来、贸易等等,在图谱形态上不一样。

其次,仅仅在投资链条上,普通查询只能找出周围的企业,知因智慧会在全网搜寻谱系子图,找到关系紧密的群体,会找出更多层以外的关联企业,所以挖掘深度也不一样。

第三个,就是在非结构化信息的提炼上。原来都是用人眼看舆情信息,现在我们是用机器把它提炼出来,让机器能够读得懂,这是一个比较大的差别。

数据源多样,结合产业链合作方数据综合判断

爱分析:知因智慧的数据来源有哪些?

任亮:数据源也比较多,因为企业数据比较碎片化,所以类似于工商、税务、海关、司法、金融市场、互联网舆情、政府类垂直数据都会包含。另外还有金融监管机构的同业数据和统计披露数据。目前也在对接一些供应链跟产业链的合作对象。

爱分析:产业链核心企业为什么会愿意共享数据?

任亮:这就是联合运营概念。现在产业链很多,B2B和S2B也在构建生态,想要更好地去服务成员企业。

金融服务本身就是一个大的领域,而且是一个比较专业的领域,企业自身的数据不足以支撑它来去做好,因为它只有内部的一些ERP数据,但是对成员企业的信用情况、外部情况等等,也需要再补充。

知因智慧能帮它补充一些外部数据,加上知识图谱,加上新颖的模型方法,比如关系链的模型、基于这些关系的评价,甚至包括产生评价好的结果。

因为我们有银行资源,本身也在给银行推商机,所以还能帮助企业更好地去对接银行。如果把客群深度分析好了,推的商机就已经不仅仅是商机了,直接就是客户的名单、等级、定价等信息。

爱分析:现在知因智慧的数据覆盖面有多大?

任亮:目前的重点还是在银行这一端,以银行视角去划分产业。

目前基本覆盖全国一半左右的集团企业,每个集团企业又分了很多板块,例如投资板块,地产板块等等,积累了全国5000万企业的数据,划分了很多的子行业、子集团,然后以银行视角去做每个集团的画像和分析,这是当前的重点。

在这个之上,根据银行的需求再做一些垂直产业链,比如私募产业链、私募投贷联动,汽车、房产、新能源等,是目前重点关注的几个产业。

应用场景多样,未来以中小银行为主力客群

爱分析:知识图谱技术在风控方面有哪些应用?

任亮:风控有两个模型,一个是风险前置。我们为一些大行做过贷后模型,已经有了很好的效果。贷后模型里面把跟行业有关的变量都去掉,用的就是外部变量,还有关系变量,重新建模依然有很好的效果。把模型前置到营销环节,不依赖于行里的数据。

银行可以在营销的时候,利用风险模型预判企业的风险大小。有些风险信号,或者是风险特征,即使不是刚性地把它拒绝掉,但至少有了信号,可以有针对性地去考察,所以叫做风险前置。

无论是针对新增客户还是存量客户,还有风险传导模型。类似辉山乳业这样的一些问题,当外部发生一个重大事件以后,会波及到哪些企业,就是基于风险传导的影响去识别。

爱分析:对于风险的测量有哪些考察因素?

任亮:前瞻性风险预测是考察综合风险的一部分,属于关联风险,还有一部分是自身风险。

关联风险里面,会考虑到企业自身的行业特点、公司体量、集团结构、角色、事件本身的风险等级、关系类型、投资比例、权重、关系强度等等,比如投资关系和担保关系是不一样的,有很多要素要考虑。

自身风险,依照最早监管机构做风险识别预警的奥斯卡体系,分别会考虑经营层面、结构类、信用类、担保类、偿还类的指标。除了这五大类之外,还有奥斯卡plus,是一套升级体系,包括行业、区域等等相关变量。现在已经有上千个指标的积累,会综合在一起来看。

爱分析:这是否需要客户本身积累大量数据?

任亮:企业数据形态当然越丰富越好。

针对大型客户,特别是上市公司,其实外部采集的信号已经比较全面了,可以做出一些比较好的模型。但是针对于小微客户确实会有些问题,因为外部信号比较少,这个时候可能需要一些内部数据。所以在这种情况下就需要去接入其他供应链或者是政府机构里的信息。

爱分析:前置风险引擎是否嵌入到客户系统内部?

任亮:知因智慧采用了两级引擎。我们自己有一级负责采集所有的外部数据,建立图谱和风险信号。还有一级引擎布在客户系统内部,内部会有它的资金交易流水,这些信息在银行里,所以内部引擎把外部信号跟内部嫁接在一起,然后去做判断。

爱分析:产业知识图谱帮助供应链金融解决什么问题?

任亮:一方面是要对供应链本身提供服务,给供应链拥有者提供服务,另外一方面是给供应链成员提供服务,这是不同的。

给拥有者提供服务,例如我们给某大型电商集团旗下金融平台提供的供应链解决方案,使它能更好地针对每一个供货商识别发展潜力,提供自己的产品。为了更好地预测每个供货商的发展潜力,就需要一套新的模型。原来的模型可能基于时间序列,基于回归去做,但是要把供货商要预测地更好,也要通过知识图谱的环节,通过人、商品、店铺的体系,这套体系搭建好之后再基于其他要素去预测供货商。

还有类似于该客户或者比其小的供应链,其实也希望给链条里的成员提供金融服务,相当于把企业外部数据、关系链条,跟它们的数据对接,然后再用模型去服务。所以我们把外部的数据能力、算法能力、模型能力准备好,直接给这家机构做输出,它就多了一个新的武器,除了原来的B2B服务以外,还能做一些增值的金融服务。

爱分析:未来会拓展城商行或者农商行吗?

任亮:会,而且这是将来的主力客户。

与头部客户的合作能够获得更多专业领域的经验,彼此互建共生。因为知因智慧的方法论是一套全新的体系,所以我们不像一般的公司,从小客户做起,从长远的客户做起。先做标杆大银行,头部客户能够给我们带来极大的认知提升,在同类银行中推广的时候才有说服力,这就是我们的策略。

虽然大客户能获得更多的收益,但我们的目标是做产业金融,是要帮金融找到实体产业标的,要帮产业去找到资金,其实中小银行资金获得增量的压力更大,而且小银行金融科技能力更加欠缺,需要更多体系支撑。所以对于小银行,我们不是帮其建系统,其实是对它输出能力,包括金融科技本身,也包括一些客群。