金融

知识图谱深挖关系价值,海致星图2年拿下25家金融大客户

潜在市场规模数百亿

2018年08月30日
指导 | 张扬 调研 | 唐靖茹 黄啸 撰写 | 唐靖茹
  • 大数据
  • 金融科技
  • 知识图谱
  • 金融
  • 智能风控

海致星图围绕金融场景进行知识图谱技术落地,搭建起从底层技术、模型算法到业务应用结构完整的技术平台,结合互联网大数据和行业数据,理清企业和个人关联网络,服务银行获客与风控。未来,知识图谱还将广泛应用于券商、保险等各类金融机构,助力金融行业效率提升。

新兴金融科技与传统银行的加速融合,正推动着金融行业深刻变革。

国有银行人力、物力、财力基础雄厚,分别与各家互联网巨头达成战略合作;大型股份制银行亦紧随其后,取长补短,多重科技装备加身;数量上占据银行业绝对主力的城商行、农商行,亦不甘落于人后,今年以来纷纷大力投入大数据、人工智能等技术能力建设。

海致星图正是市场爆发的见证者之一。

创立于2013年的海致是中国大数据行业先行者,以海致BDP大数据分析平台起家,并重点布局金融、公安等领域。2016年起,海致将金融业务分拆,以海致星图为品牌独立运营,专注于围绕知识图谱技术,打造金融领域创新产品。

经过两年发展,海致星图已搭建起完整的知识图谱平台,应用场景覆盖营销、风控全流程,拥有包括股份制商业银行、城市商业银行、农村商业银行、证券交易机构等在内的25家客户,正朝着新的市场目标奋力迈进。

结合多方数据,利用知识图谱技术深入挖掘复杂关系

无论是银行信贷业务风控,还是零售、对公客户营销,都涉及对实体关系的辨别,以及判断风险或价值信号的传导。传统方式以人力解决,费时费力且全面性、准确度有限,运用知识图谱技术,能够通过海量信息建立起关联网络,更精准、高效地分析、解决问题。

海致星图通过互联网数据采集平台进行全网数据抓取,动态监控近亿家企业,包括工商信息、经营情况、涉诉信息、招投标、投融资、舆情等在内的全维度数据,识别出营销信息和风险信息,深层次加工后导入知识图谱平台,结合银行内部沉淀的交易、担保、借贷等数据,进一步挖掘复杂关系。

完整的平台体系使海致星图能给带给客户更完整的业务价值。知识图谱平台从技术上分为三层,分别为底层技术平台、业务模型与算法层和业务系统应用层。

首先,底层技术平台集中体现数据处理能力和计算能力,是支撑起知识图谱平台的基础。海致星图作为全栈型公司对基础平台十分重视,大力投入研发,其承建的知识图谱平台能够用做到10亿级实体,百亿级关系,秒级计算返回,技术能力优势突出。

其次,模型和算法层需结合建模技术和业务经验进行开发,并持续打磨。海致星图目前积累了客户评价模型、营销模型、风险模型共三类,超过100个业务模型,既可以用于对公业务,也可以用于零售业务,并且能做到开箱即用,直接对接银行数据和系统,加快上线速度。

最后,应用层直接对接现有金融机构业务系统,如风险预警系统、信贷管理系统等,是打通知识图谱平台和银行自身业务流程的桥梁,使数据流和业务流融合,形成数据闭环,使算法在其中不断得到优化。

持续提高场景理解能力,应用延伸空间广阔

类似利用大数据和人工智能算法提供智能营销、智能风控服务的技术供应商,市面上并不罕见,海致星图备受客户青睐,离不开其坚实的技术背景和持续积累的场景理解能力。

首先,海致星图的快速发展与海致团队早期的积淀密不可分。据了解,海致星图技术团队近百人,多为互联网技术背景,具备丰富开发经验,在大数据、机器学习领域耕耘已久。

早期海致团队曾服务于互联网、零售、金融等多行业,不同场景,丰富的业务经验使其对数据如何转变为业务价值有更深刻的理解。

再者,头部银行作为海致星图的种子客户,为早期产品打磨提供了宝贵的实践场景。海致决心进军金融领域后,在服务某股份制商业银行的过程中,不断根据客户的反馈打磨完善自己的产品,不仅树立了标杆客户案例,同时也确保了产品技术紧贴银行实际的营销和风控业务。

海致星图的业务模型最早由业务专家设计,在服务客户的过程中不断完善,产品化能力进一步提高。例如海致的客户价值评价模型,包含经营状态、交易情况、人员构成等八个维度,如今90%的客户都会直接采用,肯定了其“外脑”价值。

最后,由于知识图谱技术通用性较强,赋予了海致星图更多场景延展空间。

营销方面,通过模型评估识别客户价值,确定营销路径和营销策略,能够提高客户经理获取新客户和维护老客户的效率;风控方面,依据关联关系,能够识别静态风险并实现动态预警,使风控信息更加全面,监控更加高效。

不同于众多后期才加入营销模块的大数据风控服务商,海致星图合作开发的第一款产品就是针对营销环节。海致星图总裁杨娟表示,目前市场上营销产品更受欢迎,因为营销能直接带来收入转化。

除银行客户外,海致星图还服务了监管机构和企业金融集团,并正将业务延伸至券商、保险等各类金融机构。同时,海致星图正与中国银行业协会合作,制定“基于文本的金融风险知识图谱技术规范”的中华人民共和国国家标准。

爱分析从客群、获客、场景和技术等方面评价海致星图。

客群:主要服务银行、证券、保险等金融机构,付费能力强,客单价较高。

获客:有股份制商业银行、深交所等标杆客户案例,增长较快,目前销售团队10人左右,股东恒生电子对未来切入券商客户有获客帮助。

场景:营销、风控场景均有应用,同时服务银行零售、对公业务,场景延展性较好,前期合作打磨产品一年,场景理解能力较强。

技术:技术团队近百人,多为百度背景,技术实力突出,知识图谱技术有一定门槛。

近期,爱分析专访海致星图总裁杨娟,就海致星图的业务发展和行业情况进行了交流,部分精彩内容与读者分享。

提前布局金融行业,今年迎来市场快速增长

爱分析:海致集团将金融业务独立是出于怎样的考虑?

杨娟:海致一直定位于用大数据和人工智能技术赋能中国广大企业,这个目标一直没有变过。

创业初期聚焦于互联网、零售、制造业等,在2016年决心进入金融市场。因为我们看到,金融行业的数据量非常之大,数据密度非常之高,单位数据量能够产生的产值也在不断升高。简而言之就是既有数据,然后又有钱,数据还能产生钱。这也是为什么当时从战略角度考虑,我们投入到金融市场上来。

从2016年8月我们签下第一家客户招商银行到现在,正好两年了。因为战略得当以及产品技术上的领先优势,我们发展非常迅速,目前为止有25家金融客户,22家是银行,一家是企业金融,还有一家是深交所。

这个速度在同类型创业公司当中算是非常快的。包括整个知识图谱产品的诞生到成熟,智能CRM产品的诞生和成长,以及BDP在金融领域的应用,都呈现出比较均衡,然后快速发展的态势。

爱分析:海致星图的发展历程大致是怎样的?

杨娟:刚才有谈到,2016年8月我们签约第一家客户招商银行,2017年,我们服务了兰州银行、青岛银行、南京银行、长沙银行,在服务客户过程当中,我们不断进行产品提炼和打造,算法、模型、应用场景得到了全面提升。

2018年,我们的产品体系及服务体系全面走向成熟,业务进入了一个快速增长期,中原银行、建设银行、九江银行、江阴银行、鄞州银行、江南银行、广发银行、深交所、华融湘江银行、东莞银行等,越来越多的客户认可知识图谱在营销和风控方面的价值。

爱分析:市场快速增长的原因是什么?

杨娟:人工智能赋能各行各业的趋势不可逆转。金融行业是其中受冲击最大的行业之一。

随着金融监管政策的不断收严,通过科技创新和人工智能技术的引入来降低营销成本、增强风控能力、向科技要效益,已经成为各个银行的共识。在合规的前提下进行营销方式的创新,同时运用智能化的风控措施,减少损失和不良,也就是在现有体制之下开源节流,这对于科技创新提出了一个比较高的要求。

知识图谱技术作为人工智能技术体系当中重要的构成部分,在深度挖掘客户关系,寻找商机和探测风险方面有其非常独特的作用。

2016年,类似于像招行这样在金融科技方面比较领先的银行具备较强的前瞻性的金融机构,率先进入到这个领域。到了2017年,像青岛银行、兰州银行、南京银行这一类在金融科技创新领域比较具有胆识的城市商业银行也开始来做这件事情。

到了今年,市场不断下沉,越来越多的客户进入到需求状态,所以市场是随着金融机构的科技水平的发展与提高在不断的成熟和扩大。它的核心是回归商业本质,需要通过科技创新力量在现有业务模式上开源节流,这是一个大的背景,大家都需要有更好的手段去进行获客和风控。

精准捕获营销与风控信号,大幅提升业务效率

爱分析:获客和风控分别有哪些案例?

杨娟:获客有一个很真实的案例。江苏省的一家上市公司,其实是家族企业,它的一名大股东,应该是董事长的儿子,在股市抛售了价值9亿的股份,也就是套现了9亿。我们的知识图谱第一时间捕获了这个信息,精准地推送给了客户在江苏省南京市当地的客户经理,客户经理接到信息就上门去做营销,营销之后,当中有5亿就转化成了私人银行的理财产品。

这个消息出来之后,当地其他的银行客户经理上门,去了之后发现人家已经被我们的客户营销成功了。这是一个通过知识图谱实现公私联动的很好的案例。

另外,再举一个风控方面的案例。比如某集团企业将其旗下一家子公司以二十多亿的价格出售给了另外一家公司,当时这是一个极大利好消息,股市价格上升,同时该企业到银行来申请更多的贷款,用以扩大再生产。但是通过我们的知识图谱识别出这笔交易其实是疑似关联交易,是左手换右手,将此信号及时推送给我们客户的信贷风险经理,提示他这件事情当中存在的风险,帮助他进行风险决策,避免潜在的不良贷款损失。

爱分析:从信息进来到信号出去的过程是怎样的?

杨娟:首先我们有一套分布式互联网数据采集平台,进行全网信息抓取。现在抓取全国9000万家工商注册企业的全维度数据,包括工商信息、行政信息、涉诉、招投标、投融资、经营动态、舆情等等,总共是27大类数据。

数据采集回来之后,其实会有两种用途,一种是非常直接的营销和风险类信息。

比如这家企业刚刚注册成功需要开户,或者中了一个大单,或者刚刚融资成功,银行马上就上门了,这类信息是直接推送,也就是客户经理可以立刻上门营销;风险类信息则主要针对存量客户。比如这家企业已经是我行的客户了,董监高爆出负面新闻,或者经营管理出现动荡,以及整个行业出现的政策层面风险等等,这些会作为风险预警的信号发送出去。

另一种,更多的互联网数据会通过深层次的加工和应用会进入到图谱平台当中去,用知识图谱的技术与金融机构内部的交易、担保、借贷、票据等数据相融合,做进一步深入提炼、分析和挖掘。例如通过对企业集团关系的判定,来计算整个集团的授信额度或者风险敞口,这在企业授信业务当中是非常重要的环节。

集团关系的分析其实非常复杂,因为现在这种企业之间各种各样的控股或者套壳很复杂。再如担保环、担保圈、担保群、联保联贷关系的发现,这种关系在金融机构的信贷业务中风险是极高的,一旦有一个环节断掉,会引起类似于多米诺骨牌一样的负面反应,当年温州地区就爆发过很大面积的联保联贷链条断裂的风险传导事件,这些都可以通过我们的知识图谱进行监测和发现。

另外,像上下游关系的的营销商机和风险传导,上游企业和下游企业之间互相依赖的关系比较强,上游企业有风险,会在什么时间以什么样的方式到达下游企业,我们有一套算法模型来进行量化的评估。同样的,营销商机也具备类似的传导特征。

再比如说零售业务中,我们和多家银行信用卡中心进行合作,通过高频的资金往来,发现谁和谁关系较为亲密。这种亲密度可以用来做营销,和优质客户关系比较亲密的人,很有可能也会是优质客户,也就是所谓的近朱者赤;和黑名单客户、疑似欺诈类客户往来频繁,这个客户往往也是比较劣质的,所谓的近墨者黑。包括客户失联,信用卡还不上的,我们通过知识图谱去发现和他关系比较密切的人,去做催收、追债、追担保等等。这些都是图谱的更多更深入的应用场景。

爱分析:NLP技术在当中起什么作用?

杨娟:互联网上每天在产生海量的与企业相关的文本,包括行业政策、地方性政策、行政法规、税收、以及企业的各种经营动态等等,在金融机构内部也会有监管机构下发的文件、客户经理提交的报告、客服的记录文本等等。

NLP技术帮助我们去对这些海量文本进行信息提取和识别,提取和识别出企业的名称、人的名称、事件的主体、类型、情感调性等等,然后挂载到我们的知识图谱当中去。NLP技术的有效性与具体的应用场景相关性很大。我们有一个很丰富的金融语料库,不断提升在金融语境下我们文本识别的准确率和召回率。

爱分析:打标签的过程需要人工完成吗?

杨娟:标签体系有三层,分别是基础标签、统计类标签、智能化标签。

基础标签相对来讲比较好定义,我们大概定义的有300多个基础标签。统计类标签,就是在基础标签之上去做封装,组合成更加综合的标签。智能标签相对来讲技术含量最高,里面会用到机器学习,包括有监督学习、半监督学习和无监督学习,最后给出来的结果带有很强的判断性,比如企业的忠诚度怎么样?企业的风险怎么样?企业的营销价值是怎么样的?我们采用的是专家经验和机器算法相结合的过程。

最早算法里面的很多参数会需要业务专家进行手工调整。但是过了最早的训练期之后,训练集构建的越来越充分和完善,用于训练的样本数量越来越多,所以机器通过自反馈的链路自己去做算法的各种各样优化,人工干涉成分就会越来越少。

爱分析:知识图谱在贷中和贷后方面是否也能发挥作用?

杨娟:目前越来越多的金融机构在进行业务流程一体化的改造,贷前、贷中、贷后会形成一个有机的整体,我们的知识图谱的应用范围同样也覆盖了从获客、到潜客转化、到贷前尽调、风险评级、贷后管理、风险预警的客户生命周期的全流程。

夯实领先地位,预期未来市场占有率70%以上

爱分析:产品方面有什么规划?

杨娟:接下来会在大规模实时图谱、时序图谱以及基于图谱技术的知识推理和智能问答等方向上做更多投入。

爱分析:除了银行以外,还有哪些是目标客群?

杨娟:证券公司和保险公司是目前已经初步得到验证的客户群体。另外我们也在更大的范围内评估知识图谱技术的应用拓展。

爱分析:今后两三年有怎样的战略考虑?

杨娟:目前海致星图是国内金融知识图谱市场占有率的NO.1,会把这个领先地位夯实和保持下去,也会投入更多精力到金融知识图谱国家标准的制定。同时如同刚才讲到的,会在更大范围内评估知识图谱技术的应用拓展。

爱分析:对今后的市场趋势如何判断?

杨娟:我认为未来最终资产规模在100亿以上的金融机构,都会有对知识图谱平台的需求。在全国大概有一千多家能够达到这个水平,所以市场会有一个成长和成熟的过程。

爱分析:达到这样的市场规模需要多长时间?

杨娟:今年是2018年,我认为要到2021或者2022年,要有三四年的成长时间。

爱分析:预期那时候海致星图的市场占有率有多高?

杨娟:我们有信心占有率达到70%以上。市场会有马太效应,会越来越聚集在头部的产品和服务提供商手上。