企业服务

海致星图杨娟:知识图谱的行业应用正在快速扩展

知识图谱是认知智能时代的焦点

2019年04月28日
  • 企业服务
  • 知识图谱

近日,由爱分析主办的“2019爱分析·中国数据智能高峰论坛落下帷幕,本次论坛以蓄力中台,突破边界为核心议题,汇聚国内数十家数据智能领域知名企业代表,就数据智能行业的现状与未来趋势展开对话与分享。

海致星图作为知识图谱落地实践的代表,发展迅速,得到了众多客户的青睐,爱分析邀请到了海致星图总裁杨娟进行主题演讲。

杨娟认为,知识图谱是提升认知智能的核心,行业知识图谱对动态信息的处理、对产出量化要求的提高给科技公司提出了更高挑战,只有把握好客户需求,充分理解业务场景并打造自身的核心技术能力,才能成为领先的厂商,而知识图谱的应用也必然会扩展到更多行业。

现将杨娟的主题演讲实录分享。

感谢爱分析,特别高兴今天有机会和各位同仁一起分享在数据智能方面的实践与经验。

数据智能这个词很好地融合了大数据和人工智能,海致星图一直在这两个领域耕耘,现在进入到数据智能。我们也认为,未来十年会是数据智能发展的黄金期。从行业企业到科技公司,都应该把握时代的脉搏。

人工智能的发展,目前正在从计算智能到感知智能进入到认知智能阶段。AlphaGo是计算智能阶段的顶尖产品,计算机能通过超强的算力和不断优化算法,在计算型的游戏当中把人类征服。感知智能方面,语音识别、图象识别、视频识别已经日渐成熟了,机器汇集海量的语音、图像、视频信号,进行数字化,然后再进行信息的提取和甄别。现在到了认识智能阶段,有了这些信息之后,怎么能像人进行理解思考一样解释推理问题,机器没有办法去进行大范围的关联思考和推理,这是所谓认知智能时代的挑战。现在知识图谱并不能完全解决这个问题,但它能帮助我们走进去,走得更远,是非常重要的武器。

海致星图从2016年开始聚焦在知识图谱这个领域,也摸索了很长时间。众所周知,知识图谱的前身是70年代提出的知识工程概念。2012年,谷歌正式提出知识图谱概念,最早用在互联网搜索领域。比如说你搜流浪地球中,返回的结果会自动把星际穿越的相关信息整合;讲一句完整含义的句子,搜索引擎能自动解析出来给你最为贴近你的意图的答案。

这样的技术在互联网领域,比如百度、搜狗,都已经非常成熟了。到了行业场景,或者说2B领域中,我们怎么样应用它,能给传统行业带来价值,这是海致星图在过去两三年中一直在摸索的事情,今天非常高兴能跟大家一起分享我们这两三年的心得。

从互联网知识图谱到行业知识图谱

世界是复杂关系的总和。知识图谱是一张能把万事万物的各种概念实体,包括人与人、事与事的关系连接起来不断变化的动态网络,并且从其中解读出知识。互联网知识图谱面向个人用户,行业知识图谱面向的是企业用户。大家现在都已经了解到企业用户和个人用户的思考方式与决策路径是非常不同的。一群人并不等于多个个体的叠加。

与互联网知识图谱追求知识的广泛覆盖不同,行业知识图谱技术到底能不能带来价值,客户是否愿意付费,主要看能不能对业务产生真正的、可以量化的帮助,类似于获客效率的增加,平均客单价的提升,风险识别准确率的提高、反欺诈识别能力的提高、设备规划优化后的成本节约等等。为了这样的产出,知识图谱技术必然要和行业的知识或者说行业的know-how深度结合,浅而广的知识图谱不会在业务决策流程当中起任何作用,我们需要能够快速对接行业的具体业务场景,同时融入深度的行业洞察。

与此同时,较之互联网知识图谱的数据来源主要是网页,行业知识图谱的数据的来源更加丰富和多元,企业内部传统的沉淀下来的关系型业务数据、营业网点的视频数据、呼叫中心的语音数据、各类设备的运维数据等等。在跟大型企业真正深度地进行交互之后,我们虽然也头疼于如此多的数据的提取与融合,但是更多的是兴奋,因为有着这么大的数据宝藏,能够为知识图谱提供足够多的输入,就是传说中广阔天地,大有可为那种兴奋感。

例如我们和国内某股份制商业银行合作的过程中,围绕着它的客户、账户、产品、商品、资产、合约、设备等核心实体构建知识图谱,系统上线后的第一个月内,实体数量就超过了十亿,关系数量超过了百亿。这还是仅仅接入了部分业务系统的结构化数据。这应该是国内银行界首个百亿级的知识图谱。很短时间内,我们在这个图谱上构建了多维网络特征提取、社群检测、货后失联修复、智能催收等等模型,快速的融入到已有的业务流程中去,取得业务效果。

随着越来越多数据的接入,这张图谱现在在以每天几十万实体、上百万关系的速度在生长。在这张图谱上发生的事件也在不断的刷新和变化。动态知识的捕捉与生产是行业知识图谱的核心价值,每时每刻的交易、每时每刻的订单、内部员工的操作、客户新发生的行为、汇率的变化、外部市场的变化等等,对这些产生的信息能加以捕捉和识别,进行知识的实时生产,快速反哺给各个业务系统,形成数据流、知识流和业务流的闭环。

知识图谱的行业应用正在快速扩展

如同今天爱分析的首席分析师说到,各个行业的商业成熟程度在坐标轴上是有一个分布的。对于数据智能公司来说,金融行业的切入相对来说是比较的困难,因为这个行业对产品技术和业务理解都有很高的要求。所幸海致星图在过去两年当中,服务金融客户算是小有心得,金融行业的科技水平,他们对于知识图谱的理解和洞察,与我们之间形成了非常好的互动和互相激发。

2018年下半年以来,我们观察到安防行业、零售行业、能源行业等行业随着信息化程度的不断提高以及对人工智能技术的日益重视,他们对知识图谱的需求也正在趋向旺盛。在零售行业,我们与某超市集团联合构建的基于商品、消费者、供应商等实体互联的知识图谱正在开始在更加精准的商品推荐、产业链金融等领域发挥价值;在能源行业,基于海量生产设备、传播设备、智能客户终端互联的运营知识图谱则是国家下一代泛在物联网的核心规划之一——在能源行业,我们已经初步识别出了两千多类不同实体,甚至比金融行业还要丰富,非常的惊人。

企业级知识图谱平台面临的技术挑战

行业需求的旺盛使我们非常的兴奋。但是越来越广泛的应用场景对于知识图谱平台也提出了越来越高的技术挑战。我们认为,下一代企业级知识图谱平台必须具备的技术能力,包括了支撑超大规模数据集之上的图构建、查询、遍历、计算与挖掘,高维关系下的亚秒级响应;基于可动态变化的概念实体属性关系知识图谱数据模型,实现实时建模; 打通不同业务领域的专属知识,实现自动化的知识推理,促进知识图谱的自增长与自融合;将知识图谱与深度学习技术充分融合,有效弥补深度学习的不可解释性,覆盖更大范围内的业务场景;无缝支持企业级的组织架构、数据和应用权限管理体系,成为企业AI中台必不可分的一部分。

在具备这样能力的知识图谱平台之上构建模型工厂,通过模型工厂去支撑不同业务的发展。我们和某大型企业合作的知识图谱平台上,已经部署了数十个模型,这些模型目前是服务企业的内部,未来还会对外提供服务,从成本中心转化为利润中心。

参与今天的会议令我非常兴奋,我再次深刻感受到数据智能时代来临其中寓含的巨大潜能,希望能够与今天与会的各位同行一起把握时代赋予的以及中的机会。谢谢大家。