数据智能

数据智能深度报告,看清数据中台和业务中台的未来(附下载)

《爱分析·中国数据智能行业报告》正式发布

2019年05月08日
报告执笔人:李喆 爱分析 首席分析师
  • 企业服务
  • 数据智能

报告编委

报告指导人

金建华   爱分析 创始人&CEO

张扬      爱分析 联合创始人&首席分析师

报告执笔人

李喆      爱分析 首席分析师

崔可家   爱分析 分析师

外部专家(按姓氏笔划排序)

于揚     易观 创始人

王华     互道 创始人&CEO

苏萌     百分点 董事长&CEO

吴明辉   明略科技 董事长&CEO

赵杰辉   滴普科技 董事长&CEO

胡健      一览群智 CEO

姜燕北   泰迪熊移动 CEO

袁国玮   HyperS宏路数据 创始人&CEO

黄向前   新颜科技 CEO

崔晓波   TalkingData 创始人&CEO

崔晶晶   集奥聚合 创始人&CEO

设计师   张赛华

特别鸣谢

报告摘要

数据智能公司的机会在于业务中台

  • 企业数字化转型带来的数据融合和技术融合,促使数据中台出现。
  • 单场景的数据中台会逐步与业务中台融合,只有少数核心企业会长期存在数据中台,数据智能公司的机会在于业务中台。

业务中台带来商业模式创新,大数据下半场核心是争夺场景

  • 业务中台使得数据智能公司的商业模式能够从技术赋能向合作分成转变,合作分成将大大提升数据智能公司的天花板。
  • 大数据的下半场争夺核心是场景。场景本身的价值提升,基于业务中台,实现场景内数据闭环,成为竞争的关键。

跨场景要寻找数据洼地

  • 数据智能公司的天花板由单个行业天花板和跨场景能力决定。数据智能在各个行业发展不平衡,金融、政务、品牌营销相对成熟,工业、农业相对处于早期。
  • 跨场景要选择数据基础设施较差、格局相对分散的数据洼地场景。技术能力强和具备独特数据资源的公司更容易跨场景。

目录

  1. 一. 大数据新篇章——数据智能
  2. 二. 数据中台的出现与未来
  3. 三. 业务中台带来模式创新
  4. 四. 场景争夺成为主旋律
  5. 五. 跨场景要寻找数据洼地
  6. 六. 三大应用场景相对成熟

大数据新篇章——数据智能

1.1 大数据发展历程

整个大数据行业发展分为五个时期,即收集、监测、洞察、决策和重塑。五个时期对应着两大阶段,业务数据化和业务智能化,其中收集、监测和洞察是业务数据化阶段,决策和重塑是业务智能化阶段。

2019年,大数据正式进入业务智能化阶段,开启数据智能新篇章。

图1大数据发展历程

数据来源:爱分析

2013年,企业开始认知到数据价值,金融、电信、公安等行业开始建设大数据平台并购买大量外部数据,希望通过外部数据快速挖掘数据价值,因此对外输出数据的数据服务公司获得了发展机遇。

2015年,数据大屏等监测业务成为大数据最先成熟的应用,大数据进入到业务监测阶段。政府、央企以及大型国企等优质客群对于数据监测展现应用需求旺盛,BI与可视化公司发展迅速。

2017年,随着大数据平台建设完善以及企业精细化运营的需求不断提升,单纯的数据展现很难满足企业需求,大数据开始与业务场景结合,行业进入到业务洞察阶段。

此时,单纯的数理统计很难满足企业需求,因此出现了大量数据挖掘、数据建模的需求,AI建模平台、数据科学平台开始进入人们的视野。明略数据、百分点、同盾科技、百融金服等公司在这一时期成长为行业内的明星公司。

2019年,大数据从业务洞察进入到业务决策阶段,即由机器形成数据报表或者数据报告,业务人员进行决策,变为机器直接给出决策建议,让机器具备推理能力。例如,在外卖、出行场景,美团和滴滴的系统直接形成最佳调度方式,自动完成决策环节,将任务下发给骑手和司机。这种消费互联网相对常见的场景,将在产业互联网、企业业务场景中落地。

让机器具备推理能力,意味着NLP、知识图谱等认知技术的成熟。数据驱动决策、数据驱动业务发展的企业新需求,必然会带动一批数据智能公司的兴起。

未来,随着技术更加成熟,大数据会从业务决策进入业务重塑阶段。大多数执行环节将由机器来实现,但仍有众多环节需要人参与其中,因此,人机协同会迎来迅猛发展,未来会诞生一批全新的数据智能公司。

1.2 数据智能对企业业务流的改造

当大数据进入到决策阶段,企业业务由原先的经验、流程驱动逐步转向数据驱动,数据中台和业务中台在整个业务链条价值度越来越高。

图2传统业务模式:流程驱动

数据来源:爱分析

传统业务方式,数据是副产物,业务人员基于行业经验和流程建立业务系统,数据主要用于监测业务进展和洞察规律,最终决策由业务人员进行,整个业务流程迭代速度极慢,很难满足现在快速变化的前端应用,商业价值度较低。

图3新业务模式:数据驱动

数据来源:爱分析

新业务方式,数据为业务系统核心,基于技术中台的能力,将企业内外部数据打通形成数据中台,由数据中台驱动业务中台,并利用业务中台的组件重构业务系统。由于有中台的支撑,各类开放服务可以对前端应用的快速变化做出响应,因此商业价值会更高。

以美团为例,美团的超级大脑指挥调度着60万送外卖小哥的行动,高峰期一个小时要处理29亿次订单派遣,每天要处理2000万个订单,整个流程完全是基于数据驱动,由系统自动去运转。

图4数据智能与传统业务方式比较

数据来源:爱分析

1.3 数据智能定义及行业图谱

1.3.1 数据智能定义

进入数据智能阶段后,整个行业呈现出两大趋势:

第一,多技术融合。开源时代,技术门槛越来越低,很多大数据公司具备了深度学习、NLP、知识图谱等技术能力;从客户需求来看,为了指导决策,需要汇聚海量多源数据,其中必然会涉及到非结构化数据的处理,基于复杂网络的推理和决策,因此单一技术很难解决问题。

在BI领域,交互式BI是新热点,将自然语言处理技术与BI相结合。风控反欺诈领域,除了查询个人信息外,也需要通过人脸识别、声纹识别等多种方式去验证。

多技术融合助力一览群智服务银行客户

一览群智是一家以自然语言处理和知识图谱等认知智能技术为核心的人工智能公司,为客户提供一站式AI产品和行业解决方案。自2015年成立以来,一览群智自主研发出智语、智慧、智图、智策四大产品,满足企业在超大规模多源异构情况下的数据治理融合、不同场景下的AI建模和复杂决策分析需求。

图5一览群智智能决策平台

数据来源:一览群智

随着数据的不断增长和技术不断更新,数据智能正在从数据监测、数据采集等传统场景逐渐向“智能+”迈进。“智能+”阶段以数据挖掘、数据建模、形成解决方案、辅助决策以及预警分析为典型特征。AI发展逐渐从单步骤快反馈的感知智能向认知智能过渡。

某国内大型银行是一览群智的典型客户,其传统的国际结算业务存在诸多痛点:高人工成本、低人工效率、高经验依赖等,为了解决以上在国际业务中的问题,一览群智推出智能审单专家系统。

该解决方案充分融合OCR与NLP技术,提供了丰富强大的功能,包括报文自动拆解、软条款预警、票据OCR、国际业务知识图谱、单证审核、单单审核等。此外,在核心的实体识别、智能提取与智能比对中引入了自学习机制,可以在业务人员使用的过程中积累数据,以便为模型未来的升级提供数据支持。

同时,系统具备很强的可接入性,能够针对与目前各种不同类型的国结系统进行整合。支持智能与人工方式的双线独立处理机制,能够针对每笔业务实现人工智能无缝切换。

综上所述,一览群利用其一站式技术解决方案,帮助银行大大提高了审单效率和准确度,降低了人员工作量。自动/半自动的审核使得单笔业务审核成本大大降低,提高了国结业务的竞争力和盈利能力。

一览群智在金融、公安、媒体等细分场景已形成标杆案例,正在快速规模化复制的阶段。未来将在纵向上深入垂直行业,同时在横向拓展其余行业。

第二,中台的形成。在企业数字化转型进程中,传统企业需要具备互联网公司那样快速迭代升级的能力,基于数据驱动业务发展,这就需要建立一站式技术能力、统一的数据管理、快速配置开发业务的能力。以阿里巴巴为代表的中台模式给传统企业提供了一条道路,各类中台会在企业内部逐步形成。

因此,爱分析对数据智能的定义是,基于中台、融合多种技术,利用数据解决企业客户的决策需求。

1.3.2 数据智能行业图谱

数据智能由两大部分组成,中台和行业应用。中台包含技术中台、数据中台和业务中台,行业应用则按照不同行业进行划分。

图6数据智能行业图谱

数据来源:爱分析

技术中台主要是指帮助企业客户搭建技术中台的公司,数据采集、数据处理、数据存储、数据分析等环节的所有工具及平台,包括基础平台、用户行为分析、BI&可视化、数据科学平台、NLP&知识图谱等,典型公司有星环科技、易观、神策数据、思迈特软件、第四范式、天云大数据等。

随着机器学习、AutoML等技术逐步成熟,以及语音识别、计算机视觉等AI感知技术的成熟,技术中台呈现自动化、低门槛化发展趋势。如数据科学平台领域,Google开源的AutoML技术,由机器可以自动实现特征提取,降低了特征工程的门槛。BI&可视化领域,交互式BI成为新的热点,主要是通过自然语言理解的方式,降低使用门槛。

图7技术中台包含的细分领域

数据来源:爱分析

数据中台主要是指帮助企业搭建数据中台的公司,一类是提供数据服务的公司,基于自身能够触及的数据资源,形成一个第三方的数据中台,并基于数据中台服务企业客户,如TalkingData、个推、极光大数据等公司;另一类是帮助企业进行数据治理、数据资产化的公司,自身没有数据,帮助企业客户搭建数据中台的公司,如数澜科技等公司。

数据中台的价值是将数据资产化,实现不同体系ID账号的打通,为下一步数据应用夯实基础。

数据中台需要汇聚企业的内部数据、公开数据、线上数据和线下数据:

  • 内部数据包含企业的各业务系统中实时产生的数据,如CRM、ERP等系统,记录企业日常行为数据。
  • 公开数据主要是通过爬虫等方式抓取的数据,如电商网站商品、社交网站的用户评论等。
  • 线上数据指通过SDK等方式获取的数据,主要是移动设备上的用户行为数据、LBS位置数据等。
  • 线下数据指一类是通过WIFI、蓝牙探针获取的数据,另一类是公安、运营商、银联等高价值数据。

基于数据中台有三种应用方式:数据集,如数据标签、用户画像等;数据模型,融合了数据和算法,如销量预测、风控建模等;数据应用,将数据能力和软件能力封装,形成最终数据产品,如选址、用户账户管理等。如个推通过服务第三方移动APP,可以获取移动设备使用APP的时长,从而推断出该设备用户的用户画像,最终用于广告营销。

图8数据中台的业务流程

数据来源:爱分析

业务中台主要是指基于数据和技术,结合行业应用,沉淀针对行业应用的模型及产品。业务中台具备业务属性,但本质是一些功能模块组件,企业基于业务中台可以快速封装出业务产品。

几乎不会有数据公司直接搭建企业的业务中台,大部分都是由技术中台和数据中台公司演化出来的。少部分从行业应用切入,在服务大量垂直行业客户后,掌握场景需求后,逐步形成业务中台能力。例如,京东超过70%的商品采购都是机器推荐的,京东自营商品已超过2600万种,只有通过数据形成业务中台才能够实现商品采购,不可能依靠业务人员去完成。

从价值度的角度来看,业务中台能够覆盖场景的全流程,解决全场景问题,实现技术赋能,按照效果进行收费,价值度最高。

图9业务中台是基于数据中台和技术中台形成

数据来源:爱分析