数据智能

3年长成数据智能独角兽,数梦工场如何做到?

全栈大数据产品及解决方案供应商

2019年05月15日
调研 | 李喆 洪军 崔可家 撰写 | 洪军
  • 数据智能

 

政府和企业在建设数据中台过程中,直接自下而上搭建数据中台很难实现各个部门数据打通。为此,数梦工场在帮助政府搭建数据中台时,通过“最多跑一次”、精准扶贫等应用为切入点,制定标准、整合数据,通过一个具体应用问题,自上而下去推进政务、城市和产业进行数字化转型。

科技航海大时代,大量2G、2B领域的创新企业如雨后春笋般诞生,但真正能快速跑出来的公司依然凤毛麟角,特别是在竞争尤为激烈的数据智能领域。

然而,数梦工场这家公司仅用了不到三年时间,就成长为大数据行业独角兽。在这背后,数梦工场的业务布局是怎样的?崛起之路上,有哪些天时地利人和?下一步的战略又如何规划?

产品矩阵丰富

数梦工场是一家提供大数据、数字安全、人工智能、云计算等综合能力的公司,为客户提供全栈大数据产品和解决方案服务,主要应用领域包括政府、城市和产业等。

数梦工场基于数据中台和AI中台,为政府和企业提供平台开发与服务,为实现更好的资源管理、大数据平台建设、计算存储资源效率优化奠定良好基础。

在大数据方面,数梦工场能够为省、市级政府机构建设统一的数据中台。数梦工场通过与政府部门深度沟通,从实际业务应用场景与数据整合可行性角度出发,定义大数据集的统一标准,以实现跨部门之间的各类异构数据之间的打通、清洗、治理等,从而提供更全面、便捷的服务,例如社保、财税等。

数梦工场也会为政府和企业提供整体解决方案。通过助力政府打造以最多跑一次精准扶贫为抓手的政府数字化转型项目,数梦工场支持政府系统上云和大数据一体化等建设。

目前,在数字政府方面,数梦工场已广泛服务于公安部、人社部、水利部、教育部和浙江、江苏、广东、河南、四川等三十多个省部级单位;在新型智慧城市方面,数梦工场服务于杭州、广州、南京、成都、南宁、西宁、青岛等近百个城市,携手合作伙伴及客户共同打造了杭州城市数据大脑、南宁新型智慧城市和西宁市智慧城市大数据基础平台,同时也为杭州公交集团、国家电网等提供企业数据中台架构等技术服务。

核心是助力政府实现数字化转型

在过去,从交学费、办社保、查违章、开证明这些民生小事,到不动产登记证明、企业开立等关乎创新创业的家国大事都需要人们跑遍每一个相关部门。其主要原因在于政府机构在IT建设时代,政务软件系统的开发方式因为较少考虑不同部门数据之间的整合互通问题,形成了林立的信息烟囱

数梦工场的产品与服务核心是以数据为中心,提供一个能够更好地服务业务需求并且可运营的数据中台,以打破原来割裂的数据孤岛问题。

但想要建设大数据平台就需要将各个部门之间的数据相互打通,但政府各个部门对于自有数据都视若珍宝,单凭数梦工场一己之力难以推动。

解铃还须系铃人。为此,数梦工场通过服务浙江省政府实行以最多跑一次精准扶贫为抓手的政府数字化转型,由政府大力推进大数据平台建设。

制定标准,整合数据

政府数据中台建设时通常分为两类:第一类为省、市级构建的统一数据中台。它将各个部门的数据进行相互打通,实现统一整合,从而提供更全面、便捷的服务,例如大数据局的公共数据中心等;第二类为政府各个部门建立自己的数据中台,管控自己部门所拥有的私有数据,例如社保、税务、交通等。

在建设这两种数据中台的过程中,如何解决公共数据中心和各个部门数据仓之间的数据流动是一个很大的问题。

为此,数梦工场通过与政府部门进入深度沟通,从实际业务应用场景与数据整合可行性角度出发,定义大数据集的统一标准,以实现各个部门之间的各类异构数据之间的打通、清洗、治理等。

例如,对于一个自然人,他的标签体系包括出生、学历、薪资、社保等等,共涉及到70余个部门的数据,2000多个字段。通过定义统一的数据标签标准,将这2万多个字段划分为5个一级类目,20个二级类目,2000个数据元,和203个数据字典,如此以来就可以实现各个部门之间数据共享。

最多跑一次项目无疑取得了巨大的成功,形成了良好的示范效应。现在,数梦工场在助力浙江省政府数字化转型建设过程中,促进各部门数据打通,并建设了两掌浙里办掌上移动办事和浙政钉掌上移动办公),人们只需在家划划手指,就能够一键办理事务。在这个过程中,浙江最多跑一次被写入2018年政府工作报告,并成为国家发改委发布的30数字中国建设最佳实践之一。

未来继续坚持新型互联网平台战略

未来,在发展方向上,数梦工场将继续坚持以云为基、数据环流、互联网+、安全可控新型互联网战略,通过两掌一平台的新型互联网架构,促进实现五跨三融一化,真正促使数据、业务和技术跨层级、跨地域、跨系统、跨部门和跨业务,做到数据融合、技术融合和业务融合,最终促进实现一体化服务。

在通用数据中台建设方面,数梦工场将不断优化技术,将异构的部分抽象出来形成具体模块化的工作,并且不断沉淀服务经验,以形成更为通用的数据中台。

在行业业务应用建设上,数梦工场将携手合作伙伴以及子公司扩充到其他行业。而在选择可落地的场景时,将基于以下三个原则:

第一是行业和客户对于数据驱动业务,有广泛需求。

第二是行业的数据密集度较高和准备度高,能够获取支撑业务协同和业务创新所需要的数据。

第三是数梦工场自身或合作伙伴、子公司具备行业业务知识和应用开发的能力。因为在行业业务应用建设时,通常需要具备既懂行业理解能力又了解技术的复合型人才才能提供优质的服务。

各方面表现优秀

爱分析从技术/产品、获客、客群、场景理解、跨场景等五个维度对数梦工场进行评价。

技术/产品:技术能力良好,产品矩阵丰富且竞争力强。数梦工场基于大数据技术与业务场景理解能力构建数据中台;基于阿里飞天平台构建混合云服务系统。公司提供大数据、数字安全、云计算等一系列产品,服务的政府、大企业等客户对整体架构与产品质量都有较高要求,反映了公司产品具有较强竞争力。

获客:获客能力出众。数梦工场获客以直销和分销为主。团队从IT建设时代就与政府有很好的交流沟通,在政府数字化转型时代,沟通则更加密切。另外,数梦工场会与其他集成商一起对外提供服务,获客渠道广泛,与浙江省政府建设的最多跑一次抓手项目示范效应显著,有望在全国范围内推广。

客群:客群质量较高。数梦工场主要服务的是政府以及大企业客户,付费能力强,黏性较高,客单价也较高。政府正在积极进行数字化转型,资金投入较大。

场景理解:场景理解能力较强。数梦工场长期为政府提供服务,深知他们的需求以及服务方式。数梦工场主要提供跨部门的数据中台建设,而这也是目前政府建设的主要方向。

跨场景:跨场景应用能力较强。数梦工场基于数据中台的能力,来实现跨场景的应用。例如城市数据大脑,数梦工场助力衢州市政府将雪亮工程打造成全国标杆后,目前,衢州在城市数据大脑的应用方面,已经从社会综治跨入到智慧交通、旅游等领域。

近日,爱分析专访数梦工场副总裁兼CTO崔晓峰,就数据智能发展趋势与数梦工场业务发展进行了深入交流,现摘取部分内容分享如下。

数据中台是发展重心

爱分析:数梦工场构建的数据中台是在客户内部建立还是数梦工场有一个统一的数据中台?

崔晓峰:我们是在客户自身建立一个数据中台体系,对于每一个客户,我们都会帮助客户建设一套数据中台。完整的数据中台包括三部分内容:

第一个是全栈的数据技术支撑体系,数据中台不会是平地起高楼,而是需要全栈的数据技术支撑体系。

第二个是全域的数据资产管理,我们的数据中台拥有数据资产管理能力,包括数据的集成、开发、治理、标签化的工作。

第三个是全面的运营服务体系。我们把数据变成标签鲜活化,才能形成可持续运营评估体系。

我们提供的数据中台最大的特色就是把离线的数据变成了在线的生产分析系统。

爱分析:数梦工场会考虑进行业务中台建设吗?

崔晓峰:我们根据客户的建设需求和阶段性的需要,会提供完整的集成解决方案,其中的部分能力中心,由数梦工场自研提供,而相当一部分的能力中心,则会集成第三方合作伙伴一起提供。

爱分析:数梦工场构建的数据中台怎么保证其业务应用不断变化的可扩展性?

崔晓峰:对于数据中台来说,顶层设计非常关键。如何保证数据中台的一致性、扩展性是非常有挑战性的。

首先我们需要规划出从标准的数据源到数据标签体系,再到服务接口的数据流通体系。

其次,我们需要规划对外提供的技术能力的一致性。我们目前提供的是具有统一的数据标准、数据实体和数据服务的OneData/OneEntity/One service体系。这样才能使得数据中台具有标准型和可扩展性。

爱分析:在标准建立好了后,上层的应用政府是找其他供应商还是由数梦工场提供合作方?

崔晓峰:数梦工场建设的中台,通过能力共享中心,开放资源层,使得合作方大概用两周时间,就能够学会使用;同时,公司提供DCP培训赋能,无论是供应商还是合作方,数梦工场都能够帮助他们很快完成交付。关于选择哪一种,主要看政府部门的决策,数梦工场不作额外的推荐。

爱分析:在数梦工场看来,是提供数据中台还是提供业务中台的公司更容易进入市场?

崔晓峰:不同的行业和不同客户有不同的建设需求。

如果该行业和客户,尚未建立起支撑业务协同的数据体系的时候,那么第一步,首先要解决数据的问题;建设数据中台;

如果该行业数据已经完备,而且有了亮点应用实践;建设的重心会往业务中台转移。

同一个行业不同客户有不同的建设重点,需要针对性给出我们顶层设计,全场景规划,小场景实现,给到每位客户建设的路径都不一样。

系统上云为数据中台建设奠定根基

爱分析:对于政府和大企业,上云对他们的业务有哪些帮助?

崔晓峰:云可以解决他们几个问题:

第一是解决整个计算能力和存储能力问题。

第二是解决业务的可靠性和数据可靠性问题。

第三是通过云上新技术和新架构,获取服务于业务系统的能力。

现在的云已经不仅仅是以前广为熟知的几个组件,例如计算网络虚拟化、存储网络虚拟化,而是变成了全栈技术能力的输出。政府和企业上云能够获得我们提供的全部技术能力,包括基础的PaaS层,上层应用的SaaS层。

爱分析:上云之后用好云和管好云的工作,是由政府自己运营还是会由数梦工场提供运营服务?

崔晓峰:政府有相应团队去做云的运营工作,数梦工场主要提供顶层设计能力以及运维实施能力。我们会有团队和他们一起做规划,给他们提供技术支持。

爱分析:对于政府而言,政府机构会整体一起上云,还是一两个部门先做试点?

崔晓峰:从接触到的客户来看,不会是一两个部门试点,而是以某个项目为契机实现某块业务整体上云。目前已经由建好云向管好云和用好云转变。

数据打通是建设数据中台的核心

爱分析:数梦工场怎么实现政府各个厅局委办的系统和数据打通?

崔晓峰:首先我们要做好顶层设计,明确我们的新型互联网架构。这个架构是基于对业务的理解,考虑如何构建一个统一的数据中台和业务中台体系,尤其是统一数据中台建设。

对于数据中台必须要解决公共数据中心和各个部门数仓的问题。这个时候重心变成如何规划公共的数据中心和各个部门数仓边界和数据流动问题。

因次,我们需要定义全行业的数据标准。例如对于同样一个字段,对于大数据形成以后,需要将这个标准去影响到产生字段的其他部门。我们承担的是建设方标准制定角色。

爱分析:政府部门在建设统一的中台之后,部门原来的数仓系统会是由建设方一步步全都替换掉吗?

崔晓峰:不会,这一部分数仓是长期存在的。因为必然有一部分数据属于部门私有。在未来,公共数据是由公共数据中心进行管理,其他部门可以进行相关数据的统一查询。但仍有一部分数据是部门私有,这个时候需要建立部门数仓。

所以未来,我们也会根据设计的要求,帮助部分客户构建部门级的数据中心。我们将会提供相应的产品、解决方案、方法论,也会有更多的合作伙伴和我们一起帮助政府方构建数据中心。

爱分析:未来会是各个部门有数据所有权,还是数据所有权先给到数据中台,然后再给到各个部门?

崔晓峰:会更偏向于前者。首先由编办等部门来确定公共数据管理办法,在管理办法中明确数据的所有权,明确哪些数据的管理权属于公共数据中心;哪些数据的管理权属于部门,需要把这些数据清晰地梳理出来,形成数据目录。再将数据目录上报作为统一的公共目录管理系统,但是数据管理系统不会改变数据所有权。

如果部门需要使用其他部门的数据,可以向数据管理中心系统提交申请,而不用在意数据来自于哪个部门。数据管理中心系统再根据所咨询数据所在的目录向数据管理部门提交申请,至于后台审批交由数据实际管理部门决定。

数据智能化服务之路道阻且长

爱分析:建设数据中台的主要门槛在哪里?

崔晓峰:主要有三个方面——产品、数据、长期运营服务。对于一个数据体系建设,首先要有一个稳固的数据产品体系,从数据采集到治理、开发、能力开放。每一个过程都是一个巨大的挑战。

举个例子,像数据采集最简单环节,我们也投入了大量的研发精力去构建我们的核心竞争力,给客户提供独特的价值。我们的数据集成现在已经可以支持30多种异构数据源和第三方插件。

爱分析:在数梦工场所提供的产品中,标准化产品比例是多少?

崔晓峰:不同的解决方案有不同的标准化程度。比如,像最成熟的数据共享交换解决方案是相对标准化的;安装部署完成后,根据客户的具体情况做一些对接工作。我们在设计的时候,会进行行业化模板的设计,来沉淀行业能力,提高产品和业务的标准化程度。

爱分析:现在政府在做大数据交易所时进展都不是特别顺利,数梦工场认为下一步政府会怎么对外界开放数据?

崔晓峰:这个领域是政府正在积极探索的领域。

第一步还是解决政府内部数据交换的问题。

第二步是政府数据对业界的开放。现在数据开放做的比较好的还是像市场监督管理总局做的工商信息业务等。这确实会是一个发展趋势,但这需要完善的顶层设计,在研发可行的情况下,逐渐进行数据分级、分类、分域的开放。

爱分析:现在政府在数据智能化方面有哪些进展?

崔晓峰:在这个方面,政府还是在往前持续推进。我们也为政府提供更精准服务。比如我们为政府提供更精准的千人千面个性化服务。在为自然人(公民)提供精准服务、精准扶贫、精准救助等方面都取得了不错的进展。对于互联网的监管,我们提供基于信用的监管。政府整体的建设重心逐渐导向于数据智能。

爱分析:从技术上来说,做数据中台还有哪些瓶颈和有待优化的地方?

崔晓峰:数据中台建设是个持续的过程。例如数据种类的增多(包括数据的总量、单位时间内的归集度)、全生命周期的服务、数据安全这些都是持续性的挑战,每个方面都要深思熟虑。