数据智能

营收翻倍增长,这家公司如何帮国网等大企业做数据治理?

专注数据治理,为传统行业数据中台落地提供专业方案

2019年09月05日
调研 | 李喆 撰写 | 施尧
  • 数据智能

最近一年,阿里的“中台成为大数据行业最为火热的名词,不仅仅是大型互联网公司纷纷效仿,就连传统企业也都是实中台战略,数据中台建设是其中最重要的一环。

伴随着数据中台的兴起,数据资产化、数据治理等同样被越来越多的企业所关注。特别是大数据行业发展至今,绝大多数企业都已经认识到,想要做好数据分析,必须先从数据治理开始做起。

但实际上,数据治理并非新名词。2003年建行开始引入数据治理,2005年中国移动也开始购买数据治理产品,不过这些传统企业的尝试并没有完全起到预期的效果,单纯通过购买数据治理产品、工具,很难真正帮助到传统企业。

数据治理产品工具这条路在中国走的并不顺畅,有些公司开始通过其他方式切入到数据治理这个领域,从咨询、培训等方式,快速发挥数据治理的价值,真正解决传统企业的需求,御数坊就是其中之一。

从咨询和培训切入,服务多个传统大企业客户

御数坊于2014年年底创立,专注于数据治理领域,以培训和咨询服务为切入点延伸至后端软件产品及相关服务,服务于传统企业。

虽然从2003年后就开始有大型企业在做数据治理,但效果一直不好。御数坊创始人刘晨看来,对于绝大部分企业来说,数据治理还是新生事物,国内整体上还是处于认知和实践的早期阶段,而培训和咨询服务是能够让大型企业快速认识到数据治理的价值以及如何落地的有效方式,因此,御数坊先从培训和咨询业务入手。

御数坊的培训业务主要有企业数据管理理论与实践、数据管理成熟度评估和企业定制内训三个业务板块,从2015年开始,为国家电网、南方电网、建设银行、民生银行、中国移动、中国电信、海尔等近百家大型企业的近千名数据管理人员进行数据管理理论及实践的培训。

通过这些培训,让大型企业的IT负责人能够真正了解数据治理的价值与方法,对御数坊而言,既是在做行业布道,同时也通过培训获取客户。

咨询业务则是让大型企业能够实现数据治理落地的重要方式,御数坊的咨询业务主要包括数据管理成熟度评估咨询服务、数据治理体系规划咨询服务和数据治理专项提升咨询服务三个板块。

此前,很多企业将数据治理等同于ETL,从业务系统中抽取数据,形成数据仓库或者大数据平台。但实际工作过程中,很多数据治理最终失败的原因是没用从全局考虑数据环境,而只是面向数据平台建设或某些局部的数据应用开展数据采集、清洗等技术工作,业务部门参与度不足、数据在源端往往不规范,更多时候是考虑存储的便捷和自己部门使用,而没有考虑整个公司或集团的数据整合和应用需求,缺乏协调和全局的标准化。

由此可见,数据治理不仅仅是IT部门构建数据仓库或者大数据平台要做的事情,而是涉及各个业务部门如何去规范的定义数据,并进行数据采集、数据存储,甚至会涉及到整个公司的组织架构和数据工作机制建设等问题。想要做好数据治理,是个非常宏大的工程。

因此,御数坊会先为这些传统企业提供成熟度评估服务,基于评估结果,确定传统企业当前状态,再从顶层设计的角度,进行数据治理体系的规划。基于规划,一步步地去扎实推进专项治理。

专项治理通常包含两种情况:一类是面向数据治理的工作职能开展的,比如说数据标准的专项治理,或者是数据模型的专项设计;另一类是面向业务场景的专项治理,比如面向营销、客服或风控的数据。

通过这种方式,御数坊先后服务于多个行业的数十家大型企业客户,帮助这些企业建立数据治理组织、制度,统一数据模型,构建指标体系和基础数据、参考数据标准,提升数据质量提升,进行数据安全分类分级,获得了非常高的客户满意度和客户粘性。

专注数据治理,扎根行业再做产品

在数据治理领域耕耘近5年的御数坊,从2017年开始结合客户实际数据治理工作开发数据治理产品DGOffice,目前主要有六个产品中心:数据资产、数据架构、数据标准、数据质量、数据安全和数据运营。

整个数据治理产品的开发规划分两个步骤。第一步是把御数坊积累的国际及国内咨询方法论和多个行业的数据治理真实工作场景沉淀下来,类似SAP的设计,将一套管理流程部署在系统中,让客户去使用,或者是客户的IT服务商辅助他们使用,这部分叫标准化,同时积累的多行业数据标准库也将有助于帮助客户实现数据治理工作的快速起步。

第二步是把数据治理的能力自动化、智能化,在每个环节上做智能化的计划和实施,这部分目前御数坊正在做一些实践,将NLP语义分析、深度学习、神经网络等在互联网领域已经成熟的技术引入数据治理领域,进一步提高数据治理工作效率、降低人工消耗。

近期,爱分析对御数坊创始人刘晨进行调研访谈,对数据中台和数据治理的理念由来与实施落地,御数坊的业务模式、数据治理领域的现状与趋势进行阐述,现将精彩内容分享如下。

刘晨,御数坊创始人&CEO,毕业于清华大学。2008年开始从事数据治理行业,曾在石竹、埃森哲从事数据治理的咨询服务与产品规划工作,2014年从埃森哲离职创办御数坊。

数据中台的建设离不开专业化的数据治理

爱分析:最近中台概念比较火,请您谈一谈对中台的理解,数据中台的建设的路径是怎样的?

刘晨:阿里出了一本书,提出了中台的概念,其实书里最开始提的是业务中台。业务中台我认为是阿里将多个电商平台业务,如C2C的淘宝、B2C的天猫,还有团购的聚划算等,其中有同质化的业务职能抽取出来,形成几个中心:订单中心,用户中心,还有支付中心等,把它变成了一个统一的业务功能模块;

任何一个电商业务运行到这部分的时候,由相应的业务中台进行支撑,用这样的方式复用共性的业务能力、支撑多类业务。不同的业务中台会沉淀下来不同的数据,形成数据中台、支撑前端多类业务应用。

御数坊服务于很多传统企业客户,客户的业务不一定具备互联网企业这样的条件,比如电网、煤炭这类能源企业,它的核心业务比较单一,比如电力的发、输、变、配、用,不同业务职能是一个价值链的上下游,共性的业务职能往往是人力、财务、物资等支撑职能,这与互联网的业务中台是不同的概念。

而这部分支撑职能中,组织方面有共享服务中心,系统上有ERP提供支撑,数据方面已经沉淀下来了人员、设备、项目、物料等主数据,主数据管理在传统行业中已经有比较成熟的方法论和实践。这就意味着传统行业的数据中台建设思路可能和互联网领域有一些不同。具体如何构建,业界百家争鸣也还没有统一的实践,对这一点御数坊一直在关注和思考,也在和数据中台公司合作探索,争取摸索出一条适合传统企业客户的数据中台与数据治理融合的实践之路。

爱分析:御数坊的业务主要是数据治理,这和数据中台有什么异同?

刘晨:谈到数据治理与数据中台的关系,先说说什么是数据治理。数据治理的核心作用是实现企业数据资产的标准化、提升数据质量,而这是一个相对全局性的工作,既要有对企业数据资产的全面梳理、制定标准规范、组织架构和制度体系,也要结合数据中台所支撑的业务应用进行细致的数据质量检查、提升,而数据质量提升的工作,也不限于在数据中台内部,应该是覆盖源端系统和数据中台,这就意味着数据治理工作既不源于中台、也不终于中台,覆盖面和复杂度要更大。

所以,我们帮助客户开展数据治理工作,往往先通过咨询制定一个标准流程,然后根据客户不同业务、不同系统或不同数据的具体情况再做策略和实施路径的调整,有的个性化业务需要做个性化的方案设计。

在整体数据治理体系搭建起来之后,数据资产还需要深度治理,一般来说都是与行业和业务场景强相关的。这种深度治理我们叫做专项治理,共分两类:一类是面向数据治理的工作职能开展的,比如说数据标准的专项治理,或者是数据模型的专项设计;另外一类叫做面向业务场景的专项治理,比如面向营销或者面向客服的数据进行数据质量提升。这类专项治理不限于数据中台,也不限于数据团队,而是应该覆盖中台与源系统,由数据团队和业务部门、源系统技术团队共同开展,这样才能从根源解决数据问题。

从咨询服务到软件解决方案,推动数据治理落地见效

爱分析:御数坊的发展历程是怎样的?

刘晨:我是2003年本科毕业,开始是在一家外企做研发测试,后来接触了项目管理软件,从那时起,对于“管理软件的背后应该是一套管理思想和方法”深信不疑。2008年加入了石竹,做的就是数据治理软件产品,包括元数据管理、数据质量管理等,从2010年开始参与国际数据管理协会的相关工作,逐渐慢慢形成了自己的方法论。2011年到2014年,我在埃森哲做了三年数据治理咨询服务,2014年年末创立了御数坊。

初期的想法是公司应该先做咨询再做产品,数据治理这个领域国内企业对方法论的理解,以及组织和制度的配套都还很不够,如果单纯销售产品,客户价值很难体现出来。想做这个产品的难度并不大,但是只有客户对这项工作的认知和实践程度越来越深,才会慢慢的有软件产品的需求,软件才能更好的发挥出价值。

所以我们的思路是先做培训,进而延伸到咨询服务,御数坊现在具备数据治理全栈服务能力,能够满足多行业客户在不同阶段的数据治理需求。

爱分析:御数坊的产品设计思路是怎样的?

刘晨:根据这些年的数据治理工作经验,我们认为,客户之所以需要外部人员去实施数据治理工作,主要是两方面原因,一方面数据治理方法论的专业理解不足,以及,高水平的专业人员不够,这就造成客户开展数据治理工作的门槛比较高。

为此,我们从两个方面来尝试让客户的数据治理工作更容易上手。第一步,我们叫做标准化,将自己的咨询方法论沉淀下来固化在产品中。使用我们的产品,客户的数据治理的工作过程每一步都是方法论支撑的,因此结果自然是可靠的,同时,方法论的沉淀,也降低了对数据治理实施人员的能力要求。目前产品已经有部分模块比如数据资产梳理,数据认责,数据质量提升已经在一些客户得到了验证,后续会加强推广。

第二步,我们把数据治理的能力自动化、智能化,在每个环节上做智能化的设计和实施,这部分目前我们正在做一些实践,对互联网领域应用的比较成熟技术像语义分析、深度学习、神经网络等技术会嵌入到数据治理的整个过程中,进一步降低对数据治理人员的依赖。这部分我们也已经跑通了一些场景和算法,正在与标准化的部分相融合。

爱分析:数据治理产品中有哪些产品线?ETL是产品的核心吗?

刘晨:我们的数据治理产品叫做DGOffice,理念是“一室六中心”,我们的咨询工作就是帮助客户建立数据治理组织架构和工作机制,建立数据治理办公室,我们的产品也叫作数据治理办公室,也希望用起来像Office一样简单易用,降低客户开展数据治理工作的门槛。

六个中心具体包括:数据资产中心、数据架构中心、数据标准中心、数据质量中心、数据安全中心及数据运营中心,这六个中心负责不同的数据治理能力,由智能化中心提供AI能力支持。

ETL并不是数据治理产品的核心,准确来说ETL不是数据治理的产品。它属于数据生产的工具,而我们做数据治理的产品是属于数据管理的工具;打个比方,你干活需要用到铲子,这是生产工具,使用铲子干活做了多少工作量,比如铲了多少次、铲了多少量,需要记录下来,这时候就用到管理工具。

爱分析:御数坊的数据治理实施过程与数据中台的建设关系是怎样的?

刘晨:首先数据中台建设过程中,需要先有数据治理,但数据治理又不能局限于中台。数据由上游业务系统产生,经过采集之后做数据清洗。这其中会有上游的脏数据存在,源源不断的脏数据会使得我们一直被动地去响应,造成数据数据清洗的诸多不便,因此对于大范围采集或者企业级数据的治理,需要对上游系统做整改,以求数据质量的改进。

而面向业务场景数据质量专项治理中,一定要与源端系统、源端业务相结合,这个价值在业务订单量,业务销售额的核算中都能体现出来,业务价值很清晰。相反,如果将数据治理工作局限于数据中台的建设,业务数据的根本问题没解决,那么业务价值就不是很明显,更倾向于给it团队或者数据团队做了一些保障性的工作,但这部分工作被业务部门和公司领导认同的价值就相对低一些。

当然,从源端治理的模式可能会比较重,这取决于客户的推进决心和力度。从御数坊的实践来看,源端治理的模式业务价值很明显,也能给中台建设起到很好的数据质量保障。

爱分析:御数坊未来的产品定位是怎样的?

刘晨:我们还是专注在数据治理这个领域,简单来说,还是刚才提到的“标准化和智能化”的两个理念的深化落地。为了将数据治理的价值真正体现出来,我们会选择长期合作的客户,也会面向具体行业和也业务领域,提供更加符合客户使用习惯或某些业务领域工作特点的定制化版本,为此在产品架构上我们会非常注重可扩展性和灵活性,支持多种部署和二次开发模式。

服务于多行业大型客户,与数据治理生态合作共赢

爱分析:数据治理项目主要面对什么样的客户?客单价是多少?

刘晨:对于客户而言,首先是数据体量大、数据环境复杂的大型客户。一般更对数据治理理解更深的客户,会比较理性看待咨询和产品的作用,更愿意选择我们。因为我们的专业经验丰富,专注做数据治理,业务聚焦,数据治理的方法论也更务实,能够帮助客户切实见效。所以对我们而言,一般数据治理上走过弯路的客户更容易与我们达成合作。

客单价方面,省级的电网客户客单价一般是百万级。我们去年最大的项目单价接近500万。总体而言,我们去年营业额是千万级,最近几年每年都在100%以上增长。

爱分析:目前行业中出了能源,金融,和电信运营商外,还有哪些领域是数据治理需求比较高的?

刘晨:政府有一些垂直领域如税务,还有面向地方的电子政务有数据治理的需求,房地产行业今年的数据中台和治理需求也比较旺盛。另外零售行业也有较高需求,比如最近找到我们的某个零售集团,他们在国外收购了两家公司,这时候国内和国外的产品体系不一样,需要做产品数据的标准业务流程梳理。

爱分析:行业内的竞争格局是怎样的?

刘晨:不完全称为竞争,叫做竞合可能更合适。做数据治理的公司主要有四类:纯咨询公司、纯产品供公司、做数据中台的公司以及行业性的IT服务商。

单纯做咨询的公司,国内就只有我们,剩下的都是国外公司如四大咨询公司。所以就国内来看,做数据治理咨询服务我们算一个大规模的团队了。产品方面,有几家老牌公司和新兴创业公司,但大家不完全是竞争关系,在很多项目上我们都有合作,比如中台公司或者行业IT服务商负责数据平台建设,我们负责数据治理咨询和应用需求设计,产品公司提供基础产品组件。

数据治理领域也是个小生态,在其中大家各司其职、各自发挥优势、共同成就客户,御数坊也以开放的心态与各方合作共赢。