零售

阿里数据团队第一人,如何让数据中台落地线下零售?

DT时代,线下零售需要AI驱动的数据中台

2019年10月28日
调研 | 黄勇 赵子梦 撰写 | 赵子梦
  • 数据智能
  • 零售

线下零售是数据智能的“待垦之地”,无论在数据采集还是数据应用上,都比线上更为落后。奇点云定位于AI驱动的数据中台,在数据采集端通过AIoT智能硬件完善线下数据基础,在数据中台端通过AI算法实现数据驱动的业务智能。

站在今年“中台元年”回望,“中台”概念从2015年被阿里巴巴首次公开提出,到如今已经走过了四个年头。

阿里巴巴是中台实践的先驱,而作为阿里数据团队和数据基础设施构建的第一人,张金银完整地经历了阿里 “数据中台”和“业务中台”的诞生过程。他是阿里第一任数据安全小组组长,阿里第一个数据仓库的建立者,阿里云大数据平台数加创始人。

在服务阿里12年后,张金银创办了奇点云。继承着中台“根正苗红”的基因,奇点云希望利用从线上零售领域中积累的数据力量,帮助线下传统企业进行数字化转型和升级。成立初期,他们看到了线下零售这片数据赋能的待垦之地。

阿里数据团队第一人,如何让数据中台落地线下零售?

张金银认为,未来的技术体系一定是“两云一端”,“两云”指的是数据中台和业务中台,“一端”指的是智能硬件终端。而AI驱动,在“两云一端”上都有所体现。

奇点云将自己定义为「AI驱动的数据中台」,一是因为这是奇点云的优势领域,二是因为市场上有很多公司在做业务中台,奇点云可以与这些公司合作来提供「两云一端」的服务,而不是提供所有的业务模块。奇点云可以把数据计算的结果和算法输送到业务中台,去赋能客户的业务。

阿里数据团队第一人,如何让数据中台落地线下零售?

之所以布局“一端”,是因为奇点云看到,缺乏数据尤其是人货场的过程性数据,是线下零售企业实现数据驱动的第一道坎,也是核心的一道坎。因此,通过部署AIoT智能硬件补齐人货场过程数据,是线下零售企业建设数据中台的前提。

奇点云自主研发了几款AIoT智能硬件终端,包括奇点识客、奇点魔盒(奇点魔柜、StartGo无人店)等产品。基于计算机视觉等AI技术,这些智能硬件能够帮助线下零售企业获取更多人货场数据。

在“两云”端,奇点云的重点在数据中台。数据中台积累数据资产后,利用AI驱动的深度学习算法,将数据分析和预测结果对接至业务中台或业务系统,赋能销量预测等业务场景。此外,反馈结果不断回流至算法模型,实现模型的迭代。

目前,奇点云已服务了200余家传统零售领域的客户,涉及大时尚、生鲜超市、综合体、百购、烟草、美好家居等业态。未来,奇点云将继续专注在传统零售深耕,并成立了行业专家团队,将技术与行业经验做结合。

阿里数据团队第一人,如何让数据中台落地线下零售?

近期,爱分析对奇点云创始人&CEO张金银进行了访谈,主要就中台的发展历史、应用现状以及奇点云的业务情况进行了交流,现节选部分内容与读者分享。

补齐客户数据,AI“武器”替代人工

爱分析:奇点云为何选择用数据中台赋能线下零售这个领域?

张金银:首先,数据中台是一个很好的领域,是未来整个商业进入“DT时代”的一个重要基础设施。我们创业的初心,是为了能够帮助线下传统企业进行数字化转型和升级。

2017年年初我们刚创业的时候,很多客户还对数据中台没什么概念。但行业经过两年的发展,加上我们技术产品也在打磨,现在客户和市场基本上不需要教育,更可喜的是很多客户能够直接找上我们,整个市场的认知度和接受度已经比以前好很多,甚至超出我们的预期。

我们从阿里出来,希望能够把阿里的一些经验复制到线下,因为阿里对数据智能的认知领先了传统企业五到十年。

在线零售和线下零售最主要的差别是,在线零售是全程在线化、数据化、智能化的。这三个是一个先后关系,前提是要在线化,然后才能数字化,最后才能智能化。

但是对于线下传统零售企业来说,在线化可能都很难做到。一家店结束一天营业之后,你问店长今天门口经过了多少人,哪些人是客户,进来了的人中男女比例是多少,这些人中哪些是新客,哪些是老客,看了哪些没买,看了哪些买了。这些人的“过程数据”通通是没有的,只有货物的结果数据。所以这是线下零售企业一个急需解决的问题。

爱分析:如何理解“AI驱动”的数据中台这一定位?

张金银:我们定位为AI驱动的数据中台,而不是普通的数据中台,是我们对服务客户的认知决定的。

我们的第一个认知,是我们既要解决客户数据使用的问题,更要解决客户数据生产的问题,特别是消费者行为数据的生产问题。有些数据中台服务者,他们假设的前提条件是客户已经拥有了丰富的数据。他们用一个很好的,能够支撑很大计算量的数据平台,加上很好的分析和挖掘的工具去服务客户。

但我们对客户的认知不是这样。过程数据相当重要,以我们在阿里的经验,只有货物的结果数据是没用的,把过程改善了,结果自然就会改善,所以改善过程很重要。

我们要通过AI的手段去补齐人货场的数据。随着5G和视觉计算技术的发展,我们很早就筹建了自己的视觉计算团队,目的就在希望通过机器视觉技术补齐更多人货场数据。我们在这块也取得了很好的效果。很多客户都已经在用我们以摄像头为核心的IoT硬件,这些硬件能够帮我们的客户补齐数据。数据补齐了,数据中台的力量才能发挥出来。

比如,我们服务的一家客户,没有任何线上业务,在线下有9000家门店,找到我们做数据中台。我们发现它只有300G的数据,数据量太小,这些数据一个笔记本电脑就可以装下,根本没必要用更高级的“武器”来对待。它首先要做的反而是补齐数据。

我们的第二个认知,是以前的传统线下领域里,人工的经验居多,智能的经验很少。当然也是因为没有人去服务他们,没有人去用机器替代人工,而机器是可以替代人工的。

比如我们的一个客户是做生鲜超市的,生鲜超市面对的最重要的一个问题之一是,第二天要进多少生鲜,因为生鲜对时间非常敏感,进多了就会浪费,甚至会坏掉,进少了就会断货。所以它需要通过数据去解决这个问题。

它以前是根据人工经验去用Excel算出来。人的算力有限,只能根据以前的历史销量去做一个简单的预测。我们开始服务后,第一步就做了数据升维,捕获他的人货场数据,再加上天气数据、节假日数据、它的历史销量数据,把它以前仅有的19个维度,升级到139个。

我们用了深度学习的算法,而不是只是Excel,因为深度学习算法最重要的是开始不一定很准,但它是越用越准,因为它会把结果再回流到模型里面校正自己的模型。

我们上线了几个月,把这家客户的生鲜补货的损耗率降低了35%,一家店就可以节约几百万。这是一个典型的机器替代人工的很好的案例。

所以这是为什么我们要做AI驱动的数据中台,主要体现在两个方面。一个方面就是我们用视觉+AIoT的方式去捕获人货场数据。另一方面就是我们在数据智能应用端,用数据智能算法去替代人工经验。

数据中台之“通”,业务中台之“享”

爱分析:奇点云的“两云一端”业务体系是否有侧重?

张金银:数据中台、业务中台,加上智能硬件的“两云一端”是我们很早就有的想法,今天也并没有改变。只不过在业务中台方面,因为现在有很多公司在做业务中台,我们可以跟他们合作,把我们数据中台计算的结果输送到业务中台,从业务中台去和客户的业务系统做结合。

爱分析:数据中台是怎样发展起来的?

张金银:数据中台的历史起源是来自于我2004年加入阿里巴巴,那时阿里没有任何的数据团队和数据技术基础设施,我作为阿里构建数据团队和数据的基础设施的第一个人。那时候我们还叫“数仓(数据仓库)”。

2009年,阿里决定要“去IOE”。我们以前做数仓,会买IBM服务器,用OracleRAC软件去做,并用EMC存储,所以是“IOE”。但是,淘宝的业务增长非常快,到2009年的时候我们就发现我们总共使用了Oracle RAC的20多个节点,当时在整个亚洲是最大的。

我们发现,后面会发生的问题主要来自两方面,一方面是我们预期到淘宝的业务量可能还会增长一百倍甚至一千倍,而Oracle RAC因为共享磁盘技术的限制,导致它不可能再增长一百倍、一千倍。所以我们一定要寻找新的技术。

另一方面,我们每年交给IBM、Oracle RAC、EMC的商业费用很高,如果我们再增加一百倍,可能每年阿里的利润都会填到这里去。所以当时要去IOE,自建分布式的数据平台,这就从数仓阶段迈入了数据平台阶段。2015年陆兆禧兼任阿里CDO,把阿里巴巴数据技术团队做了大一统,成立数据平台部,用自己的开源技术支撑整个阿里巴巴的数据工具的发展。

2015年,“数据中台”又被提出。所以,数据中台的来源就是四个阶段,从数据库,到数据仓库,到数据平台,再到数据中台。

爱分析:业务中台与数据中台有哪些区别?

张金银:业务中台比数据中台起源要晚。最早我们建淘宝的时候,要建会员体系、商品体系、订单体系。后来建淘宝商城,也自建了独立的一套体系。后来要建聚划算,我们就发现了问题,这会让消费者非常麻烦。

那时候还是PC时代,一方面消费者要注册两个账号,另一方面是在淘宝里搜不到淘宝商城的商品,因为商品互不相通。要建聚划算时,阿里高层做了一个“五彩石”项目的决策,把订单中心、商品中心、交易中心等这些功能模块抽象出来。聚划算就是基于五彩石之上来做的业务改变,七个人做了一个半月就上线了。

业务中台和数据中台本质的差别,就是业务中台最主要的是解决业务多端共享的问题,不要重复“造轮子”;数据中台最主要的是解决“打通”的问题,怎样把各个BU获取的数据通用。

比如,你可能用支付宝交水电费,用淘宝购物,用高德导航。以前这些数据都是沉淀在各个BU里面,那怎么能够把这些数据归集到一个大的数据计算平台里,并且把它打通,赋能前台业务?

拿UC浏览器来说,它被阿里收购后,我们就发现浏览器里要解决的一个问题就是冷启动问题,就是你第一次使用UC浏览器,我们怎么给你推荐你爱看的新闻。当时我们阿里数据平台部和UC专门成立了一个项目组来解决这个问题。

你可能是第一次使用UC浏览器,但你可能不是第一次使用阿里的服务。你可能在淘宝里留下了痕迹,在支付宝里留下了痕迹,那我们可以通过淘宝和支付宝大概率推测你大概是什么样偏好的一个人。将这些偏好属性反馈给UC浏览器,UC浏览器就可以针对性地推荐你要看的新闻。

所以,数据中台和业务中台还是有很重要的差别。

爱分析:从市场需求和商业模式的角度,如何看待数据中台和业务中台?

张金银:我们有三个认知。

第一个认知是,数据中台和业务中台相比,客户基数会相对大一些,因为大家都需要做数字化转型。回归到BI和数仓层面,这二者很早以前就出现了,大概有20年了,所以大家都有看数据的需求,不管是大公司还是小公司。

业务中台会稍微不太一样,最主要的是解决是多端共享的问题。一家公司要既有线上业务,又有线下业务,有多端的业务,才会催生它去解决共享的问题。所以我觉得业务中台的客户基础相对来说会比较窄一点。

第二个认知是,数据中台相对来说产品化率更好,因为无非就是底层一个数据平台,上面有BI工具,有算法的工具,对数据进行加工挖掘。但是业务中台会深入到客户的业务里去,所以定制化率会更高一些,相对来说规模化的速度就不会那么快。

第三个认知是,客户对业务中台和数据中台的决策成本会不太一样。因为数据中台相对来说不会去影响业务,所以客户决策会快一点。业务中台因为和客户的业务做紧密的耦合,所以相对来说决策成本会高。传统企业的数字化转型过程中,数据中台是很基础的一个需求。一些业务比较复杂、有多渠道业务的企业会有业务中台的需求。

中台“土地”上,用智能应用帮客户“种果树”

爱分析:现在零售企业建设数据中台的逻辑一般是怎样的?

张金银:我们从零售行业开始,是因为零售企业特别讲究真功夫,不是靠关系取胜。零售企业家非常的务实。所以他们一定是要看到数据中台对他们的业务有什么促进。数据中台或AI都只是工具,最终目的是为了把自己的业务做好,这才是最重要的。他们一定是站在业务的角度思考,我们公司也是这么思考问题的。

打个比方,数据中台可能是一片广贸的土地,但是我们客户要的往往是土地上长出的苹果。所以给客户土地的同时,要给它栽苹果树,能看到树上有苹果产出。

爱分析:所以具体做项目的时候,会相对定制化,根据客户具体需求在解决方案层面不断做延伸?

张金银:实施会相对定制化,数据中台和AI本身是通用化的。就像我分享的生鲜损耗模型,还有我们帮很多服装客户做的店货匹配模型,跨行业也具有通用性,一定要把这些智能应用的“果树”帮客户栽上。

爱分析:奇点云主要服务零售渠道商还是品牌商?服务两类客户会有哪些区别?

张金银:渠道商和品牌商我们都会服务。很多品牌商渠道割裂,它们的数据很多也是堵在渠道,所以很难去补齐它们的数据。但是越来越多的品牌商看到了这个问题,并且在积极地解决。我觉得从商业角度来说,中间渠道商的空间一定会慢慢会被压缩,因为越来越多品牌商想摆脱渠道商的控制。我们接触的很多客户都有类似的想法,他们希望能够直接去接触消费者。从业务的角度来说,是去获取人货场数据。

所以他们已经通过很多方法,例如让消费者扫码,把智能设备直接铺到消费者面前。电商平台也是很重要的手段,因为电商平台直接面向消费者,这也是为什么那么多品牌商愿意开旗舰店。这样是多方共赢的,品牌商乐见其成,因为它能获得消费者数据,也能更好地让利给消费者。这个发展不会那么快,是一个渐变的过程。

爱分析:客户在落地实施数据中台的过程中会遇到哪些难点或挑战?

张金银:第一大难点是解决客户数据生产的问题。很多客户都意识到数字化转型的重要性,但是我们光给他一个数中台是没有用的。很多客户无数据可用,我们要能够帮客户补齐数据。

第二个难点是用数据智能化应用带动数据中台。很多客户知道数据中台这片“土地”,但实际上更愿意看到的是在土地上种出来的苹果。所以要找到客户能感受到的业务数据智能化的点,再带入数据中台。这些点要在行业里积累。

第三个难点是解决人才匮乏的问题。有的客户的IT部门比较难对我们数据中台这样高进阶的武器进行使用。但是我觉得这个状况在未来几年应该会改变,因为随着大家对数据中台的认知增加,以后当客户的IT部门具备在土地上栽树、浇水、长出果实的能力之后,数据中台这块业务会逐渐发展得更好。

多个行业适用,但重视专注深耕

爱分析:除了零售的几个核心应用场景之外,奇点云在政务领域会做哪些应用场景?

张金银:从今年开始,我们的业务比例发生了变化,零售领域占我们业务的70~80%,政务业务只占10~20%。政府也是很适合的客户,我们这些数据中台的技术,政府也非常需要。以前政府的数据也是割裂的。政府希望能够通过大数据,打通各部委各条线的数据。

在政务领域,我们帮余杭区和未来科技城做了“企业大脑”。未来科技城管委会可能只有十几个人,但是实际上它要管理大概几十个园区,一万多家企业,如果靠人工的方式,是没法管理的。

“企业大脑”把所有企业相关的数据都做到打通。比如说企业的税务数据、财务数据、工商数据、法院数据、物业数据、互联网公开数据。我们用我们的CDP产品对这些企业进行筛选、分析,例如去筛选未来哪些企业是最有独角兽潜力的。也可以去筛选风险比较大的企业。当然一些常规的分析也会有。我们在政府这块会慢慢走向产品化。

但是我们更多的是在零售上面发力,并且锁定在零售的几个行业里面。长远来看,其实技术门槛不一定很高,这就是为什么我们要专注到行业里面,我们要把行业知识和技术做结合,这样才能产生更大的竞争优势。锁定到行业之后,复制化、产品化、规模化的能力比多个行业散着打要好很多。

爱分析:不同行业的应用场景,从需求角度有共同点吗?

张金银:从技术的角度来说,他们共同点还是蛮多的,例如大家都需要数据中台的技术,或者叫数据平台技术。智能硬件技术他们也都需要。

从业务的角度来说,会稍微有点不太一样。但是数据智能模型还是有共同之处的。例如我们在生鲜行业损耗率的降低,以及烟草行业做的智能匹配,听上去名字不太一样,但实际上底层技术还是一样的,因为它无非就是怎样去做销量预测。

爱分析:如何看待做业务中台的企业延伸到做数据中台?

张金银:我觉得从业务中台跨到数据中台还是挺有难度的,因为不管是对业务的理解,还是数据技术来说,都有一定壁垒。

业务中台最重要的是理解客户的业务,解决多端业务共享的问题。从技术角度来说,它解决的是高并发的问题。而数据中台在技术上要解决大规模计算的问题。所以用到的底层技术是不一样的,用到的工程师是不同的工种。

业务中台更过多关注流程性,数据中台更多关注智能性。所以,我不担心以前做ERP的厂商转过来做数据中台的竞争。ERP厂商转做业务,我觉得倒更顺理成章一些。