工业

起步于工业数据平台,大数点志在技术能力输出

在巨头林立的工业大数据领域,大数点如何取得一席之地?

2017年10月11日
指导 | 凯文调研 | 凯文 关蕾 撰写 | 关蕾
  • 工业
  • 工业大数据
  • 工业4.0
  • 大数据平台
  • 大数点
  • 智能制造

在工业领域,大数点是一家技术特点鲜明的数据服务创新企业。创立之初,大数点确立了技术能力输出的战略方向,发布的产品工具属性相对突出,表现出较强产品化能力。大数点的打法是,以工业数据平台建设的方式切入客户,在单一客户中做深,逐步覆盖所有需求,实则瞄准的是后续合作订单空间。目前阶段,大数点的重心是深度扎根行业细分市场,打造行业解决方案,逐步扩大行业影响力。

工业领域,大数据应用也在逐渐落地,并陆续冒出一批创新企业,其中,大数点是一家技术特点鲜明的数据服务创新企业。

大数点创始人犹杰曾是爱立信(德国)系统工程师,被评为卓越工程师,后任职百视通总架构师;CTO Matthias Hub曾是IBM Bluemix IoT首席软件架构师,开创了Bluemix的数据仓库。创始团队在分布式计算、物联网等领域的有十年积累,大数点早期业务以工业物联网为主,聚焦在海量设备连接、实时数据处理和存储等方面。

随着数据量的剧增,客户需求的逐渐深入,大数点逐渐将重心转移到大数据算法、模型引擎层面,打造工业大数据底层核心系统,同时在产品设计上,也由工业物联网演变成工业大数据平台。

目前,大数点以大数据基础平台建设为核心,开发了包括工业物联网总线IoT DataHub™、实时数据仓库DSDB™、数据流引擎Flow Engine™等三大核心产品,用于设备连接和数据处理、数据储存和管理、算法引擎和模型训练。

创立之初,大数点确立了技术能力输出的战略方向,发布的产品工具属性比较突出。在定制化为主的工业大数据领域,表现出较强产品化能力。大数点的基础平台产品可通用于各行业客户,客户的差异点和定制化部分体现在算法层面。

受多因素驱动,工业大数据呈必然趋势

国内市场,工业大数据的兴起始于2015年,在国家级规划纲要、标准规范中明确指出,工业大数据是智能制造标准体系五大关键技术之一,是制造业挖掘价值、推动变革的重要手段。

据工信部公布数据,近两年时间,有162家工业企业成功申报了智能制造示范项目,成为改革先锋,涉及能源、制造、汽车、医疗、航天等多个领域,其中,工业大数据是主要试点方向。

在政策、技术、需求等因素的共同驱使下,工业企业对大数据的认知正逐步渗透。目前阶段,数据采集、大数据平台建设是主要切入方向。

工业企业对自身业务的改革需求相对清晰,但对大数据的认知尚不明确。在企业与数据服务商的合作中,需求探索、业务理解是前期必不可少的阶段,驻场、咨询、合作办公是常见的模式,探索大数据适合的应用场景是发展关键。

大数点成立于2015年,属于较早一批入场的创新公司。锂电池行业是大数点切入的首个领域,项目从大数据平台建设开始,后续开始探索数据应用,逐渐丰富场景开发,覆盖客户需求。对大数点而言,解决标杆客户需求、积累算法模型、打磨行业解决方案是发展重点。

目前阶段,大数点覆盖了生产管理、物料管理、产能分析、故障预测等应用场景。凭借复制性较高的行业解决方案,大数点在锂电池领域已扩展至6家同类企业。

经过两年的沉淀,大数点的客群由最初的锂电池制造行业,拓展至精密制造、光伏电站运营、汽车分时租赁运营等四大客群。这几类客群对大数据有一定认知,信息化程度高,但自身大数据能力较为薄弱,大数点以同样的打法切入,从建立工业大数据平台开始,应用场景在合作中逐步渗透。

在中国市场,工业元器件供应商众多,市场分散度高,设备结构复杂。在实际应用中,具体的应用场景对企业的重要性也不尽相同,企业更倾向于定制化方案,对单一产品的数据服务商接受度较低。因此,大数点的打法更适合与中国市场,在灵活性、价格、服务等层面更有竞争力。

整体市场仍处早期,困难与机会共存

由于多数工业大数据最终应用于具体业务,随着双方合作的不断深入,服务商对行业理解更加深厚、产品更加完善,客户更换服务商概率逐渐变小。

大数点选择深度扎根行业细分市场的战略,为行业优质客户提供定制化解决方案。虽然客户数量不占优势,但多数都有续单,在单一客户处,逐渐渗透至覆盖全部需求,从而形成自己的行业解决方案,构筑竞争壁垒。

对于工业大数据,工业企业是数据的生产方,主要来源于生产制造和产品运维环节。工业数据具备线下规模化、复杂化、实时性、准确性等特点,数据可用性较强,受客户价值驱动特点明显。

大数点作为发展初期的第三方数据服务商,在数据源、需求探索、行业理解上都依赖于工业企业合作,其产品、模型的迭代更直接受客户数据和需求驱动,因此,客群规模与公司整体发展速度相关性较强。

大数点创始人犹杰在访谈中表示,客户开拓将是大数点下一步重要战略之一。

从行业发展进程来看,目前工业大数据尚处于初级阶段,工业大数据与物联网是传统制造型企业变革的必然趋势,但实际运用中仍存在诸多困难与挑战,具体如下:

首先,工业业务理解是高门槛,探索场景、应用落地是未来一段时期的行业热点;其次,数据来源散乱,数据格式、规范难以统一,互通融合相对困难,工业大数据标准体系的研制是业内重点期待;再次,高端设备不能自主可控,物联接入时读写困难,从而诞生新的数据孤岛,制约瓶颈有待突破;最后,已落地的应用场景覆盖率低,大部分需求仍未满足,后续市场空间仍需探索。

工业数据服务商是产业链上新生形态,属于新兴市场。在早期市场发展中,困难亦是机遇,与竞争激烈的互联网大数据领域相比,工业数据服务的创新公司成长更快,出成果概率更高。

当前阶段,市场集中度尚未形成,跑马圈地仍是各家重点。然而,一些细分领域已出现竞争力较强的个别企业,新能源、精密制造、电力、石化等行业发展较快,入场的玩家包括高举高打的国外巨头、积极布局的行业标杆、以及跃跃欲试的创新企业。

参考国内工业软件市场特点判断,预计未来整体工业大数据市场仍以分散为主,或将在单一细分市场逐渐趋于集中。

大数点创始人犹杰(左)和首席科学家Ivan Uemlianin(右)

近日,爱分析对大数点创始人兼CEO犹杰进行访谈,现将部分内容分享如下。

一家技术驱动型创新公司,三个产品打造工业大数据平台

爱分析:大数点经历了哪些发展历程?

犹杰:2015年3月,我与两名外籍同事成立初创团队,基于我们在分布式计算、物联网、人工智能等项目的积累,我们决定回国创业。

我们看到,传统IT企业的数据处理能力不足,我们的系统非常适合解决这个需求,像产线、设备控制系统等中,测试数据、工业控制信号的数据快速处理、分析等。我们决定将之前积累的工业物联网系统应用到工业中,连接工业设备数据,服务制造类、运营类企业。

大数点的第一个阶段是物联网连接,做工业物联网,用产线的业务逻辑做数据简单处理,像在产品生产检测环节中,做质量判断。

第二个阶段是数据分析和应用,我们把大量的设备数据采集到大数据平台上,对实时数据进行快速挖掘规律,用人工智能算法对数据进行学习,得出的模型集成到核心产品数据流引擎Flow Engine,我们的产品逐渐从工业物联网演变成工业大数据平台。

爱分析:目前阶段主要产品有哪些?

犹杰:我们有三个相辅相成的核心产品,在项目中同时应用。

一,IoT DataHub工业物联网数据总线,我们将软件包植入到数控机床的控制系统中,通过标准的物联网传输协议MQTT采集运行数据,传输到我们的平台。我们做了很多操作系统的适配,有各种版本的软件包。

二,Flow Engine数据流引擎,对数据进行建模,比如机床的数据建模,先将参数做分类,看能否找到某种模式做固定生成若干类别,再对这些分类做判断和预测。

三,DSDB实时数据仓库,配合前两款产品使用,把经过Iot Datahub的数据进行存储,将非结构化数据提取成结构化数据。

爱分析:如何完成数据从非结构化到结构化的转换?

犹杰:传统数据库需要先定义字段,数据才能写入,在上传时需要匹配验证,吞吐率很低。对于工业数据,多数情况是未知的,DSDB数据库是非结构化的,在上传时不定义字段,对任意数据都支持直接存储、分析、处理、展示,在数据完整度、存储量、效率等方面有很大提升。此外,DSDB数据库集群可以随着数据量的扩充而逐步扩展,我们称为数据湖。

从非结构化的数据提取成结构化数据,数据湖中的数据分析引擎用MR框架,可以把储存在多个节点里的海量数据快速清洗,做分布式计算。

比如一大部分数据都落到一个很大的类里面,可能就定义为正常数据,如果落到一个数据小的类,可能对应某种异常波动或故障,之后再去判断是否产生了某种故障,逐渐修正种类数量。

我们的Flow Engine可以测试、调整、验证模型,模型调好之后,直接在产品中固定应用,再去预测故障。

爱分析:现阶段更侧重于数据分析?

犹杰:是的。目前有很多做数据采集和连接的公司,但大多缺乏数据分析能力。大数点除了连接设备以外,更重要在于数据分析,Flow Engine是我们的特色,是对实时数据分析的系统。

爱分析:数据是从现有系统里直接获取,还是依靠增加传感器采集?

犹杰:两种都有,加传感器取决于应用场景和要解决的问题,是否需要增加数据的维度。一些自动化设备,像数控机床,我们直接连接控制系统就可以拿到几乎所有的数据,对于传统机床,或转轴类设备的振动测试,多数依靠外加的传感器。

爱分析:对于传统工控通信协议,像Canbus、Modbus、Profibus等,用IoT Datahub如何上传数据?

犹杰:如果是传统协议,我们会配备大数点物联网关,通过一个硬件设备和软件包,转成标准的MQTT协议,再进行上传。软件包对应着云端集群,需要多个计算机节点处理数据,这是我们的强项。

爱分析:Flow Engine能否对需求建模?

犹杰:可以,除了设备,还有其他需求,比如ERP的财务数据,包括库存数据、订单等,用Flow Engine可以对订单、库存进行预测,对业务需求进行建模。

爱分析:在对业务知识理解有限的情况下,DSDB从非结构化转成结构化数据时,如何进行数据标注?

犹杰:这是工业大数据面临的重要挑战,在智能制造领域,更需要综合性人才,IT与OT(Operation Technology)两种领域的技术结合,目前主要靠合作。

我们的模式是与制造业充分配合、合作,项目中有双方的工程师,他们帮助提供一些信息、解释、分类标注。有两种标注方式,一种先人工标注,再用监督学习;另一种先用非监督型学习,自动分类形成某种标注,再人工判断。大部分场景需要配合业务工程师进行标注,是一个合作共赢的过程。

爱分析:自动标注能否举个例子?

犹杰:像检测数据,标注异常或合格,用算法会对数据进行分类,分类之后发现一些是非正常数值,就不需要人工再判断。

爱分析:需要客户标注哪些数据?人工标注的工作量占了几成?

犹杰:一些报警信息、设备已有的故障类型、保护限制等,通过客户标注可以直接使用,大约占六成工作量。

细分市场深耕战略,行业解决方案是壁垒

爱分析:目前切了哪几类客群?

犹杰:两类客群,一个是制造商,包括锂电池制造、精密制造等,另一个是运营商,像光伏电站运营、汽车分时租赁运营平台等。

爱分析:大数点为锂电池制造商提供了哪些产品和服务?

犹杰:我们为锂电池制造商欣旺达提供了多个方面的服务。

一,多厂区监控,包括运行指标、故障分布等;二,智能排产排程,我们把生产过程、物料、库存、员工、订单等信息进行综合计算分析,实现智能排产;三,设备故障预测,针对锂电池生产环节的各种设备;四,工艺环节,像电芯分选,将电芯分选机连到云端,通过人工智能算法,对电芯的特征进行学习、自动分类,与人工分选相比,我们提升了2.5倍的分选效率。

爱分析:在项目中对接了哪些企业数据库,与哪些部门做对接?

犹杰:包括ERP订单数据、仓储管理系统、OA员工管理系统、产线控制系统等,整合不同数据源打造大数据平台,多数部署在本地,做私有云。一般IT部门负责规划和决策,最终是生产部门使用,直接对接产线。

爱分析:项目周期多久?

犹杰:现在每个客户基本上需要半年时间。大部分是做项目,我们基础平台是通用的,对客户使用的算法不一样。

爱分析:光伏电站客户主要解决哪些需求?

犹杰:主要包括设备实时监控、故障预测。根据不同组件特征,我们在4-36个小时提前发出故障告警。

爱分析:客户对数据开放的理解和接受意愿如何?

犹杰:目前是私有云模式。一开始接触客户时,很难把效果展示出来,很多算法需要先接入数据才能做模型。我们采用试用模式,先把平台给客户试用,看到效果之后再确认订单。

爱分析:前期了解客户需求的时间需要多久?成功率如何?

犹杰:三个月左右,成功率在60%以上。

爱分析:现在团队能同时支撑多少客户?

犹杰:10个客户,一般一个项目需要1-2个工程师。

爱分析:工业细分领域集中度较高,很多行业巨头也在介入,大数点如何考虑?

犹杰:我们聚焦在智能制造领域,有大数据理念,在尝试中遇到技术难点的企业,大数点通过我们的技术与他遇到的问题做匹配。另外,从细分市场的角度看,在同行业企业中,我们的产品可复制成分很高,我们用锂电池方案开拓了6家同行业客户。

爱分析:从需求层面上,目前解决了多少比例?

犹杰:在大型制造企业中,可以做的内容非常多,我们目前做了40%,续单率很高,我们可以在单一客户处收获很多。

目前以平台项目为主,未来将转型技术能力输出

爱分析:采用怎样的定价模式?

犹杰:有两个部分,平台是按照年收费,定制化业务按一次性收费。

爱分析:工业企业现在是否有大数据的预算?

犹杰:大数据的预算在百万量级,以试点为主。

爱分析:目前阶段,以建大数据平台为主还是应用为主?

犹杰:平台类多一些,还在收集数据,目前客户总结的需求是脱离数据的。

爱分析:后期部署需要多久?

犹杰:部署需要一天时间,开发阶段需要驻场了解需求,运营时候不需要驻场。

爱分析:是否会逐渐渗透单个客户的所有需求?

犹杰:是的,我们会在一个客户中做深,分期逐步展开,把所有需求都做掉。

爱分析:国内工业领域,已经在做大数据的企业有多少?

犹杰:我们看到有20%的企业宣称在做,落地的不多。

爱分析:大数点有哪些对标企业?

犹杰:C3IoT、Uptake,SoftwareAG、GE Predix。

爱分析:下一步公司整体战略是什么?

犹杰:正在扩张售前、销售、市场团队。战略上会针对不同行业成立子公司,大数点做纯技术公司,做技术能力输出,授权子公司服务行业,包含销售、应用开发。

爱分析:工业中,还有哪些细分领域目前适合接入大数据?

犹杰:工业企业保险与供应链金融,包括物流体系下的金融服务,需要物流环节的设备监控和数据分析,贷款模型、保险模型,是很好的应用领域。

爱分析:工业大数据或者物联网领域,我们看到很多行业巨头在里面,相比之下,大数点作为第三方创新企业,有哪些优势?

犹杰:我们在数据分析能力、产品灵活性、价格等方面有优势,传统企业对制造和设备的理解更深刻。

爱分析:未来市场格局如何?

犹杰:长远来看,大企业做智慧园区、智慧地球;创新公司,直接为企业提供分析服务,或提供算法交易服务,我们与大企业将各自占有相应的市场份额,大企业有可能在一些最终环节通过我们来落地。

爱分析:中美市场有哪些差距?

犹杰:美国的阶段已经完成了大数据平台建设,逐渐偏向于应用,不同业务领域已经有一些标准化组件。中国制造企业非常繁杂,供应商较多,做标准化产品较难,目前打法是满足客户不同需求。