工业

工业互联网领域,寄云科技选择了数据这块最硬的骨头

寄云科技,是国内工业互联网领域的一方新锐势力

2017年11月02日
指导 | 凯文调研 | 李喆 关蕾 撰写 | 关蕾
  • 工业
  • 工业物联网
  • 工业大数据
  • 工业互联网

工业互联网领域,寄云科技选择了数据这块最硬的骨头

工业领域,正成为云计算、大数据等技术的新战场,但业务理解仍是最深的壁垒。目前阶段,入场的玩家多聚焦在设备连接、经营类数据分析等方向,鲜少涉足更深层的设备控制类数据分析。但对工业企业而言,和设备相关的生产、运行等相关的数据分析是硬需求。一方有技术,一方有需求,但行业knowhow把双方阻隔在河的两岸。在这其中,一些创新企业开始破冰前行,寄云科技则是第一批过河的先锋之一。

寄云科技,是国内工业互联网领域的一方新锐势力。

众所周知,工业处于第四次工业革命的时期。负责设备连接的物联网公司聚焦工业似乎成了趋势,但从云计算和大数据领域切入工业的公司实数不多。而这其中,寄云科技是特点鲜明的一家。

寄云科技,成立于2013年9月,最初专注于跨云的部署交付与自动化编排。随后,业务聚焦在PaaS平台层,做开发者引擎和一系列外围服务,把数据库服务、MQTT服务整合到ADP上,将工具组合变成可交付的应用,此时的寄云PaaS平台从属性上更偏于集成平台iPaaS,但方向上已开始聚焦物联网和工业。

在访谈中,创始人时培昕介绍,寄云科技成立时的目标是用新技术改变传统行业,4年中,寄云在发展到一个阶段的高度后,都有新团队并进来,不仅包括大数据,还包括工业网关和数据采集,通过优势互补,解决了之前做不到的问题。

如今的寄云科技,战略布局从设备端到云端,以数据为主线,为工业企业提供设备连接、数据采集、数据存储、分析建模、构建交互式应用等完整的工业互联网解决方案。

在工业领域,数据来自于IT和OT两个系统,一部分涉足工业的数据服务商更侧重于做经营类分析,主要对接企业IT系统,包括ERP、OA、CRM等数据库。然而,工业企业中,IT系统建设相对薄弱,在数据种类、数据量级、数据价值等方面稍显逊色,在做IT业务系统的数据分析时,对客户业务的理解要求不多,门槛较低。

相比之下,来自OT系统的设备相关数据复杂度高、价值点大。在数据分析时不仅要解决实时、海量的数据存储和分析的问题,还需要对客户业务的深刻理解,搭建特定场景下的精准模型。

寄云科技选择后者,做企业的业务类分析,以对接设备的控制系统为主,聚焦在生产制造和设备运维两个方向。据时培昕介绍,寄云科技长处在于,第一,从生产数据出发,做质量和效率的分析;第二,从设备运行数据出发,做设备的健康管理故障预测和远程运维。

工业各细分领域专业性差异大,壁垒深,对于擅长数据分析而匮于业务理解的第三方数据服务商而言,做深单一市场的战略,比做覆盖多行业的打法更加行之有效。目前阶段,寄云数据聚焦在电力能源、轨道交通、智能制造等三大领域,已取得像上海城建、大唐电力、国家电网、中车等行业头部企业,获客能力不容小觑。

在访谈中,时培昕介绍,寄云科技的下一步战略是将在平台的基础上,把这三类垂直行业做深,打造精细化的垂直行业解决方案;对于其它工业行业,和合作伙伴共同搭建工业互联网生态平台,为更多专业客户输出寄云的平台能力,利用平台上开放的工具、模型和微服务实现快速的应用开发和数据分析,同合作伙伴共同帮助工业客户实现数字化转型。

近日,爱分析对寄云科技创始人兼CEO时培昕进行专访,现将精彩内容分享如下。

工业互联网领域,寄云科技选择了数据这块最硬的骨头

云计算、大数据、物联网,三大业务线协同发力工业互联网

爱分析:在整合云计算、大数据、工业网关三支团队时,尝试过哪些探索?

时培昕:寄云起步于云计算服务,在大数据、工业网关团队并进来之后,我们有了数据源头,能够采数据、做数据分析,于是我们开始探索整合方式,把云加大数据的IT能力与工业能力结合起来,打造了现在的NeuSeer工业互联网平台。

在工业设备端通过寄云的工业网关,可以接入各种工业设备数据,包括工业设备的运行、工况和作业数据等;这些实时数据和批量数据分别通过物联网协议和抽取工具发送到NeuSeer平台之后,NeuSeer平台会提供精细化的数据转化和治理,并针对不同数据类型提供包括文件存储、结构化数据库、对象存储以及时序数据库在内的多种基础数据存储能力,为应用开发和数据分析提供历史存储的能力。

NeuSeer平台提供了以数据为核心的工业数据分析平台和应用开发平台。工业数据分析平台不仅能够提供大量增强的工业算法和机器学习算法,还提供包括故障诊断、性能评估以及性能预测在内的工业模型,工业客户利用平台的模型训练和发布工具,基于历史数据快速生成新的故障诊断和预警模型;同时,NeuSeer平台还提供了基于微服务架构的开发套件,并且内置了大量包括物联网、安全和权限管理、数据库、消息在内的服务组件,以及开源的应用框架,工业客户可以快速的开发各种复杂的工业应用。

爱分析:在工业领域解决了哪些需求?

时培昕:我们看到工业三大趋势,需求定制化、生产智能化、收入服务化。以数据为导向的智能制造,主要是集中在设计、制造、运维三个方向。目前阶段,我们主要做制造和运维。制造是根据产线数据做质量、能效分析;运维是做健康管理、故障预测、性能优化。

市场上大部分工业物联网以连接为目的,大部分是数据采集到平台上做一个远程监控就截止了。我们是关注以数据为主线的工业互联网,关注的环节包括数据采集、存储、分析、做预测、构建交互式应用等一个完整过程。

爱分析:在大数据技术之前,有SCADA系统也可以做远程监控,接入云之后的远程监控与它有怎样的区别?

时培昕:本质区别是在于目标的不同。原来SCADA以控制为目的,基于短期数据可以实现简单的、少维度的、静态的告警。

但我们做的远程监控不只要看实时的数据,还要基于历史数据做评估和预测,比SCADA内容更丰富,数据量、数据维度、实时性都更多。包括故障诊断、性能评估和故障预测在内,都是新引入的功能。

爱分析:网关数采层面有哪些主要关键点?对于不开放的数据如何处理?

时培昕:工业网关的要涵盖各种协议,包括通用的Modbus、Profibus等,以及一些特定场合下需要使用的,像安川的伺服、爱德华的真空泵等。有时候还需要抓包分析,需要从HMI里面读相应的点表。

爱分析:工业应用中,边缘计算用在哪些地方?

时培昕:边缘计算在网关层面,做执行,在无法把网关数据传上云时,如果想提前实现一些本地基础算法,如异常检测等,就可以基于网关里存的数据,分析历史分布和趋势,评估当前状态,所以要在本地做一些算法的能力。

目前还没有标准的边缘计算规范,我们是在网关层面提供执行开放程序和数据分析的框架能力。我们是一个开放系统,系统里的算法和模型都可以根据云端的能力推到网关上执行。

爱分析:工业的制造和运维两个需求点有哪些特点?实施中存在哪些挑战?

时培昕:生产制造过程我们采集不同的人、机、料、法、环的数据,采完之后分析的主题有质量、效率和调度。对于运维而言,原来是做巡检、更换,成本高,一些关键的故障也难以避免。我们基于状态、传感器变量去建模型分析,实现对设备生命周期的预测和管理。

工业数采协议多、数据量大、封闭情况非常多。此外,原有控制系统以控制为目标,没有长期存储的能力。控制信息只需存若干个月,分析要看若干年。分析出发的数采更看重多维存储,这与控制不一样。

爱分析:从数据分析出发的存储要注意哪些点?

时培昕:一个是实时性,对工业数据的处理方式,时序数据是主要的,差异化存储、压缩方式都要关注。另一个是灵活性,在不同阶段要存不同的数据,边缘计算有过滤能力,决定要采什么样的数据。要做的足够灵活,才能支持在云上的最优存储。

爱分析:实时数据库除了在现有基础上增加了时间维度以外,主要难点在哪些地方?

时培昕:有时间标签处理起来就不一样,采样频率可能是1kHz,存的点可能是一个时间标签后面有几十个不同维度,在处理的引擎机制上与传统数据库不太一样。我们首先要批量、实时的存储;其次是构建分析,针对实际数据的高性能BI,可以秒级查询;最后是展示构建分析报表、故障分析热点图等。

基础的统计分析不需要构建模型就可以实现,我们在此之上有大数据分析,需要写算法和模型。我们做了两块,一个是算法包,一个是特定场景下的模型。工业的算法很多,需要做基于时间的预处理,差值、抽样填充、时频变换、清洗、时序变换、平滑处理、对齐,滤波等。传统的数据分析就是关联、分类、回归等。

爱分析:构建的模型有哪些种类?

时培昕:我们提供通用和专业模型,第一类是历史数据的模型,包括伴随概率的关联分析和故障路径分析。第二类是当前的性能评估模型,基于历史数据来训练模型,用当前数据验证是否偏离模型的输出。第三类是未来预测,基于变量的历史数据实现对未来趋势的预测。

我们做模型训练的时候,会要求根据建模的目的来针对性选择很多设备的变量,如果很清楚地知道哪一个变量是对模型输出是有贡献,就把它加进来,如果加入没有贡献的数据会影响模型的精确度。

爱分析:这块主要是凭借行业专家完成?

时培昕:对,行业专家。

爱分析:开发一个可以使用的模型,大概需要多少样本量?

时培昕:如果只需要做一个基于历史数据的异常检测和预测,直接调用平台现有的模型框架就可以,非常快。如果要做一个非常精准的模型,必须弄清楚设备的工作原理,有时候可能需要拿到很多现场实测数据后才能完成模型。

爱分析:底下的模型开发和训练都是寄云在做?

时培昕:我们提供模型的开发框架,而合作伙伴可以基于这些框架,通过实例化实现特定场景下的模型开发。

爱分析:通常情况下,以怎样的方式交付客户?

时培昕:客户分两种,第一,对于中小型的工业客户,我们会跟之签基于平台的云服务托管合同,客户把数据放到我的平台上实现存储和分析。第二,对于大型的客户,基本上是要求私有化部署,现场定制化交付,我们会以项目方式进入,提供产品加服务。

爱分析:寄云科技的平台采用开放的方式,具备哪些特点?

时培昕:寄云NeuSeer平台是一个开放的平台,用户可以通过各种开放的接口,以订阅的方式使用我们平台上的货架类服务,包括MQTT、Kafka、时序数据库以及大数据分析等,根本不用关心服务怎么部署、扩展和运维,而只需要订阅,这是我们平台服务的优势。

同时,大量的算法都提供了开源的示例代码,多种工业模型都可以直接通过API实现测试和应用。而且,我们会建议客户开发应用采用微服务架构,把每个服务开发成模块,用API Gateway实现集成,以实现更大程度的扩展性和可靠性。

我们平台的服务接口也会集成一些第三方的能力,像工业3D模型、对象存储等,第三方服务提供商只需要按照寄云NeuSeer平台相应接口进行少量的开发,就可以跟NeuSeer平台实现结合。

爱分析:微服务的理念对于客户的渗透率如何?

时培昕:在互联网领域比较常见,在工业领域还需要时间渗透,但我们给客户交付的工业应用多数都已经是微服务的架构。

爱分析:处于怎样的考虑把平台要做成生态的模式?

时培昕:我们虽然提供了一个很强的平台,但是由于工业实在太分散,如何在具体场景下利用各种工具达到分析目标和构建应用,不是寄云一家能够完成的,所以我们也非常希望构建这样的生态,有更多的开发者和分析人员参与进来,共同使用和贡献,通过这种社区的写作,解决很多原本他们无法单独解决的问题。现在有很多合作伙伴、科研机构都已经在平台上面做应用开发和数据分析。

工业互联网领域,寄云科技选择了数据这块最硬的骨头

以数据为主线,构建开放的平台生态

爱分析:对合作伙伴的开发服务是否需要收取一定费用?

时培昕:现在是免费,到年底会按实际的资源使用量收取费用。现有平台上的客户有集成商、有工业设备的原厂商和服务商,也有做工控系统和工业网关的厂商。我们希望为他们提供一个开放的平台,只要跟我们平台实现连接,把数据传上来,就可以快速利用我们平台的各种存储、分析、模型和应用开发能力,实现对工业设备数据的实时监控、数据分析、故障诊断和性能预测。而这些能力,原来是需要非常高的门槛和代价才能实现的,我们的目标就是需要把这些门槛和代价尽量降低。

爱分析:数据来源有哪些?是否接入第三方数据?

时培昕:主要是客户的设备数据和业务系统数据。暂时还没有考虑第三方数据的接入,未来会引入一些开放的第三方数据源。

爱分析:目前切了哪些行业?

时培昕:主要行业包括轨道交通、电力能源和智能制造。轨道交通客群包括造车、建设、运营三类,合作的有唐车和四方等。电力能源行业我们服务像大唐、中电投和国家电网等发电企业,搭建开放式平台实现设备健康管理、健康监测,和合作伙伴共同开发众多全新的工业应用。制造领域有京东方、彩虹集团、陕鼓等,从产线数据采集、生产经营分析、质量追踪,一直到设备的远程运维等。

爱分析:服务大型企业时,是以怎样的方式进入?

时培昕:从单一需求切入,逐步做大。数据成熟的企业,可能先从分析和应用开发切入,但有时候不得不从数据采集和存储切入。不断解决客户现有需求,并且帮助客户规划新的建设需求。。

爱分析:前期理解业务需要多久?定制化部分有哪些要点?

时培昕:根据客户不同,有几天的,也有可能需要几个星期,都会有调研。很多定制化是对具体场景下特定主题或者应用的分析和开发,由于我们提供了比较多的微应用,我们可以通过模块化的方式实现快速组合,实现快速集成。

爱分析:通常情况下,项目周期需要多久?

时培昕:大项目的交付往往需要几个月或半年以上,POC时间很短。

爱分析:采用怎样的定价方式?客户的续单能力如何?

时培昕:对于中小客户,采用云的方式提供服务,按年收费;对于大客户,我们提供产品+定制化服务。项目一般是持续性的,每年有不同的建设主题。

爱分析:后续搭配的服务有哪些?

时培昕:偏分析的服务会一直持续,安装部署是一次性的,还包括产品的运维服务。

爱分析:项目通常在什么量级?

时培昕:从几十万开始,到上千万不等。

爱分析:种子或标杆客户有哪些?

时培昕:平台推出的时间不长,所以基于我们平台开发的客户还不太多,但是已经有一部分在线的设备厂商在使用。但平台是多个独立产品的整合,这些独立产品,包括时序数据库、大数据分析平台、数仓和数据分析以及PaaS平台,包括上海城建、大唐、国网、中车这些客户都已完成部署。

爱分析:大客户如何定义?

时培昕:大客户的收入规模百亿级以上。几亿到几十亿是中小型客户。

爱分析:原来通用型平台现在还在推吗?这部分业务未来如何考虑?

时培昕:目前我们首先会集中在电力能源、轨道交通这些重点行业,而在其他行业,我们会把通用平台的能力开放出来,与合作伙伴一起共同构建行业云平台。

爱分析:工业领域,产品的可复制性较低,这个如何考虑?

时培昕:需要更多的合作伙伴。我们能做的是关注的几大行业,尽量把接口和能力开放出来,合作伙伴解决不了这些问题的时候,可以用我们平台实现一个相对完整的解决方案。我们相信很多行业里,合作伙伴比我们更专业。

爱分析:目前切的三个行业考虑继续做深?

时培昕:是的,继续做深。其他行业归在智能制造里,我们会给一些基础能力,像通用的故障诊断、通用的质量分析,寻找合作伙伴。工业太散了,每一个客户需求都不一样。

爱分析:整体团队结构如何?

时培昕:一共80多人,技术占了七成。

爱分析:采用怎样的销售方式?

时培昕:直销为主,做大客户。中国的商业环境是只有技术肯定不行,必须有自己的大客户能力,我们的销售团队都是非常资深的行业销售,有非常丰富的行业经历。

爱分析:核心团队背景。

时培昕:主要来自Teradata、IBM、HP、Oracle、GE和PTC等各大外企的管理层,有丰富的企业市场经验。

爱分析:团队扩张与营收是否正相关?

时培昕:不是,我们已经过了技术储备的最大扩张阶段,接下来扩充在业务和行业专家。因此业务的增长可能有一个滞后阶段。

工业互联网领域,寄云科技选择了数据这块最硬的骨头

IT能力结合场景理解,将是最深的壁垒

爱分析:与入场的各类玩家相比,寄云的优势有哪些?

时培昕:如果跟国外巨头比较,我们优势在本地理解和支持能力。国内市场中,很多厂商是以连接为主线,我们最强的地方是以数据为主线。我们希望国内企业更多的是合作,包括一些做专门数据分析的厂商,我们也希望可以合作。

爱分析:国内厂家跑出的不多,这是出于什么原因?

时培昕:几十年以来,中国95%的工业软件系统都掌握在国外工业厂商手里。一方面这是巨大的国家安全隐患,一方面压制了大量工业软件人才的培养,所以一直以来都没有很好的国内工业软件厂商。国家政策就是要我们把这些工业软件、工控系统控制在自己的手里,自主可控,这就是国内软件企业的机会点。

爱分析:目前看来,大数据公司很难真正明白工业的业务场景

时培昕:这个得学,我们不认为一个做消费类大数据公司能够进入工业,最大问题就是不理解工业。我们也不认为一个工业企业能够独立把这个事情做好,因为他没有很好的工具、分析能力和开发能力。我们是正好有这方面能力,但是现在我们还不足以覆盖到每个方面。

爱分析:实际对接的客户部门是业务部门?

时培昕:业务部门为主。

爱分析:市场空间您如何判断?

时培昕:GE Digital一年的revenue是60亿美金,2020年要达到150亿美金。我认为中国市场中,工业占GDP的35%以上,所以这才是中国最大的软件市场。

爱分析:下一步整体公司的战略是什么?

时培昕:第一,我们已经有不错的平台,基于我们平台把行业做深,更多面向垂直行业的具体应用,把行业能力和平台能力结合。

第二,与更多的合作伙伴共同搭建平台生态。让更多做控制系统、应用开发的企业,可以在平台上解决自己原来没有办法解决的问题。

未来我们可能会参与到几个行业级别的工业互联网平台的建设中,和合作伙伴共同打造细分行业的工业互联网平台。