数据智能

智擎信息CEO王曦:工业大数据预测性运维,业务场景是关键

工业大数据应用之预测性运维

2017年08月28日
调研 | 李喆 关蕾 撰写 | 庆贺
  • 数据智能
  • 预测性运维
  • 工业大数据

工业领域大数据应用是传统制造业转型升级的重要手段之一,数据分析需求日趋强烈。

从数据源来看,工业大数据主要分为机器数据、外部第三方数据和企业经营相关业务数据。基于工业行业特性,工业大数据早期显现出规模大、类型杂、质量低的三大难点。

在工业应用场景中,对业务的理解具有较高的入场门槛,客户需求也相对繁杂,定制化率较高是明显特点;而对于预测性运维,同类别工业设备可复制性较强,设备数量多,不少厂商以此切入工业大数据。

传统制造业巨头如GE、SIEMENS凭借对工业领域的深厚积累,在资源、技术、人才等层面优势明显,相比之下,凭借先进技术实力入场的创新公司不多,聚焦在较为标准化的故障预测与健康管理(PHM)的应用方向。

美国创业公司Uptake凭借大数据、AI等技术提供端到端服务,以工业设备故障预测分析、性能优化为主营业务,拥有机械大亨Caterpillar级别的种子客户,现已扩展到农业、航空、风电、零售、医疗等行业。

国内市场中,对标Uptake的智擎信息成立于2014年,利用大数据、机器学习等技术进行工业设备的故障预测,帮助企业降低运维成本,并优化设备产能。

在大数据应用于工业领域之前,设备故障以及时报警的方式呈现,个别故障预测只能基于专家经验判断,且时效短,价值有限。相比之下,大数据、机器学习等技术使工业设备的故障预测变得更加智能。

智擎信息创始人王曦认为,通过机器学习技术处理设备历史数据和实时运行数据,研发一套故障预警的通用模型,可提前更换即将损坏的部件,避免小故障演变为更严重故障,助力中国工业企业转型升级。

智擎信息以第三方大数据服务商切入风电行业,专注自身在产业链中的位置,不站队,提供端到端服务,逐步在一些细分行业实现产品化,为标杆企业提供工业大数据实时分析、关键部件故障预测等服务。

王曦在访谈中表示,目前智擎的故障预测产品可以提前2~4天预判故障,从而降低运维成本和备品备件库存成本,提升设备可利用率和整体运转性能。

由此分析,在工业大数据赛道,深耕于某个行业,随着数据逐渐丰富,将其底层算法模型标准化、产品行业化,并提供上层定制化应用场景,进而在不同行业间复制的打法,是未来的发展趋势之一。

近期,爱分析专访智擎信息创始人兼CEO王曦,现将部分内容分享如下:

大数据分析平台是核心,故障预测是主要场景

爱分析:大数据底层平台产品通用性较高,主要包括哪些功能?

王曦:数据安全采集、接入和存储,并将其业务化和模式化后进行实时分析。此外,通过机器学习分析和预测算法,提前预测设备及其部件的故障。

在部署方式上,根据客户的不同需求,可以为客户提供私有化部署和公有云两种版本。在2017年之前,客户的基本上都是私有化部署的,从今年开始,公有云版本的客户开始增加。

爱分析:设备故障的预测分析模型用到哪些新兴技术?

王曦:以前称为分布式算法,现在利用大数据、机器学习技术,除了纯粹的机器学习技术以外,还在其框架下使用了动态阈值的方法,在不同工况下都能实现高准确率的预测分析。我们在深度学习上也有投入,通过神经网络进行故障诊断。

不同设备故障预测对数据的依赖程度不同,在数据接入方面,需要获取尽可能丰富的数据,用于模型持续的分析和优化。

数据收集是一个持续长期工作,目前很多数据都未被取尽,多数停留在数秒级、分钟级。随着业务价值的持续显现,更进一步的毫秒级数据也将带来更深层次的价值,未来毫秒级的采集是必然趋势。

爱分析:通常情况下,模型的生命周期有多久?

王曦:具体场景具体分析,原则是长期保证设备低故障和高效运转。预测模型本身通过机器学习持续自动更新,更新周期一般是三个月,以KPI参数及重点监控指标评价新模型是否优于原模型。

爱分析:平均来看,目前故障预测可以做到提前多久?

王曦:电力行业平均提前2~4天。传统方法是基于专家逻辑预判,这更多的是依赖专家的行业经验,只能做到几小时,价值有限。

爱分析:从长远来讲,如何理解智擎信息的战略定位?

王曦:将技术与更多行业的工业设备相结合,帮助更多的工业领域通过故障预测来降低运维成本。

当然,前期做数据完备度高的行业,切入设备体量大、横向复制性强的领域会逐渐扩展,像石油石化等行业,服务于最终用户的设备运行状况,降低设备的停机故障率。其他行业在做初步调研,比如无人值守电信基站,装备制造型企业的生产线等。

整体来看,智擎的打法是在一个行业做深做透,以数据为基础做故障分析预测,行业产品落地,商业化推广,进而行业复制。目标是为最终客户提供价值,客户最看重预测准确率和最终效果。

聚焦风电客群,直销与渠道共同发展

爱分析:合作的客户有哪些?

王曦:首家合作客户是金风科技,风电行业做得比较多,石油石化也有涉及。

爱分析:平均一个客户的落地交付周期有多久?

王曦:基于我们的产品,提供端到端的类SaaS服务,有私有化部署和公有云部署两套版本。落地周期基本是1-2个月。

爱分析:什么时候开始商业化?

王曦:过去一段时间一直在优化产品,逐步向客户提供服务,现在签了三家风电设备制造商,我们的预测分析产品已覆盖多个品牌。今年开始商业化,主要采取直销模式,渠道也在逐步建立。

爱分析:收费模式有哪些?

王曦:现在按照设备数量收取,基础服务即提供平台服务,再往上按需收费。不同版本分为不同的套餐服务,基础套餐内置了部分模型,可以满足客户的基本功能需求,客户可以增购其它服务。

爱分析:服务于设备制造商和运营商有哪些差异?

王曦:设备制造商会刨根问底,关注预测结果和故障预测过程,设备运营商更偏向关注结果。现在两者都有合作,设备制造商更多。

爱分析:制造厂商自己做故障预测的难度有哪些?

王曦:投入产出比不高,如果厂商自己去做,每年需要投入几百万的人力成本,服务客群有限,价值产出较低,所以也不愿意投入,而更关注于设备本身。

第三方公司来做故障预测,服务的行业和企业限制较小,可以扩展到众多客户群体,投入产出比较为可观。

爱分析:现在故障预测处于设备后市场的运维范畴,将来能往后延伸到哪些应用?

王曦:故障预测是降低成本,往后还可以延伸到设备性能优化,分析出影响设备性能和生产收益的亚健康状态,及时提出优化建议,进而可以提升收入。此外还可以延伸到成本最优化模型、运维最优化模型。

数据采集是基础,业务场景是关键

爱分析:在工业大数据领域,中美公司发展和市场有什么差异?

王曦:第一,平台功能和机器学习算法层面比较一致,但美国技术细节、数据质量及完整度领先中国。国内市场,工业传感器部署增多,企业对数据价值的逐渐认同,从去年开始,国内企业在数据层面改进很大。

第二,客户面对数据服务公司的开放程度不一样,国内客户更关注行业背景和经验,很少给一家资历较浅的服务商开放数据窗口,美国相对更开放一些。

第三,国内数据服务公司相对做项目的时间更长,虽然Uptake也是以项目形式切入,但进行可快速的产品化和行业复制。另外,国内客户的需求变更频繁,所以长时间做项目导致公司很容易陷进去。

最后一点,美国的商业环境相对开放,Uptake创业团队的实力强,熟悉创投圈,融资容易。当然美国企业对设备上数据的准备非常成熟,这也是Uptake能快速发展的原因之一。规模发展很快,国内的创业公司发展要慢一些。

爱分析:数据接入的前期准备工作是否由客户来做?

王曦:根据客户成熟度判断,如果客户有现成的数据接口,那么我们开放API直接调用。如果客户没有数据接口或采集能力较弱,那么我们免费给客户装一套数据采集系统。

爱分析:需要采集哪些数据?

王曦:传感器的实时数据、开关量等日志数据,以及BOM、ERP等系统数据。

一类是设备本身的温度、震动、压力等结构数据,通过传感器采集数据,预测设备的亚健康或故障状态,要求定位到具体部件。

另一类是不具备传感器的设备部件,比如石油石化老旧的非控部件,要通过其他设备传感器、历史运行数据和业务数据做算法来预测,或通过临时加设备采集数据。

爱分析:工业大数据市场主要面临哪些挑战?

王曦:国内工业大数据市场在客户认知、数据完备度、数据采集、场景开发等方面都存在一些挑战。

首先,早期客户需求驱动力不足,客户不太明确数据采集之后能分析出哪些价值,对自身业务有什么帮助。

其次,基础设施不够好,比如电厂的网络质量不理想,数据采集量少,这都影响到设备原始数据采集的完整性,进而影响到分析预测。

再次,国内部分中小企业采购了具有私有化协议的设备,设备数据无法高效率解析。我们之前较大的工作量是把很多私有化协议转为国际标准的工业协议,将数据安全采集和存储。

总体来看,国内市场仍处于早期阶段,教育市场需要加强,数据采集是基础,业务场景是关键。