摘要:以通用平台为基础,打造垂直行业大数据产品

解决方案横跨三大行业,数之联的下一站是工业大数据 | 爱分析调研-爱分析

2012年成立的数之联,拥有行业通用BI以及AI平台,并凭借深厚的数据分析能力积累,以行业应用产品切入市场,深耕政府、军工和工业中。定位行业头部企业,客群质量优秀,随着标杆项目的完成,工业会成为后续营收的发力点之一。

指导 | 张扬 黄勇

调研 | 李喆 黄勇 崔可家

撰写 | 崔可家

数之联创始人周涛,27岁时担任电子科技大学教授,在复杂性科学以及大数据挖掘方面有深入研究,并先后投资、创建了数联铭品、国信优易等20余家大数据公司,2012年成立的数之联就是其中之一。

成立之后,数之联推出了两款通用平台产品,并在2015年确定了政府、军工以及工业这三条主要业务发展方向,基于通用平台推出行业定制化产品。

目前,成立6年的数之联,团队人数已经发展到150人左右,其中研发团队占比达到70-80%,具备较强技术能力;并拥有行业定制化产品,积累了标杆客户,未来发展可期。

提供行业解决方案产品,从政府、军工切入市场

解决方案横跨三大行业,数之联的下一站是工业大数据 | 爱分析调研-爱分析

作为一家大数据公司,选择技术落地行业是至关重要的,数之联第一个切入的行业就是政府。这一方面是由于创始人周涛,作为大数据行业的领军人物,可以帮助数之联更加容易进入政府领域,另一方面,政府掌握着大量数据资源,为数之联发挥其数据分析技术提供了基础。

在具体应用中,数之联会根据不同政府职能部门的需求,将业务系统、信用数据以及舆情数据打通。现阶段主要推出了五款面向政府的解决方案,包括遥感大数据、食药安全大数据、政务基础大数据、市场主体风险分级以及法律大数据,以项目制的方式帮助其解决从底层数据融合到上层应用展现的需求。

除此之外,军工也是数之联的一个重点服务行业。其产品主要应用在电磁信号、阵列数据分析,由于涉及到复杂、多维的时序数据,所以对于技术要求较高。同时,军工作为一个更为封闭的行业,对于资质的要求更高,因此进入门槛也相对较高。

在政府、军工领域,一年期项目客单价可达数百万以上,并且政府、军工客户的粘性较高,从客户质量角度来看,这绝对是大数据公司的优质客群,数之联CTO方育柯也表示,在数之联目前的营收中,大部分是来自政府以及军工。

但是,政务大数据领域中玩家众多,想要一家通吃几无可能,同时,客户的高粘性也提高了获取新客户的难度,因此,在面临死守政府领域与开拓新行业两个抉择中,数之联选择了双管齐下,并开始进军工业。

开拓新领域,工业为未来营收发力点

解决方案横跨三大行业,数之联的下一站是工业大数据 | 爱分析调研-爱分析

2015年,数之联开始涉足工业领域,截止目前,已经在工业领域推出四款产品,累积服务40-50家工厂,客户包括富士康、京东方、五粮液等大型制造企业。

工业不同于其他行业,由于细分领域众多,场景差距巨大,很难做出全行业通用产品,因此数之联选择的是通过发现一些特定行业痛点,以解决单点需求的应用产品进入市场的策略。

为解决机械制造领域中CNC刀具磨损状态分析以及断刀预测,数之联推出了智能工控终端系统与智慧刀具管理分析系统,分别用于采集电流数据以及分析刀具状态。良率分析系统会接入生产过程数据,主要用于统计分析生产过程中的不良根因,辅助生产流程优化。缺陷分析系统是通过采集视频数据,利用图像深度学习的方法,在面板、半导体等制造过程中替代人眼检测。

不同于现在火热的工业互联网平台方向,数之联选择了以点切入的方式,让企业看到工业大数据的价值,之后随着其接受程度的逐步升高,可以在企业内部发掘更多高价值应用并逐步帮助企业完成大数据的生态建设,这是数之联在工业领域的打法。

但是这种打法由于可复制性较差,可能会使得数之联深陷众多定制化项目中而不断增加部署开发人员,导致成本激增。这个问题也在数之联选择工业切入点时就被考虑到了,目前,数之联选择的切入产品都是在大规模、大批量生产场景中,这样可以达到较高的综合效益。

相对于政府、军工领域,工业大数据正处于一片蓝海,虽然同样有众多竞争对手,但是由于市场规模巨大、细分行业众多并且处于起步阶段,所以对于任何一家企业来说都有巨大的机会。目前,数之联已经完成产品的开发以及标杆客户的积累,未来在工业领域应该会有较多营收亮点。

底层通用平台做支撑,技术是数之联的核心优势

之所以能快速在三条行业中快速完成定制化产品开发,离不开数之联底层技术的积累。目前,数之联拥有两款通用平台产品,分别是AI平台iCloudMiner和BI平台xDataInsight,行业应用都是以这两款通用产品定制化开发而来,方育柯表示,目前数之联的行业应用产品大约有40%的定制化开发内容,60%则基于这两款产品之上。

AI平台iCloudMiner是将算法模块化,用户可以通过拖拉拽的方式构建应用模型,覆盖了从数据接入、数据预处理、特征工程到模型的训练以及发布整个建模过程,同时,数之联提供算法、应用定制服务。

在AutoML技术方面,iCloudMiner在面对C端用户以公有云服务时,提供自动寻参技术帮助用户完成模型开发。但在面向B端用户时,由于数据质量参差不齐,所以不能实现完全的自动建模,但也会利用一些建模经验以及GridSearch等自动寻参工具包加快建模速度。

为配合iCloudMiner,数之联开发了xDataInsight来完成数据展现,xDataInsight以Hadoop为底层平台搭建,帮助客户完成关联分析、图表构建等BI功能。

技术的积累帮助数之联可以针对具体问题快速完成产品的开发。如今,开源盛行,机器学习、深度学习工具可以轻松获得,但是对于模型调试以及适用场景的深入理解需要长年累月的积累。数之联浓厚的学术背景以及算法开发经验正是他们的优势所在。

学院背景帮助获客,工业客户瞄准头部企业

目前,数之联团队人数为150人左右,其中70-80%为研发人员,同时,数之联创始人周涛,从事大数据挖掘研究多年。除了周涛之外,数之联的其他创始团队成员大都带有浓厚的学院背景,在成立数之联之前,其技术团队多与华为、BAT等厂商合作,进行算法的开发和优化工作。

浓厚的学术背景不仅帮助数之联在技术能力上取得优势;在获客层面,也间接帮助了数之联,其在多个研究院担任专家角色,为政府客户获取提供了有力保障。

目前,在政府中,数之联的主要客户为政府职能部门,如食药监局、法院等,在军工行业中,数之联的客户多为军工研究所,为其提供复杂数据分析能力。

在工业方向上,数之联的客户是以高价值的行业头部企业为主,项目客单价多以百万起,在机械加工、面板制造以及消费品制造行业都已有客户,包括富士康、京东方、五粮液等大型制造企业。

技术、获客能力突出,优质客群推动后续发展

爱分析从技术、产品、客群、获客以及场景理解五个维度对数之联进行评价。

技术:研发团队达到100人,其中创始人周涛为电子科技大学教授,在大数据挖掘上有深入研究,联合创始人团队及高层管理部门均有强力科研背景,团队技术能力强,并且对于算法理解更深入,在解决实际问题建模过程中可以更加快速准确。

产品:拥有两款通用产品iCloudMiner和xDataInsight,为行业应用提供了产品基础;在行业应用中,由于是以单点应用切入,所以有较多的定制化开发内容,但是因为服务的客户多为大规模生产企业,所以单点应用在同类型企业中有较高的可复制性。

客群:政府客群集中在职能部门,军工客群集中在研究所,一年期项目客单价可达数百万以上,并且有较高的进入门槛,为优质客群;工业领域服务于机械加工、面板制造以及消费品制造企业,并定位行业头部企业,项目客单价同样可以达到数百万以上,客群质量较高。

获客:前期主要通过合作伙伴以及标杆项目获客,中后期重点发展直销+渠道市场,从已有客户来看,有较强的获客能力。

场景理解:在政府领域中以综合社会化治理入手,且与多地政府建立合作关系;在军工领域中专攻复杂阵列数据,有较高的技术门槛,并已于研究所合作多年;在工业领域中,以解决单点需求切入,主要集中在产品质量、良率分析,并且在工业中已有近三年行业经验,在客户中完成了标杆项目。

解决方案横跨三大行业,数之联的下一站是工业大数据 | 爱分析调研-爱分析

近期,爱分析对数之联CTO方育柯进行了访谈,就数之联的产品、经营策略,以及对行业的发展趋势做了深入交流,现将部分内容分享。

从算法到平台产品到行业应用,企业需要的是解决问题的能力

爱分析:自成立至今,数之联的发展情况以及业务布局是怎样的?

方育柯:数之联是在2012年创建,创建的大背景是大数据、云计算在全球快速发展。

数之联团队都有一些高校背景,在高校的时候,是跟华为、BAT合作,提供核心算法。

2012年,希望开始对外提供产品以及服务,所以成立了数之联,在这个过程当中,基于一些行业内的技术积累,我们又孵化出了比如金融行业的数联铭品,做医疗的数联易康,做人力资源的数联寻英等合作公司。

2015年,数之联整体的发展方向比较清晰,主要发展政府、军工以及工业领域。政府领域中,主要做社会化治理、智慧化治理业务,比如食药监的抽检、风险管控等;军工领域中,主要做电磁信号阵列数据分析;工业中,主要做工业大数据以及智能制造业务。

在推出三条业务线之前,我们有自己的核心产品,AI平台iCloudMiner和BI平台xDataInsight。

其中,AI平台上的很多算法是之前跟华为合作的时候沉淀下来的,封装成了平台模块。在这个平台上,用户只需要通过拖-拉-拽的方式,就可以完成一个复杂的业务建模。

爱分析:AI平台iCloudMiner是否提供AutoML技术?

方育柯:如果2C提供云端服务,可以用自动建模技术;但是在2B业务中,尤其是工业领域,由于数据、环境非常复杂,目标也并不明确,所以还是需要手动与自动结合的方式去完成业务。当然也会沿用AutoML这种思路,会内嵌一些利用GridSearch的参数自动寻优方法,还会有一些经验规则嵌入,可以做到部分的自动建模。

爱分析:建模过程中,人工部分是由数之联负责还是工厂业务人员负责?

方育柯:一般来说,在做第一个项目的时候,是以数之联为主,工厂方面主要是提供专业知识,通过第一个项目,我们想要对工厂实现赋能,让工厂的业务分析师具备这种能力,简单来说,就是在第一个项目中完成定制化开发,之后业务人员可以根据自身需求完成业务。

爱分析:为什么不向客户直接提供平台类产品?

方育柯:国内市场问题,并且人员操作时较为复杂,所以很难推广平台工具模式。

而且如果只是单纯提供一个工具,虽然对于数之联来说利润率很高,但是在客户那一侧不是特别认可,因为他们的要求有三点:

第一,有平台的能力,并且能解决痛点问题

第二,能够通过项目进行赋能,将项目经验、知识传递下来

第三,能够让他们独立解决一些问题

只提供平台类产品并不能满足这些需求。

爱分析:政府、军工业务是否更偏向于解决BI需求?

方育柯:政府比较偏向BI,业务场景和需求都比较明确;军工还是需要很多分析过程的,BI方面的技术只能覆盖军领域的部分需求,相比政府,军工领域有较高的资质门槛和技术门槛(阵列数据分析)。

工业产品难以全行业通用,应用层需要技术加行业理解

爱分析:在工业产品中,智能工控终端产品是否只能针对刀具产品进行数据采集?

方育柯:不只是针对刀具产品,智能工控终端产品是在做刀具项目的时候延伸出来的,是因为发现市场上数据采集产品达不到我们的需求。除了刀具之外,也可以去采集声、光、电等7大类数据,进一步做到设备的状态监控,PM(预测性维护)等。

爱分析:在工业中,数据采集过程可以分为哪些方式?

方育柯:数据采集场景可以分为两类,一种是侵入式采集,要对设备拆解或者宕机,再把传感器部署到里面去采集;另一种是非侵入性采集,在表面部署传感器,采集振动、电流信号等。

在我们的业务场景中,如果客户有能力提供基础数据支持我们分析,就不需要去采集复杂数据;如果设备的一些协议没有开放,我们更倾向于使用非侵入式的方法采集数据,因为这样不影响设备的稳定性、可靠性。在一些国外引进,较难采集的关键设备上,目前主要采取跟业主方去协商,拿到SDK原厂方授权,从数控系统里面去采集的方式。

爱分析:数之联工业产品的通用性如何,是否能做到向其他行业的快速复制?

方育柯:比较难,数之联现在选择的场景,都是大规模、大批量的生产场景,这样综合效益比较高,但是如果换一些参数,模型表现就会打折扣。

我们的分析方法论是比较成熟稳定的,所在在具体的应用中,大概40%内容需要定制化开发,60%内容是通用产品可以覆盖的。

爱分析:解决方案是否很难产品化?

方育柯:如果做一个比较小的点,在特定的行业里面,是可以的,比如CNC刀具系统,如果想做一个产品,覆盖很多行业,那是几乎不可能的。

爱分析:项目的部署周期是多长时间?

方育柯:数据采集是非常成熟的,基于我们的快速部署能力,一到两个工作日就可以开始数据采集工作,而建模是基于现有产品iCloudMiner平台完成。这里面花费时间比较长的部分是模型训练的过程,从采集数据,到模型稳定,到把模型推到分析平台上,大概需要1个月左右的时间。

爱分析:良率管理产品需要采集哪些数据?

方育柯:采集的数据很多,在不良实时分析系统中,涉及到了产品完整生产过程中的所有信息,包括设备的参数信息表,设备在不同时刻的状态信息,DMS系统,缺陷文件系统,环境参数信息,比如粉尘度等,以及其他系统的数据。

爱分析:分析过程中是否有外部数据引入?

方育柯:根据业务需求决定,良率优化、刀具寿命都不会涉及到外部数据,但是如果做2C消费品生产制造的话,可能会涉及到互联网数据去做分析;供应链优化,也会涉及到外部备货、库存数据等等。

爱分析:FA系统能否替代FA分析师的工作吗?

方育柯:不能,一方面,我们不提倡机器换人,更多的是提升分析效率;另一方面,这个不能做到完全自动化,我们在初步确定指标的时候,需要有FA工程师来确认,并不是完全取代的关系。

爱分析:工业领域中,未来会拓展哪些新产品线?

方育柯:要看后续发展,我们之所以选择现在这几个方向,是因为他们所处行业的问题是比较共性的,并且数据可以采集的比较完备,所以近期应该会持续在这几块做深做强。

爱分析:工业中有哪些场景是比较有发前景的?

方育柯:应用层,第一个,设备预测性维护;第二个,流程制造中,生产流程的优化。

爱分析:部署方式上,数之联产品主要是通过私有云还是公有云的方式?

方育柯:会根据客户需求来进行部署,私有云、公有云我们都可以支持。如果本地要建平台,我们也可以和合作伙伴一起,比如Cloudera、华为等,我们是比较开放的,兼容性比较强。

爱分析:做应用层有哪些难点?

方育柯:第一个,需要行业深耕,把行业相关知识沉淀下来。

第二个,工业问题解决方案的快速构建能力,算法模型虽然是开源的,但是对于模型的理解也很重要(调参、模型适用场景等)。

第三个,有一个好的工具、平台作为支撑,去高效解决问题。

标杆项目获取客户,未来发力点来自工业

爱分析:目前,数之联的主要获客方式是什么?

方育柯:前期主要是通过龙头企业做标杆项目,标杆做出来之后再做宣传,客户也会帮我们做推广,这其实是在行业中积累口碑;目前我们基于这些已被市场验证过的经验,正在大力推行直销与渠道相结合的市场策略。

爱分析:数之联采用的是什么收费模式?

方育柯:项目制的方式,包括产品license费用,建模分析费用以及定制化开发费用。

爱分析:是否考虑过按收益分成的收费模式?

方育柯:我们是希望能这样做,但是在实际中非常难操作。比如,良率是机密数据,一般不对外开放,我们就不能获取这些数据来跟厂商计算分成。

爱分析:如今团队有多少人?

方育柯:150人左右,团队中70-80%是做研发,包括产品、项目,里面工业大概占60-70人;20-30%做后端支撑。年底总人数可能会扩到180人左右。

爱分析:三条业务线中,今后是否会有侧重?

方育柯:三条线目前我们是并行发展的,相对来说,目前政府事业线贡献了较多的现金流量,未来的业务方向主要是在遥感大数据,环保大数据等几个国家重点推进和投入的领域;工业制造业事业线,经过近三年的技术探索,重点技术攻关,我们已经在设备管理,工艺优化,图像检测,缺陷识别等领域积累了一定的技术优势,明年我预测会是一个小的爆发。

长期来看,工业线的前景也是值得期待的。军工领域,由于行业本身的保密性质,我能透露的是,我们目前参与了军内和研究所很多重点课题项目,也做出了重大突破,未来在装备列装,联合科研等领域会有更好的发展。

总体来说,我对数之联目前的技术发展和储备是满意的。当然,面对现在的技术环境,想保持一定的行业领头,国内领先,还需要我和我的技术团队做出更多的努力。