数据智能

专注国有数据,数据宝为客户提供数据增值服务

《网络安全法》让数据宝等数据交易商迎来发展的春天

2018年05月16日
调研 | 李喆 倪贤豪 撰写 | 倪贤豪
  • 数据智能
  • 数据服务
  • 数据API接口

2017年6月1日开始实施的《网络安全法》对于数据宝来说可谓发展的转折点。在此之前,数据宝步履维艰,甚至已开始做与数据服务不甚相关的业务以维持企业运转。而在《网络安全法》实施后,原来在市面上一度猖獗的拖库、洗库、撞库的现象销声匿迹,坚持数据合法合规原则的数据宝迎来了发展的春天。

创建于2016年4月的数据宝是一家国有数据资产运营商。创始人汤寒林认为,企业涉足国有数据,只有明确自身定位方能获得更好的发展。为此,数据宝主张不拥有数据,专注于为数据资源方和需求方提供更好的增值服务,并确保数据在双方之间的数据价值流通合法合规。

发展至今,数据宝已与20多个部委、地方政府、国有企业建立了数据合作。基于此,数据宝以提供API接口的方式为消费金融、银行、共享经济、物流等行业的客户进行数据服务。

接入国有数据,为行业客户提供数据解决方案

为确保数据的合法合规,数据宝会协助数据资源方做好数据清洗和数据脱敏等工作。尤其是数据脱敏方面,因为涉及到用户数据隐私等问题,数据宝通过在数据资源方的机房周边设置堡垒机的形式来规避信息泄露等风险。原始数据可推到堡垒机,而堡垒机无权访问原始系统,如此则确保了数据的脱敏。

从业务模式来看,数据宝为客户提供的解决方案可分为基础服务和增值服务两类。

基础服务,主要指数据从数据资源方到需求方,并不需要数据宝提供增值服务,而只需将其封装后以API接口的形式提供即可。

相应地,增值服务则是指数据宝基于客户的需求为其提供一系列增值服务。比如,共享经济客户所需的人脸识别功能,其中包括人像识别比对、身份验证、驾驶证验证、犯罪前科验证等。数据宝不仅会提供相关验证所需的数据API接口,还会将所涉及的相关功能以部分外包、部分自己研发的形式予以满足。

目前,数据宝为各行业客户提供的数据支持主要体现为验证和评分两大类。验证的呈现形式为对客户每一次查询反馈诸如“是”或“否”等结果,而评分,则是对所查询对象的行为按频次等维度划分为不同档位,以所处档位予以反馈。

比如,将乘客一年内乘坐高铁次数划分为A、B、C、D、E五档,如所查询对象乘坐高铁次数在A档,则以“A档”为查询结果反馈给客户。具体到各行业的落地场景,前者有自然人身份验证、违法行为验证等,后者则包括消费能力评级、差旅周期评级等。

以整合外部技术满足众多行业的需求,以投资并购打造生态链

从目前而论,数据宝所服务的各行业的定制化需求,其技术团队靠自身实力难以做到尽数满足。这部分是由于团队整体偏重营销属性,部分也是由于针对各垂直行业的技术人员配备较少的缘故。

对此,数据宝的解决之道是从当下和远期两个角度出发。

对于当前的业务发展,数据宝的做法是选择将增值服务中的行业属性部分交由外部技术团队共同完成。

至于远期的规划,数据宝的选择则是是加大对垂直行业的技术公司的投资并购力度,借此打造上下游生态链,成为真正的生态型平台。

近期,爱分析专访了数据宝创始人兼CEO汤寒林,以下为部分内容分享。

接入国有数据,致力于成为国有数据资产运营商

爱分析:您之前创业经历颇为丰富,这对创建数据宝有何助益?

汤寒林:数据宝的成立是我们过往十五年从业的积淀。从03年筹划创建拓鹏,到后来的云信留客等,我们的创业与数据息息相关。拓鹏起初做搜索引擎,然后转向数据库营销。云信留客则是帮助客户做会员数据管理。这些经历使我们对数据本身、数据行业的发展有了更深刻的认识,也为我们带来技术、客源等方面的积累。

爱分析:数据宝的定位是什么?

汤寒林:我们的定位是国有数据资产运营增值服务商,致力于做数据资产的增值服务。

起初的定位是数据交易。但后来我们认为并不是很准确。因为数据交易容易被理解为数据买卖。事实上数据宝并没有一条自有数据。我们要求数据资源方不可以将数据出库。既然数据不出库,也就不存在数据买卖。

爱分析:目前对接的数据有哪些?和多少单位有数据合作?

汤寒林:主要对接的就是以部委、地方政府及国有企业为代表的国有数据。已经和20多个部委、地方政府、国有企业等有合作。

爱分析:对于数据脱敏,数据宝是怎么做的?

汤寒林:我们会在数据资源方的机房周边做一个堡垒机。原始数据可以推到堡垒机,但堡垒机并不能访问原始数据。对数据加工建模则在堡垒机中完成,从堡垒机中输出的结果也是脱敏脱密之后的价值,通常是评分和报告。

而在对客户的反馈上,主要以验证和评分两种形式反馈。验证包括自然人身份验证等。评分则是以所查询对象所处档位作为反馈结果。比如将一年内乘坐高铁次数分为A、B、C、D、E五档,如所查询对象在A档,则将A档作为结果予以反馈。

爱分析:数据宝能给客户提供哪些产品或服务?

汤寒林:客户提出需求后,我们会以API接口的形式为其提供对应的数据。如客户需要,我们也会负责为其提供整体解决方案。比如为共享经济厂商提供整套的刷脸识别解锁方案。这属于增值服务范畴。

爱分析:不同客户的需求也是多样的,如何解决其中的定制化内容?

汤寒林:我们很难做到对各垂直行业都有经验积累。因此,对于部分定制化需求,我们会找在该行业内有多年从业经验的技术团队一起来做。后续我们也会选择投资一些垂直领域的有行业经验的技术公司来打造生态链。

爱分析:怎么处理同一部委或公司的下辖单位间数据未打通带来的数据服务难题?

汤寒林:我们提供了“一对多”的接口。比如,不同运营商的数据存储方式也是不同的。联通和电信采取集成制的方式,而移动则是分不同省市分别存储。这就给企业带来了不便。作为一家有手机三要素验证需求的企业,为使验证结果更为准确而同时与几大运营商或其各省市分公司开展数据合作并不现实。这会带来巨大的资源消耗。

数据宝核心价值便体现在此。我们可以与几大运营商和其下辖分公司做数据合作。企业通过数据宝“一对多”的数据接口即可满足手机三要素的验证需求。

爱分析:关于验证这一场景,可细分为哪几类?具体包括哪些字段?

汤寒林:主要是身份和诚信验证。比如手机三要素验证、共享汽车验证等。前者包括身份证号、姓名、手机号验证。后者则包括人像识别、驾驶证验证、犯罪前科验证等。这些验证,都需要得到消费者的合法授权。

爱分析:战略层面,数据宝曾有意B2B模式,打造“数据淘宝”,后这一战略遭遇挫折,具体原因是什么?

汤寒林:我们在对B2B模式加以探索后,发现其实走下去很艰难,或者说需要巨量资金投入才能走出来。因为一旦企业通过数据宝的平台接触后,就会有飞单的问题。比如两家AR/VR企业,有模型交易的需求,但一旦彼此认识后,就会为了省钱而私下交易,而不是通过平台付款交易。B2B模式的交易,除非是像淘宝一样免费使用,不然都会有用户绕过平台私下交易的风险。

团队偏重营销配置,更多客户来自消费金融行业

爱分析:目前客户多来自哪些行业?

汤寒林:消费金融类客户居多。此外还有诸如银行、证券、保险、共享经济、物流等行业的客户。现在已经拿下了海尔、上海大众、奇瑞汽车等标杆客户。

爱分析:收费模式是怎样的?

汤寒林:常见的收费模式有根据使用数据的次数或数据量、包年收费等。比如每完成一次验证即行收费。但在具体定价上,由于有的数据并没有明确的量化计费标准,我们便根据市面上达到同样效果的替代服务的收费情况报价。

爱分析:单从收费上看,哪类数据收费较高?

汤寒林:市面上没有大量需求的数据收费比较高。可能有需求的客户就几家,我们要为其提供服务就要专门建模、封装,这会导致单次服务成本很高,价格也就高了。

爱分析:目前团队规模有多大?分别都是怎么组成的?

汤寒林:实际的在职员工人数在160人左右,还有300多人的实习生。我们和贵州轻工学院、贵州师范大学等达成了校企合作,帮助培训大数据人才。具体操作上,我们会安排部门经理在一个月的培训期里,为学生们做课程培训。当然我们也通过这种形式去挖掘优秀的人才。

爱分析:团队结构如何?

汤寒林:产品研发人员在40多人,负责对接部委的渠道人员40人,销售40人,后勤管理及客户服务人员40人。

拒绝外资,注重数据安全,是进入国有数据领域的敲门砖

爱分析:您如何看待《网络安全法》等法规的出台对行业的影响?

汤寒林:这是一个很大的利好。在《网络安全法》出台前,数据黑产的公司不少,这导致从正规渠道做数据合作的厂商竞争力明显不如前者。数据宝在《网络安全法》出台前也是步履维艰。可以说,《网络安全法》的颁布是很多正规厂商业务发展的春天,是整个行业发展的转折点。

爱分析:除了国有数据,基于其他几类数据提供服务的厂商也有不少,您认为前景如何?

汤寒林:我将市场上的数据分为三类:

第一,公开数据。这方面更多的是以网络爬虫的方式将数据爬取下来。但我们在过往的创业经历中,发现这类数据有明显的天花板,比如数据的合法合规问题、隐私保护问题等。而且,我们认为网络爬虫并不具备很高的门槛。

第二,企业内部数据。拥有这部分数据的企业并不会将其共享给专门做数据服务的企业。这也是很大的限制。

第三,国有数据。80%的数据都在政府手中,并且国有数据的获取有一定的门槛,比如对外资的限制等。

综上来看,我们认为作为创业公司而言,国有数据的天花板限制最少,其他两类数据对后续业务的限制较多。

爱分析:作为一个国有数据运营商,您认为需具备哪些必要条件?

汤寒林:首先不能是外资背景。数据涉及国家安全,外资的进入是很敏感的。其次是要有国资背景,这样在获取数据源等方面更有优势。最后,数据一定要保证合法合规性。

爱分析:部委等政府单位向企业开放数据合作,有哪些痛点需要企业优先考虑?

汤寒林:一个是数据安全性的问题。从技术安全到商业逻辑的安全如何解决,需要企业有明确的思路和方案。再一个是要有针对各类应用场景的解决方案。部委们开放数据的原因是什么?我认为在于提升社会治理能力、推进产业升级和确保国有资产增值的考虑。这就要求企业需有针对各类应用场景的切实可行的方案。

爱分析:公司目前是否有新的融资计划?对融资有什么要求?

汤寒林:我们目前正在做新一轮融资。数据宝的定位是国有大数据资产运营增值服务商,大数据是涉及国家安全的战略性资产,我们对投资方的要求是必须是国有背景的投资者。