数据智能

DataHunter创始人程凯征:数据可视化,打通产业链最后一公里

数据可视化分析与展现,孰轻孰重?

2017年05月23日
调研 | 李喆 关蕾 撰写 | 关蕾
  • 数据智能
  • 大数据
  • 数据可视化
  • 敏捷型BI
  • 可视化分析与展现
  • DataHunter

在大数据产业链上,数据可视化是最直观的部分,也是产业链最终环节。与国外环境稍显不同的是,国内企业数据可视化展示需求更加强烈,市场规模增长迅速。

数据可视化分析作为数据可视化的一部分,也在快速增长,同时面对诸多挑战。一方面国内数据分析人员整体稀缺,一方面企业对数据分析理解尚浅。但长期看,数据可视化分析展示需求市场空间巨大,商业价值较高。

DataHunter(北京数猎天下科技有限公司,以下称为DataHunter)从数据可视化切入,致力于开发自主的数据可视化分析展示工具。

2016年,DataHunter成立后,以媒体行业为突破口,为多个省级媒体提供“中央厨房”业务数据可视化大屏解决方案,引入舆情反馈等数据指标为内容生产进行指导,在媒体融合应用层面技术优势明显。

其创始人程凯征认为,以探索式分析理念,结合AI技术,数据可视化分析工具最大价值将以商业数据分析展示的方式呈现。

DataHunter是程凯征连续创业的第三家公司。他凭借在企业级服务领域多年积累,继续选择2B市场,专注数据产业链最后一公里。程凯征认为,数据可视化分析与展现紧密结合,提供成熟行业模板分析工具和可视化大屏方案是相辅相成的。

近日,爱分析对DataHunter创始人程凯征进行访谈,他阐释了DataHunter的业务模式、未来战略,并分享了自己对数据可视化领域的发展格局与趋势的看法。

两个产品一个服务,专注数据层面应用

爱分析:DataHunter为什么选择做数据可视化?

程凯征:DataHunter是2016年成立的,专注数据可视化分析和展现方向。我们团队之前做企业移动互联网,业务整体打包卖掉之后,我们开始探索新方向,包括AR、VR、AI、大数据。我们判断,大数据和AI更易落地,AI会再慢一拍。结合自身能力和未来市场趋势,我们选择留在企业级服务领域,定位大数据领域。

我们认为,随着行业成长企业市场会更细分。结合大数据产业链,每个环节都会出现非常专业的公司。在数据采集、清洗、整理和存储领域,已经出现一些好公司。在数据可视化分析和展示领域,现在公司不多,但业务规模较大,是相对更好的市场。

因此,我们把DataHunter定位在数据可视化分析和展示。在实际业务上分为数据可视化分析、数据可视化展现两部分。展现业务与中国特点紧密结合。我们帮助数据与人交互,是整个数据产业链的最后一公里。

爱分析:目前DataHunter为用户提供哪些产品和服务?

程凯征:我们核心业务是两个产品线和一个服务。第一条产品线是数据大屏,服务展示性需求用户。数据大屏更偏视觉效果,更符合中国国情,政府、公安、交通、大型企业等的展示性需求非常强烈。

第二条是可视化分析的产品线,贴近企业BI和探索式分析,类似Tableau、PowerBI,对标国外DOMO,LOOKER,属于商业分析领域。国内用户的数据理解和数据分析使用能力相对较弱,给其提供成熟模板和分析方式比较可行。在此基础上,我们会加上自己knowhow做开发,如任意维度数据钻取、数据交互、数据分析引擎等。

第三块是服务,支撑两个前端业务。目前国内用户并没有成熟到把产品做简单部署就可以用起来,还需要大量用户实施、数据对接工作。驻场工程师提供数据清洗,第三方数据系统对接服务,帮用户接入互联网数据。

爱分析:现在两个产品主要切的是哪些行业呢?

程凯征:目前主要是媒体行业,有标杆用户,省级客户居多。已落地的成功案例包括人民日报“中央厨房”、某直辖市市委宣传部、河南省报业集团等。其次是制造业,与设备商合作,提供整套数字可视化影像平台。帮助设备商提供数字影像的云端服务,可查看设备运转状态。

爱分析:媒体行业项目如何执行实施?

程凯征:我们给媒体提供整体解决方案,称为中央厨房。把所有业务系统整合打通,用舆情指导内容生产和传播。中央厨房分为几个步骤,首先整合媒体业务系统数据,建立融合平台。接着数据清洗、整合,对展示数据进行交叉处理和计算,满足动态数据的实时展示需求。最后是前端展示,包括软件层并行渲染的展示系统。我们做数据整合、处理、前端展示。

爱分析:制造领域也是以整体解决方案输出?实施流程一样吗?

程凯征:制造业展示性需求更侧重如何通过3D方式还原设备运行状态,随时查看部件运行状态,和媒体在内容展示上有差异。

实施流程一样。媒体从各业务系统数据开始,工业也是。包括传感器数据、产品数据、甚至气象数据。前端再根据行业特点做定制输出。

爱分析:工业领域具体切的是哪些行业?设计故障分析和故障预测吗?

程凯征:目前切的是电力、特种设备行业。和电力设备公司合作多一些。目前不涉及故障预测算法,通过合作伙伴来完成。我们帮用户把全部数据做整合,建平台,完成可视化,再把算法加叠进去,提供对应服务。

爱分析:分析产品会以卖license方式给用户输出吗?

程凯征:现在分析系统上市版本,有两套方案供用户选择。一个是license方式,一个是企业独立部署版本,按照系统建设方式收费。看用户接受度,以用户为导向。

爱分析:会往下延到数仓或者数据库,做MPP这一层吗?

程凯征:不会去建数仓、做MPP。我们专注数据层面,包括数据整合、数据对接、数据分析等方面。

爱分析:分析层发展如何?

程凯征:分析层比展示层发展的要慢一些。分析要更复杂,涉及到业务、展示模板。我们正在探索几个行业。

第三方数据价值在增长,AI商业化路更长

爱分析:数据源是怎样处理?外部数据对可视化分析和展现的价值大吗?

程凯征:数据源是合作为主。我认为价值在逐步增长。像媒体行业,如果把舆情的第三方数据剥掉,发现它本身就是一个业务系统的整合,谈不上媒体融合。从内容生产到分发传播,并没有结果反馈,无法形成闭环。现在是通过第三方数据做了闭环,未来在企业的商业分析里面,一定也是这样的情况。第三方数据会变得越来越有价值,对商务决策产生积极作用。

爱分析:数据分析和展示用到哪些AI技术?是自己在研发吗?

程凯征:我们看到,数据产业链后端业务会与AI自然而然的结合。从使用场景讲,主要涉及非结构化数据分析、语义分析、data insight数据洞察之类的AI技术。我们自己在做,也找合作伙伴的算法相互验证。效果上差别不大,都还达不到质的变化,AI商业化还有很长的路要走。

爱分析:DataHunter自己定位是BI公司还是数据可视化公司?

程凯征:这个很难讲,我们做数据可视化分析和展示。数据可视化分析是商业分析的延展,大家对BI理解大多是传统IT主导报表模式。我们提供新式的敏捷型BI,所以做了描述性调整。这是一个适合业务人员使用的可视化分析工具,不是传统BI工具。但从大范畴看,还属于商业分析BI。

爱分析:下一步打算去切哪些行业?

程凯征:分析系统会推进零售、医药、物流。在这些行业里,销售、产品业务数据在前端,公司IT部门无法支撑所有业务性数据的分析需求。传统BI是前端提了数据需求,再做数据整理和建模,过若干个月,才能产生报表。

甚至有些互联网公司,有很多业务部门,每个业务部门负责的产品线也不尽相同。而且营销策略更新很快,后端IT部门满足不了如此繁杂多变的分析需求。

这类公司前端业务部门目前正在使用原始的SQL + Excel的方式处理数据,这些正是我们希望帮助用户解决的数据分析问题。

爱分析:在其他行业有用户案例吗?

程凯征:还没有对外,目前是pilot用户。我们有一个核心产品,正在做行业化,根据用户需求做调整,这个过程要比数据大屏的展示性业务复杂很多。

爱分析:下一步的公司战略是什么?

程凯征:以分析为核心,以展示为辅助,共同发展。

展示性需求快速增长,分析性需求尚处萌芽

爱分析:现在国内做可视化展现和分析公司有哪些?

程凯征:数据可视化领域公司有数字冰雹、海云数据、阿里云DataV等。产品跟行业和业务相关,没有好坏之分,只有看谁做快,行业做的深。

数据分析公司有国云数据、BDP、永洪、帆软。BDP以SaaS形态提供数据分析服务。永洪和帆软做的时间久一些。这些都是行业的先行者,我们把他们看作自己的友商。

爱分析:数据可视化分析和展现的市场容量有多大?

程凯征:在整个数据可视化里面,国外展示性需求相对少一些,但很多做KPI看板的公司也都拿到融资,只是还没跑出有名的上市企业。分析市场更大,它与BI概念天然结合,但其工具便捷性、友好性要远大于原来的BI。在Gartner报告里,数据可视化分析属于BI分析。分析的市场规模可以与BI重叠,大概有五六百亿规模。

爱分析:国内媒体行业具体哪些领域有展示性需求?与哪类媒体合作多一些?展示性需求比较大的是哪些媒体?

程凯征:媒体行业分为纸媒、广电、网络新媒体。每个省特点不同,地域媒体力量不均衡,但都有展示性需求。传统媒体都向媒体融合发展。新媒体诞生之后,舆情的价值得以体现。媒体融合是把内容生产、分发、传播,包括所有渠道,舆情,做打通,形成从内容生产到舆情反馈的闭环。靠数据去把所有业务打通,串起来。

爱分析:媒体行业数据融合规模有多大?IT投入有多少?

程凯征:我们自己测算过,每年至少有十亿规模。IT投入持续在增长,传统媒体运作模式在变化,报纸杂志等纸媒时代过去了,新媒体蓬勃发展,所有的媒体都在朝媒体融合大趋势发展。

爱分析:您认为,目前我国在可视化分析与展示领域还存在哪些需要解决的问题?

程凯征:可视化数据大屏在国内增长趋势快,接受程度高。数据可视化分析领域会有一些瓶颈,原因在于国内数据分析人员偏少、能力偏弱。虽然企业意识到业务数据和运营数据是价值资产,也在做数据采集和存储。但如何去分析利用,还都不清晰。数据质量也需要再改善。所以我们在数据可视化分析领域正在逐步积累,未来3-5年看,数据可视化分析一定是重点。