云计算

XSKY胥昕:高度产品化是软件定义存储成功的关键

基于Ceph技术开发企业级存储产品的XSKY,能否在存储市场突围?

2017年09月06日
调研 | 李喆 撰写 | 李喆
  • 云计算
  • Ceph
  • 存储

传统SAN(Storage Area Network)存储市场一直是一个封闭的高技术壁垒市场,因为涉及到用户的数据,所以产品的高性能和高可用性一直是传统存储厂商拿来锁定用户的关键性指标。

随着数据量的大幅增长,企业除了对高性能和高可用性之外,对数据存储的可扩展性提出更高要求。传统SAN存储技术出现了技术短板,无法实现性能和容量同时线性增长,必须依赖高性能硬件,价格昂贵,同时扩展性比较差。

这时出现了以Ceph、Gluster等开源分布式存储技术,底层使用X86等通用硬件,依靠软件将底层硬件资源池化,通过软件提升存储能力,保证稳定性,满足客户对存储的需求,这就是所谓的SDS(软件定义存储)。

XSKY就是这样一家基于Ceph技术开发商业存储产品的公司,其产品将大型互联网架构运维经验、主流的开源技术、企业关键业务的最佳实践相结合,为客户提供高性能、高可靠性的软件定义存储产品。并今年5月完成1.2亿的B轮融资,投资方为启明创投、北极光创投和红点中国。

XSKY创始人胥昕曾在国内第一家OpenStack厂商担任CTO,在做云计算期间发觉存储行业的痛点和未来趋势,决定以此为方向创业,于2015年创建XSKY。

XSKY成立之初就瞄准了线下传统企业客群。对象存储在互联网企业中应用很广,而传统企业对块存储需求旺盛,块存储对性能、稳定性要求很高,这恰恰是之前SDS一直无法完美解决的问题。

经过两年研发和迭代升级,XSKY的分布式块存储产品X-EBS已经支持多路径的光纤协议、iSCSI等接口,并与VMware官方接口整合。同时增加了监控体系、自动恢复机制等企业级存储功能,可以在上面运行Oracle数据库等关键负载,基本满足企业级客户的需求。

仅仅满足企业现有需求是不够的,未来所有IT产品都将为应用服务,存储同样如此,数据将成为连接存储和应用的桥梁。除了数据存放之外,数据的冷热分离、整个生命周期的运营都将成为客户需求。

国外已经明显呈现出以上趋势,并出现了数据平台(Data Platform)这个新领域,涌现出Cohesity、Hedvig等初创公司,其中Cohesity最新一轮融资达到9000万美金,Hedvig最近同样也拿到惠普2150万美金投资。

基于对未来趋势和国外发展现状的判断,XSKY发布新产品企业级统一数据存储平台X-EDP,在提供对象存储、块存储和文件存储服务的基础上,增加了很多以数据价值管理为中心的功能。

近期,爱分析对XSKY创始人胥昕进行访谈,他分享了XSKY的业务模式、运营财务状况以及未来战略,以及他对存储市场未来发展趋势的判断,现将部分内容分享如下。

业务与战略

爱分析:X-EDP是不是理解为X-EOS加X-EBS?

胥昕:并不是,X-EBS加X-EOS仅仅是一个基础,上面还做了很多事情。

比如提供了内置的备份,加了很多数据保护的功能,块存储可以备份到对象存储,对象存储可以恢复到块存储。还可以做到数据混合云,块存储的同城双活、对象存储的两地三中心,实现了很多数据流动和数据保护的高级特性。

用户在企业中关注的是一个“数据平台”,而不是一个简单的“存储平台”。以前的存储机制是对象存储、块存储、文件存储等多种接口,数据能不能可靠、高效的存放访问,那个叫存储平台;X-EDP全面的考虑数据的存放、流动、生命周期,以及跨越数据中心和多云的部署,以数据为中心去管理。

爱分析:这和大数据公司帮助企业做基于Hadoop的平台有哪些不同?

胥昕:Hadoop是一个很垂直的产品,重点在于让分析型数据靠近计算。而我们帮助用户解决数据存放的所有问题——交易型数据和分析型数据,业务数据和备份数据,在线数据和离线数据等。Hadoop是独立的分析集群,不是用来做数据长期存放的,要分析什么就把相关数据从X-EDP上拷贝过来,进行分析。

爱分析:X-EDP与传统数据库的区别是什么?

胥昕:数据库是解决结构化数据存放和访问问题,不能存储图片,数据库下面需要存储,通常是块存储。X-EDP存放的数据可以同时是非结构化和结构化数据,包含数据库、虚拟机、图片、视频、音频、保单、备份等等。

我们其实是一个数据存储平台,数据库在我上面,Hadoop在我旁边,可以从我们这里拿数据做分析。

爱分析:现在重点会布局哪些行业?

胥昕:从公司目前的业务来看,第一大行业是金融,第二大行业是媒体,第三是运营商,第四是政府,后面就比较散。目标定位于数据量较大,本身客户群较大,对数据进行高附加值利用的行业客户。

爱分析:针对块存储的策略是什么?

胥昕:很多人问我一个很尖锐的问题,软件定义存储,特别是做块存储,不是一个新行业,是一个老行业。很多人问为什么这些SDS做块存储的公司在美国创业十年没有成功?

做存储不是同类产品的对比,替代什么很重要,要能替代SAN。SAN的特点就是高性能、稳定性,这是企业级存储和个人存储的差异。同时,性能容量的线性扩展也是现在客户越来越关心的问题。

爱分析:什么是企业存储?

胥昕:满足三点,一是有一个机制把下面的多个硬盘管理起来,做到性能损耗最低;二是能够把接过来的硬盘能力对接出去,支持很多企业级的接口,比如光纤协议、iSCSI协议,云原生的虚拟化协议、VMware私有化协议;三是要支持企业级的功能,包括加密、压缩、去重,高度的可靠性、完善的监控体系、强大的资源调用体系、自动恢复机制等功能,这些都是企业级功能。

很多企业买存储认为可靠性和高性能是基本能力,真正打动用户购买的一定是功能,能解决用户什么问题。

我们看到SDS第一步发展是从专用硬件将软件抽出来,这很伟大,但是不够,第二步是把它做到拥有高可靠性和高性能,真正想在积累了20年的传统存储功能的标准上产品化很难。ScaleIO被收购时连界面都没有,更谈不上功能。这一点上现有的软件定义存储,甚至是很多国际知名的产品,做到替代传统存储是有距离的。

所以我们的策略是将先进的分布式技术和20年积累的传统存储产品化程度和功能相结合,才能做出一个将互联网技术充分产品化的分布式产品,用户买技术没有用,要买产品才有用。

爱分析:针对这个策略,团队是如何组建的?

胥昕:我们目前的团队是碰撞结合的。Team-A是全球Ceph开源社区贡献排名前列的团队,来自于一线的互联网公司以及开源领袖,比如360、新浪、Intel等等,都是做先进的分布式算法,包括Ceph本身的存储引擎。

还有来自IBM、华为、中兴研发团队的Team-B,他们有丰富的做传统存储的经验,两个团队相结合在内部碰撞,做出自己的企业哲学,将新的分布式存储技术和传统产品化结合,最后做出用户需要的产品。

我们的产品很强调企业级能力,之前SDS在单点的性能上是不如SAN,所以跑不了Oracle,我们现在的性能可以跑Oracle。

如果没进入高性能场景,相当于没有进入存储主战场。光是云存储或者冷数据存储,其实市场渗透率很低。

爱分析:从技术到实现产品化过程中需要克服哪些难点?

胥昕:一、创业开始阶段,从CEO到整个核心团队一定要把80%的精力放在产品上而不是技术,好技术和好产品是两码事,我们更关注用户在不同场景下使用产品的感受。

二、国内的底层技术团队陷入一个怪圈,没有技术远见就会陷入外包和项目型。美国创业公司比我们好的地方,VC容忍烧三年的钱,公司会专注于打磨技术和产品。中国不一样,第一年就要做营收,产品不稳定就要先做项目,界面都没有就要卖产品,产品不够靠人堆,研发团队跑到一线机房去给别人做24小时运维,那么研发产品就更无从谈起。

今天很多创业公司的产品版本号都没有内部标准,就更难去做产品化。一旦有产品版本号就有完整的生命周期管理,从预研阶段到研发阶段到QA阶段到GA阶段到交付阶段是一个很严肃的过程,有这么一个过程可以把产品做得很完整。

前两点决定了内部流程,流程决定产品。

三是产品的方法论,例如买一台思科、DELL的交换机,他的产品是包括说明书、安装包、法律法规、每个版本迭代更新内容、潜在Bug的Q&A的完整产品,这才是产品完整性。

国内很多仅是提供产品安装包的形式,不是能力不够,而是没有把精力放在产品完整性,一般都是放到技术研发或者做项目上,在前期的产品线不够完善或者产品本身不够可靠的情况下,如何平衡营收和产品质量的问题是创业公司特别是基础设施创业公司最大的挑战。

爱分析:XSKY采取的做法是什么?

胥昕:一、我们有志同道合的股东,我们知道自己的策略和资源整合方式,创业公司在市场中取胜的法宝就是快,但我们也要平衡产品质量和发展速度的关系,公司的董事会成员观点一致,比较和谐。今年上半年营收增长特别快,董事会的首要态度是要求质量是否有保障。

二、本身所处的行业比较好,因为越往上做行业属性越强越好,预算就会越高,比如给医院做一套挂号系统,相对来说,本身的技术研发成本不高,但是预算很高,因为不同的医院挂号系统也有很大不同,所以编辑成本会很高、定制需求会很强,项目无法标准化,存储行业很难出现定制化需求,比如不用光纤协议换个别的定制的协议,技术创业者擅长做技术但不一定擅长定制,也不好管理。

三、明确商业价值观,明确哪些东西能做哪些东西不能做,把精力专注于做产品,对自己擅长的,要做到完美。开源本身不是商业模式,无论开源还是闭源,商业模式无非是三种:一是做产品,二是做服务,三是做外包。开源技术越成熟越很难做产品,用户自己下载一个开源版本就行,他有很强的自己的想法,肯定全定制了,不会买产品。

开源技术不是不好用,而是一个部分。如果存储是一辆车,Ceph是一个发动机,用户不能只买发动机,而是需要买一辆汽车。还有方向盘、座椅、空调和底盘,它都是没办法缺失的,Ceph只是XSKY的最重要的一个模块,这样就很好产品化,用户最后在意的是整个产品的能力。

爱分析:未来的战略是什么?

胥昕:解决用户在混合云时代数据的管理、存放、读取、保护、流动等一揽子数据基础设施问题的产品化公司,高度产品化,保障工程质量和速度持续提升优化,不是解决单个问题而是一揽子问题。

运营与财务

爱分析:团队多少人?

胥昕:XSKY员工人数不到200人,研发及服务团队约不到100人。之前介绍过,我们研发团队来自一线互联网公司和传统存储公司的碰撞结合,其他部分是营销和职能部门,我们营销部门人员也大多来自DELL、Intel等一线公司,有着丰富的营销经验。

爱分析:现在成本大部分是人力成本和机器成本?

胥昕:从会计准则来讲,占大头的主要是人力成本,固定资产按3到5年折旧。工程师成本非常高,核心竞争力也是人力,而且要让核心团队留在公司,让技术人员在一定的职业规划下,稳步提高和成长。

爱分析:现在销售层面渠道多一些还是直销多一些?

胥昕:从目前的情况来看,自己做的项目比较多,有些行业标杆项目都是我们自己做下来的,渠道也会有一些。

爱分析:收费模式是什么?

胥昕:收费模式很简单,license。授权模式按节点或TB两种都可以。

爱分析:预计今年营收多少?

胥昕: 今年全年的预计营收增速是四倍多。明年压力可能会大一点,对纯软件公司来讲,营收过亿门槛很高。所以更多焦点放在明年的布局,而不是今年下半年。

行业与市场

爱分析:有没有哪些对标公司?如何考虑未来竞争格局?

胥昕:对标Data Platform公司,主要是美国的Hedvig、Cohesity。

我们不怕美国公司进入国内,最大的挑战在于进入后会有一堆公司在模仿他们,这会对我们产生冲击。

在国内我们的主要市场有两块:一个是SDS增量市场,另一个是传统存储转移至SDS的市场。SDS的增量市场XSKY有着天生的优势,所以未来我们会重点关注传统存储转移至SDS的这块市场。

爱分析:Ceph社区中Red Hat贡献最大,他现在有在做存储吗?

胥昕:企业哲学不太一样,我们其实是一家商业软件公司,基于开源技术,完全遵守LGPL协议。

Red Hat的大多数产品都是开源的,红帽商业模式很简单,相当于把地球上绝大部分的海水转化为可以食用的纯净水,纯净水很多时候还是原料,可乐、雪碧需要纯净水制造,我们则是相当于专注于可乐产品。

为什么在Ceph社区里红帽一家独大,这是必须的。在一些开源项目里看到的可能是完全平等化,大家都很平等地在玩,容易造成分裂,大家很难有一致的目标规划,比如安卓至今也没有分裂,因为Google一家独大,完全可以决定安卓未来的走向。

每个成功的开源项目后面一定有一个一家独大的主导者,决定技术的明确发展方向。

爱分析:公有云考虑自己做存储吗?

胥昕:当然,但我认为未来是混合云时代,有些数据在私有云,有些数据在公有云。

混合云会产生新的问题,具体哪些数据放在公有云,哪些数据放在私有云,很难搞清楚。X-EDP有一个功能,可以对接所有的七牛云、腾讯云、阿里云、AWS,数据统一写在我们这个私有数据平台上

一是之后我们会做数据的生命周期管理,比如一个月都不读的数据会自动放到阿里云和AWS,数据到我这儿会留存一份,实时拷贝到腾讯云和阿云,实现分发,当用户不需要的时候,可以帮他删掉。

二是帮助用户解决绑架问题,大家以前最怕被IBM捆绑,用了之后就不太容易再迁移,但是现在云厂商捆绑用户才是最可怕的,而我们可以把用户所有的数据按策略分发到各个云平台,这样客户不会被某个云所捆绑。

所以X-EDP真正在混合云时代帮助用户解决上云的问题,上云不是直接用就可以,还产生一大堆的新问题,所以这是X-EDP的关键所在。

爱分析:全球的存储行业300亿美金市场规模,为什么中国只有两三百亿人民币的市场规模?

胥昕:全球存储的发展其实可以看作全球经济发展的一个缩影,美国,中国,日本分别是世界GDP的前三名,其存储的市场规模也分别是前三名,但是美国一家的数据量太大,占全球43%的市场份额,中国虽然是第二但是只有9%的市场份额,这说明我们还有很多路要走。

一、国内对数据的重视程度不够,中国的数字化转型起点落后,比如以前国内大部分医院X光片直接存储在仓库,广电的媒体库资料也都是光碟磁带放在仓库,数据在线率几乎为零。

大数据时代的冲击,迫使国内数据在线化转型。现在卫计委要求医院X光片电子病历也要存30年,全国地区的身份证数据也正在打通,大数据需求现在才刚刚开始增长。

二、数据的使用价值没有被挖掘。

三、存储行业的单位售价低。美国一个存储卖30万美金,到了中国卖三十万人民币,一家公司能改变整个行业,搞得大家都没法玩。华为现在只做40亿,32%的市场占有率,侧面影响了整个盘子不到200亿。

全球整体的传统存储在下降,而中国每年保持增长17%,原因来自以上三点在发生改变,中国SDS每年高达150%左右的年增长率(YoY Growth)。

爱分析:您判断未来存储会占到整个基础设施的比例是多少?

胥昕:全球一直是35%~40%左右的比例,因为存储贵,然后网络、服务器差不多百分之二三十,我觉得这个比例不会变化。