摘要:好的软件定义存储产品是新兴技术与传统存储丰富功能的结合

三年累计融资超4亿,获全球顶级风投认可的XSKY欲打造世界级国产存储 | 爱分析调研-爱分析

XSKY实现了块、对象和文件的统一存储,构建开放的应用支持生态,并提供传统存储具备的丰富功能,将软件定义存储技术转变为企业级产品,满足客户需求。NEA的投资,为XSKY在技术视野和企业管理上带来了更多资源和经验,看好XSKY未来的发展。

指导 | 凯文 李喆

调研 | 李喆 张宏祥

撰写 | 张宏祥

软件定义存储(SDS)采用分布式架构,将各种存储资源池化,统一由软件进行控制,提升了通用存储硬件的性能,易于动态扩展,降低了购买专用存储的成本,成为存储发展的趋势。

据IDC预计,2017-2021年期间,全球软件定义存储市场复合年增长率将达到13.5%,到2021年市场规模将接近162亿美元。

XSKY创始人胥昕,曾参与新浪SAE研发,后担任UnitedStack联合创始人。在此期间,胥昕意识到存储是制约云计算发展的最大瓶颈,于2015年与另外两位伙伴共同创立了XSKY。

今年4月,XSKY获得由国际顶级投资机构NEA恩颐投资领投2.4亿人民币C轮融资。NEA在全球投资了大量的优秀存储企业(例如:超融合领域SpringPath,Cisco收购后更名为HyperFlex;对象存储鼻祖Cleversafe,现为IBM产品线;全球最早的PCIe SSD企业Fusion-io……),将为XSKY带来更长远的技术视野和丰富的企业管理经验,助力XSKY继续领跑国内软件定义存储行业。

三年累计融资超4亿,获全球顶级风投认可的XSKY欲打造世界级国产存储 | 爱分析调研-爱分析

同时支持块、对象、文件三种存储的统一数据存储平台

XSKY已经相继研发推出以下几款纯软件产品,主要瞄准中端以上存储市场。

1. X-EBS(XSKY Enterprise Block Storage)企业级块存储产品:主要用于支持虚拟化、数据库等核心应用。根据IDC报告,X-EBS在2017年中国SDS块存储市场占比15.8%,仅次于华为和新华三。

2. X-EOS(XSKY Enterprise Object Storage)企业级对象存储产品:主要解决海量数据问题,尤其适合图片、音频、视频等非结构化数据,支持海量并发访问的需求。根据IDC报告,X-EOS在2017年中国SDS对象存储市场排名第一,占比27.6%。

3. X-EFS(XSKY Enterprise File Storage)企业级文件存储产品:基于灵活的SDS架构,可同时提供文件与块两种不同存储类型,实现了文件和块的存储整合、平台共享。面向的应用场景包括文件共享、数据归档、广电非编应用等。

4. X-EDP(XSKY Enterprise Data Platform)企业级统一数据存储平台:X-EBS、X-EOS、X-EFS本身仍是局部产品,无法完全解决企业内部数据孤岛问题。X-EDP则包含了以上三种产品,实现了结构化、半结构化、非结构化数据在不同类型存储之间的流动和平台共享,同时融合了快照、复制、备份、归档等统一完整的数据保护方案,构造统一存储,建立起真正意义上的“数据湖(Data Lake)”基础设施。

重视功能性,打造企业级存储产品

可靠性和高性能,无疑是企业选择存储产品时的重要指标,但XSKY创始人胥昕认为,这只是存储的基本能力,真正打动客户的一定是功能性,即解决客户实际问题的能力。

与传统存储相比,软件定义存储实现了软硬件的解耦、易于扩展,在技术上是领先的,但过去在功能上、应用广度方面落后于传统存储,只有将先进的技术与丰富的功能相结合,才能打造出优秀的软件定义存储产品。

目前,XSKY产品核心研发团队约100人(含质量中心团队),占比约40%,分为A、B两队,Team A在全球软件定义存储开源社区贡献上名列前茅,来自IBM、Intel、Red Hat等科技公司,保证了XSKY在软件定义存储技术上的领先;Team B来自华为、中兴、Dell EMC等公司的传统存储团队,对传统存储的功能性和产品化有着深入理解。

XSKY几乎兼容了传统存储的大部分企业级功能,包括加密、压缩、去重、备份、数据冷热分离、权限控制、对光纤协议的支持等,致力于实现数据全生命周期的管理。

不同企业在不同场景下,会有非常清晰的功能性要求,存储的功能性越多,为客户提供的价值就越大。强大的功能性,使得软件定义存储技术真正成为企业级产品,帮助XSKY赢得了客户的认可。

应用多样性爆发,构建应用支持生态体系

如今,技术发展越来越快。例如,底层技术上,从VMware到OpenStack,再迅速到容器和Kubernetes,Serverless无服务架构也开始受到关注;数据库领域,从传统关系型数据库到列式数据库、时间序列数据库,以及NoSQL非关系型数据库的兴起。

而且,这些技术多数为非标准的,例如,各家容器厂商的标准不同,不同医疗影像厂商PACS系统的标准不同。

以前,上层应用的割裂,导致存储的割裂,多种专用存储分别支持各类应用,也使得运维难度大增。XSKY希望帮助客户构造统一存储的“数据湖”,就必须适配更多协议,支持更多应用,构建应用支持生态体系。

目前,XSKY对传统的VMware虚拟化、数据库、邮件系统等,以及新兴的OpenStack、容器、大数据分析、云端医疗影像等应用均实现了支持,并联手Cisco、VMware、ZStack、Rancher等共同落地整体解决方案。

应用支持生态体系的建设,一方面进一步提升了XSKY产品的功能性,另一方面,通过相关生态合作伙伴,XSKY扩大了触达客户的范围,提升了获客能力。

自上而下建设渠道体系

XSKY目前定位于数据量较大,需要对数据进行高附加值利用的企业客户,前几大行业包括金融、媒体、运营商、教育、制造业、政府等。

中国企业已经广泛考虑数据化转型,市场并不仅仅集中于北上广深等一线城市,各省各地都有非常大的需求。

一方面,XSKY直销团队已有约60人,除北京外,在上海、深圳、成都、南京、武汉均有办公室,覆盖各大区域,获取标杆客户。

另一方面,XSKY自上而下大力建设渠道体系,包括总代、金牌合作伙伴、认证合作伙伴等,从而更好地为客户提供本地化服务。

XSKY将渠道合作伙伴分为四大类:

第一类是经销商,包括集成商和分销商。

第二类是ISV,主要是前文提到的应用生态合作伙伴,为企业提供统一的解决方案。

第三类是硬件OEM厂商,传统存储公司有非常好的OEM伙伴,XSKY也会通过与OEM厂商合作,让自己的存储产品成为对方行业或平台产品的一部分。

第四类是生态领导厂商,主要包括全球主流IT厂商,如Dell EMC、Cisco、Intel等。例如,XSKY已联合Cisco、Intel构建了包括面向医疗、金融、广电等垂直行业的系列联合解决方案。

目前,XSKY 70%的签单来自渠道销售体系。

全方位均衡发展,对存储行业有深刻理解

除了进一步完善应用支持生态和销售渠道体系,由于存储介质的进步,XSKY正在研发相关的全闪存产品。此外,XSKY致力于成为领先的数据生态公司,以存储为切入点,未来会向数据应用层面渗透。

同时,在NEA的帮助下,海外市场的销售推广也在着手准备之中。

爱分析从技术、产品、客群、获客、生态等五个维度对XSKY进行评价。

技术:XSKY产品核心研发团队约100人,占比约40%,在软件定义存储技术上积累深厚,实现了对块、对象、文件三种存储的统一管理,并支持多种类型的传统和新兴应用,成立至今客户数据丢失率为0,客户流失率为0。

产品:研发团队对传统存储的产品化有着深入理解,拥有传统存储的绝大多数企业级功能,满足企业在使用时的种种需求,能够通过渠道进行大规模推广。测试人员与研发人员比例约为1:1.8到1:1.5(美国科技公司最高能达到1:1),通过大量严格的测试,保证存储产品的稳定可靠。

客群:定位于数据量较大,数字化转型需求强的客户,包括金融、媒体、运营商、教育、制造业、政府、医疗等,平均客单价约数十万元,单笔客单价最高接近千万(含服务),且扩容需求高,按金额计算的续费率约为100%,标杆客户包括太平洋保险、江苏农信、恒丰银行、飞贷金融、东吴证券、厦门航空、东方明珠、贵州广电、中国移动等。

获客:直销团队获取标杆客户,同时自上而下建立了包括经销商、ISV、硬件OEM厂商、生态领导厂商在内的销售渠道体系,渠道销售占比已达到70%,帮助XSKY实现规模化扩张。

生态:构建了开放的应用支持生态,对VMware虚拟化、数据库、OpenStack、容器等应用均实现了对接,并与Cisco、VMware、ZStack、Rancher等各行业主流公司落地整体解决方案,共同服务客户。销售渠道生态体系,目前也日趋完善。

三年累计融资超4亿,获全球顶级风投认可的XSKY欲打造世界级国产存储 | 爱分析调研-爱分析

近日,爱分析对XSKY创始人兼CEO胥昕进行了访谈,他对XSKY的发展情况、未来战略,以及存储行业发展趋势等方面,进行了详细阐述,现分享部分内容如下。

软件定义存储需要在兼容性和稳定性之间寻找平衡

爱分析:块、对象、文件三种类型的存储中,XSKY的文件存储产品X-EFS开发的最晚,开发的难点主要有哪些?

胥昕:首先,文件存储的核心是文件系统,只有少数大厂有好的文件系统,比如微软的NTFS、FAT32,苹果刚开发的APFS。文件系统的开发,本身就是一个很大的难题。

其次,不同于对象存储,它没有元数据,而是靠哈希或者是路径寻找,文件系统是有元数据和索引的,组件更多,复杂度比对象存储要高,但是使用起来会稍微更便捷。

第三点,文件存储功能性更多,需要有文件夹级别的权限、用户之间的打通、文件夹容量的限额、文件级压缩、文件级去重等功能,颗粒度更细,也使得它的难度更大。很多存储厂商的文件存储其实是基于块存储研发的,包括EMC。

爱分析:不用能开源的HDFS来开发文件存储吗?

胥昕:HDFS非常接近流式的文件系统,主要适用于大文件和顺序读顺序写的场景。如果存储大量1KB的文本小文件,HDFS的读取性能可能很差。

XSKY在Data Lake的愿景下,希望通过一个架构能够适用于大文件、小文件,甚至混合文件的场景,这正是我们开发文件存储的难点。HDFS跟场景绑定,在大数据场景下做得非常好,但是距离通用的文件存储产品还是有一定距离。市场上也很少会有厂商单独售卖HDFS,它更多是Hadoop框架的一个组件。

爱分析:XSKY的SDS产品能够适用于多种场景和多种应用,这是否也意味着,同传统专用存储相比,对单个应用的支持能力其实是下降了?

胥昕:SDS其实是在做存储的云化,大一统后的确会遇到一些问题,包括隔离性、安全性,以及对单一应用的支持性,不过,在池化存储上也出现了很多新的技术。

例如,存储池的分池分券、多租户、物理隔离、逻辑隔离、QoS(Quality of Service)技术等。QoS技术值得重点谈一谈,就像三环路上的公交专用道,在道路拥堵时,也能够保证公交车的通行是最优先的,通过QoS机制,我们保证了对单一应用的支持,通过设定优先级,可以明确哪些应用允许拥堵,哪些应用不允许拥堵。当然,无法做到所有应用都不拥堵,但这是非常极端的状况。

爱分析:美国的SDS厂商更偏向于交付软硬件一体机,而非纯软件,这是为什么?

胥昕:这对我们来说也是挑战,SDS最难的是稳定性,因为它太开放。苹果为什么稳定?因为它是端到端封闭。传统存储非常稳定,同样是由于端到端封闭,其中的内存、硬盘等都不允许用第三方的产品代替。SDS要实现对各种硬盘和服务器的支持,稳定性只能向兼容性妥协。

美国厂商做软硬件一体机,也是为了提高存储产品的稳定性。它们能做好,是由于它们在供应链管理以及端到端管控上,积累了几十年的经验。这对中国创业公司来说是一个挑战,但如果能够做好,会成为护城河。

XSKY也已经建立了供应链团队,开始考虑这件事情。

爱分析:一体机强化了稳定性,兼容性上可能会差一些,如果一体机要实现统一存储的数据湖,是否会有一些问题?

胥昕:是的,特别是在用户场景下,企业很多时候会基于通用的x86服务器来实现供应商的解锁。可以看到一些厂商软硬件都卖,比如Nutanix,从硬件起家,一开始只卖一体机,后来开始提供纯软件,提升了适配性。

这个需要工程成本,例如,VMware在兼容性方面,就有1,000多个工程师,它做生态不做一体机,但取得了更大的适用面。

取得平衡不容易,长期来看,可以学习Nutanix,通过不同的产品形态,适用于不同的场景。XSKY目前并不急于推出软硬件一体机,我们还是希望能先把脉络打通。

爱分析:很多其他行业的公司也在提数据湖的概念,例如数据库厂商、大数据分析厂商等,如何理解这之间的差异?

胥昕:数据湖的本质是将数据放到一个大一统的平台之中。

存储是数据湖最直接的应用,软件定义存储需要对接不同协议、不同类型的应用、不同品牌的数据库等,致力于通过一套存储对不同种类的数据和协议进行统一支持。

数据库公司提出的数据湖理念,是指面对客户不同的应用,它都能提供合适的数据库引擎进行适配,因此主要是数据库层面。但不是所有的内容都可以通过数据库来管理,比如虚拟化、图片、音频、视频。

大数据分析厂商,则是通过建立数据仓库,将结构化、非结构化数据放到一起,便于统一进行数据分析。

不同厂商的概念都是对的,大家的统一使命是让用户在应用多样化之后依然能够享受统一管理的便捷性,只是分别在不同的层次上展开竞争。

制造业与政府对数据管理的需求日益增强

爱分析:XSKY去年的重点行业是金融、媒体和运营商,今年是否有新的重点行业?

胥昕:还有两个行业非常值得关注。

第一个是制造业,有国家产业政策引导的帮助,随着技术的发展,先进制造对数据产生和利用的欲望极大提高。例如,XSKY的客户,贝因美奶粉,进行质检的电子化改造,保存相关质检数据,然后通过大数据来分析生产过程中温度、湿度等的变化对产品质量和经营的影响。还有汽车行业车联网、辅助驾驶都需要收集海量的数据。

第二个是政府,国家深化政务改革的决心很大,要实现让数据多跑路,让群众少跑腿,提升电子政务公开透明水平。这就要求政府进行数据化转型,实现无纸化办公和数据的统一管理。我们可以看到,法院在建设电子法庭,实现远程或者联席审判,考试院在实施阅卷无纸化。

爱分析:政府市场,像华为这样的传统大厂,可能与政府拥有更深入的关系,在这个市场,XSKY如何与之竞争?

胥昕:首先,XSKY和大厂商不同。

大厂商的优势是有全栈产品和统一平台,主要是建设大规模的政务云这样的项目。XSKY的数据湖,更关注的是业务,例如考试院,并不是需要一个庞大的云,它有扫描端、阅卷端、分析端,以及结构化的数据库,XSKY根据其业务逻辑,提供了一个存储平台。法院也是,XSKY在智慧法院做的是一个应用,而不是一个云平台。这是我们与华为这类大厂的差异化之处。

第二,中国市场真的非常广阔。

例如,四川有21个地市州,云南有16个地市州,而湖北有13个地市州,每个市又有将近5到8个区,这些是非常广阔的市场。华为等大厂可能更关注省级政府,那XSKY可以去服务区县级政府,我们愿意和客户一起去实现不同层面的数字化转型,帮助它们享受到数据湖的便利。

爱分析:所以XSKY主要服务的是区县级政府?

胥昕:都会有,XSKY也有省公安厅、省考试院、直辖市检察院、市疾控中心这些大的部门客户,只是我们面向应用,而不是面向云。

爱分析:政府各级部门,正在做数据打通,这些方面基础设施的建设,是由上级单位统一规划和采购吗?还是说下级单位也有相关权力?

胥昕:规划和基础架构是统一的,但实施单位一定是各级政府,因为地方政府执行力更强,对基层的情况更加了解。上级政府定义好数据交互的接口和标准,下级政府只要能保证数据的交互,就足够了。

爱分析:XSKY的SDS产品,在金融客户中,已经应用到生产系统了吗?

胥昕:首先要分应用,然后每个应用都要分层级,包括开发环境、测试环境、仿真环境、生产环境等。目前在金融行业里,XSKY的产品已经应用到了超过30个生产环境,其他环境的应用更多。

从测试环境到生产环境,需要一个过程,例如XSKY的客户东吴证券,在仿真环境下运行了1年半我们的产品,今年4月开始使用于生产环境。其他的,XSKY还有一些保险公司和股份制银行客户,已经开始进入生产环境。

爱分析:XSKY的SDS产品,在金融行业应用于生产系统时,主要有哪些场景?

胥昕:以保险为例,首先是互联网应用,包括互联网保险销售、互联网模式下的理赔等所有的互联网业务。第二是大规模的影像,有两个方面,第一是保单和票据凭证,第二是录音录像双录系统。一部分企业可能还应用到了OA甚至ERP系统。

核心交易系统方面,客户可能还是在传统模式,新兴技术应用的比较少。

2021年,软件定义存储市场份额将超过传统存储

爱分析:政府部门一般在存储上能够投入多少预算?

胥昕:一般预算分配到应用和基础设施的比例为3:7或4:6,也就是说,基础设施占比能超过50%,基础设施中的存储(含硬件)部分,基本都是占20-30%。

爱分析:不同行业,存储占IT预算的比例会有很大差异吗?

胥昕:不会。除非是一些特殊的应用,例如自动驾驶,一个自动驾驶软件的价格可能会超过其他所有基础设施。通常是已经是实现供应链式管理的应用,IT预算的分配会比较稳定。

爱分析:企业在分配存储预算时,还是硬件占比更高?

胥昕:是的,软件比硬件大约是1:4。截止到今天,XSKY只做软件,硬件上我们会推荐好的合作伙伴给客户,客户也有自己的选择。

爱分析:SDS在企业存储中的占比目前并不是很高?

胥昕:是的,绝对比例并不大,根据IDC的报告,目前占比差不多刚超过15%。因此,目前SDS的渗透,主要体现在使用面的增加,而不是使用层次的加深。但SDS真正开始大规模落地,也仅仅3-4年的时间,这个发展速度已经很快了,比当年虚拟化普及的速度要快。

爱分析:您认为SDS还需要多长时间才能普遍应用于生产系统?

胥昕:我很乐观,IDC、Gartner普遍认为,世界范围内,在2021年之前,SDS的市场份额会超过传统存储,有些机构更加激进,认为2020年就能超过。我觉得在中国,2021年时也会发生这个转变。

创业公司与大型厂商在深度和广度上各有侧重

爱分析:XSKY目前在市场上主要有哪些竞争对手,除了与XSKY同赛道的创业公司,以及华为这类大厂,还有其他的吗?

胥昕:基本就是这些,SDS行业的玩家不太多。这个行业研发周期比较长,重视积累,竞争格局变化并不快。有句话叫三流公司被竞争对手打败,二流公司被自己打败,一流公司被时代打败,存储公司最怕的是被时代打败。可能一个公司并没有犯管理上的错误,但赌错了未来的技术方向,结果满盘皆输。

SDS市场目前是增量市场,增长非常快。XSKY首先不是和竞争对手竞争,而是要理解行业和技术发展趋势,避免犯错。然后是能否跑赢市场,营收增速能否超过SDS市场增速,而不是说我要去抢华为等同行的市场份额。

爱分析:公有云厂商是否会进入SDS市场?

胥昕:都会有。但是大家的立场和角度不一样,XSKY非常专注于数据,提供数据的一揽子解决方案,是开放的,看得更深,但公有云厂商可能提供的是全栈产品,看得更广,这两者本质上并不相同。

爱分析:您认为市场的集中度,未来会进一步提升吗?

胥昕:中国市场未来很难说。

理论上来说,SDS市场很拼时间窗口和速度,研发周期长,技术变化的周期较为固定,竞争格局难以发生剧烈改变,市场集中度会逐渐提高。

但中国的市场越来越开放,资本的发展越来越繁荣,给创业带来了很多便利,包括海归在内,优秀的知识分子、富有经验的架构师和管理者越来越多,未来如果有新的公司出现,对行业产生重大影响,也并非不可能。

爱分析:根据IDC的中国SDS市场报告,2017年对象存储排名第一第二的公司是XSKY和紫光西数,而块存储排名第一第二的是老牌厂商华为和华三,为什么会有这样的差异?

胥昕:块存储是纯结构化数据,包括数据库,强调高稳定高性能,而且它有明确的国际行业标准,比如指定集或者光纤协议。因此,块存储是比拼企业在存储主战场的研发硬实力,主战场即用户的生产系统、交易系统、数据库系统。块存储的领头羊可能是大公司,XSKY也是块存储起家,有幸能排在前三。

对象存储大规模存储图片、视频、音频,拼的更多是生态。例如,XSKY要服务广电系统的客户,势必要和广电系统的开发商,包括机顶盒厂商去做大规模的适配;对象存储要作为容器镜像的存储,就要和容器厂商进行合作;要获取医院客户,需要和国内领先的医疗影像应用系统厂商合作。所以,对象存储拼的是生态、对应用的理解程度,这是创业公司以及本土化公司的优势所在。

全球领先的对象存储公司Cleversafe,被IBM以超过13亿美元的价格收购,也进入了中国市场。IBM在技术上非常领先,但是在本土化,如何和应用厂商结合,进行落地和生态构建上,做的一直不是很好。

爱分析:企业客户有哪些指标可以用来评价各家厂商的SDS产品?

胥昕:SDS目前并没有国际标准,但是它终究是存储,所以本质上,客户还是关心三件事。

第一是稳定性,这是最基本的要求。有非常多的测试方法,包括异常测试、持久化测试等,看丢不丢数据,是否有宕机时间。

第二是性能,即在特定的硬件环境水准下,能提供多少性能支撑业务。首先是存储本身的性能,例如每秒IO。其次是业务结果,例如医疗影像系统,写入或读取一张X光片的速度是多少。

第三是功能性,存储的功能性,直接决定了企业如何使用它,以及使用的深度。

爱分析:XSKY的团队规模,从去年的100多人,迅速增长到如今的250余人,为何扩张速度如此之快?

胥昕:首先,公司小的时候是做一个产品,公司大的时候是做一个产品线。今天XSKY的产品线越来越丰富,这就要求建制健全,售前、解决方案、架构师等都需要,如果有三个产品,可能就需要三个测试中心,研发团队有八个部门,做控制器、做IO、做cache的等。XSKY已经有数十个部门,每个部门增加1-2人,团队规模都会很快扩大。

其次,创业公司规模小的时候,是一个员工做三个人的事情,这样做的弊端是难以做得深入。Intel研发CPU的工程师,如果工作时间996,工作负担太重,就会难以实现创新,创新需要思考的时间。今天XSKY需要让每个员工干一人份的活,专注、深入地思考,从而建立起创新的护城河。