数据智能

2023爱分析·实时数仓市场厂商评估报告:SelectDB

随着数据库国产化持续推进,新型数据库落地需要一定技术服务兜底,且随着大语言模型在数据技术领域的渗透,“AI for DB”或将带来对数据库运维等能力的重塑。甲方需求与技术发展趋势,使得数据库工具与数据库服务市场的机遇与挑战并存。

2023年06月29日
  • 数据智能

 

01  研究范围定义

数字经济时代,企业数据朝着海量、实时化、多样化的趋势演进,数据库管理系统是企业重点关注的数据基础设施之一。在本报告中,爱分析将数据库市场划分为数据库产品、数据库周边工具、数据库服务和数据库安全四个细分市场。

图:数据库市场趋势

从今年的数据库市场趋势看,产品层面,在信创政策不断深化下,数据库国产化替换进程加速,且向核心业务系统渗透。存量市场主要聚焦于事务型关系数据库、分析型数据库市场,尤其是 MySQL、Oracle、PostgreSQL 等主流技术路线的替换。另一方面,在数字化转型的趋势下,企业业务变化,带来了新兴的数据应用场景,这导致实时数据与非结构化数据占比上升。因此,实时数据仓库以及一些专用数据库,如图数据库、向量数据库、时序数据库等,将在这些新兴的应用场景中发挥优势。
除产品之外,传统数据库厂商退出中国市场,促使用户对数据库配套工具和厂商服务更加依赖。以前,以 Oracle、Teradata 为代表的传统数据库厂商,其周边工具与服务生态已相对成熟完善,足以支撑企业在数据库使用和运维管理上的需求。但是随着数据库国产化持续推进,新型数据库的落地必然需要一定的技术服务兜底,并且对数据库的纳管运维带来了一定挑战。另一方面,随着大语言模型在数据技术领域的渗透,“AI for DB”或将带来对数据库运维等能力的重塑。甲方需求与技术发展趋势,使得数据库工具与数据库服务市场的机遇与挑战并存。
针对今年数据库的市场变化,《2023爱分析·数据库厂商全景报告》将对数据库市场需求与供给的发展趋势进行解读,同时对重点细分市场的代表厂商进行能力评估,以便为企业数据库规划与厂商选型提供参考。
本评估报告聚焦实时数仓市场,爱分析遴选出具备成熟解决方案和落地能力的厂商,供企业在做实时数仓厂商选型时提供参考。同时,在该市场下,爱分析重点选取了实时数仓厂商 SelectDB 进行能力评估。

02  实时数仓市场分析

市场定义:

实时数据仓库是一种能够对结构化或半结构化数据实时存储和计算的数据仓库。与传统数据仓库不同,实时数据仓库支持海量数据的近实时查询,适用于需要快速分析或决策的场景,如自助分析、在线报表等。

甲方终端用户:

企业 CTO、CIO、IT 部门负责人、科技部门负责人、大数据部门负责人、应用开发人员、数据库管理员

甲方核心需求:

大数据时代,数据正在发生质的变化,数据体量呈爆发式增长,数据类型也越来越丰富。同时,业务也在面临数字化转型,大量决策需要实时数据作为支撑,在线报表、自助分析等应用逐渐成为企业数字化经营的刚需。海量数据与业务实时化的趋势,对数据仓库的存取性能提出了更高的要求。

然而,传统数据仓库在大数据时代遇到了扩展性与响应速度的瓶颈,难以满足企业对海量数据实时存取的需求。例如,以 Teradata 为代表的数据库一体机,仅能够支持有限的数据规模,并且价格昂贵。以 Hadoop 为代表的大数据技术,虽然具备海量数据的存储能力,但是查询性能表现不足,而且其技术组件通常较为复杂,运维成本高。

针对传统数据仓库在实时场景上的能力欠缺,企业需要:

  • 通过海量数据的实时查询与分析,支持数据挖掘与实时决策等场景。随着企业在经营管理中所产生的数据量呈指数级增长,企业希望数据仓库具备海量多源异构数据的处理能力。而且,随着业务对数据时效性的要求越来越高,实时决策需要通过分钟级的近实时数据作为依据。尤其在交互式分析中,会涉及到即席查询的能力,用户需要灵活自主地组合查询条件,从多个维度对海量数据进行探索分析。
  • 高可用的数据服务。数据是一切数字化应用的基础,稳定可靠的数据服务是企业的基本诉求。另外,企业需要系统具备一定的机制来应对服务器故障、操作失误等异常场景,无需人工干预即可自动恢复。

此外,部分企业还希望:

  • 数据安全获得保障。金融、央国企等客户出于法律法规监管,以及对客户隐私、商业信息或国家机密的重视,希望获得数据安全保障。因此具备一定安全机制与功能,防止内部或外部的信息泄露威胁,成为这些领域客户的诉求。
  • 得到专业完善的服务。企业希望获得全面的技术支持和咨询服务,无论是关于运维管理、性能优化、安全管控还是其他方面,企业希望可以获得专业指导和建议,以便更好地解决问题和创造价值。
  • 配备丰富的数据仓库工具。企业希望通过数据仓库相关工具,更加高效便捷地使用、管理数据库,尤其在数据导入与运维方面。在数据导入上,一些复杂的数据转换场景,需要借助 ETL/ELT 工具实现高效灵活的数据导入。在运维管理上,工具在自动化管理、数据安全和可视化监控等方面可以提供非常大的帮助。
  • 在云上部署数据仓库。出于对性能、易用性、成本或安全性等因素的综合考量,部分企业选择在公有云、私有云或混合云上部署数据仓库,来满足海量数据处理对数据仓库弹性扩展的需求。