报告编委
爱分析
黄勇 合伙人&首席分析师
张扬 合伙人&首席分析师
洪逸群 高级分析师
任理 分析师
中国信通院云大所
魏凯 中国信通院云计算与大数据研究所副所长
序言
数字化时代,数据使用场景呈现多元化趋势,数据规模也随之爆发式增长。海量异构数据的爆发式增长,对数据库的存储和计算能力提出了更高的要求。分析型数据库因其在处理海量实时数据时具有优秀的存算和管理能力,近年来赢得了市场的青睐。
分析型数据库最早的定义是指从分散的数据源中抽取、清理和汇集各类结构化数据,形成面向特定分析主题的、相对稳定且能反映历史变化的数据集合,并通过OLAP(联机分析处理引擎)来对这些数据进行分析,即通常意义的数据仓库。其中OLAP数据库概念最早由关系型数据库之父E.F.Codd于1993年首次提出,他认为用户的决策分析需要对关系型数据库进行大量计算才能得到结果,OLTP(联机事务处理)已经不能满足终端用户对数据库查询分析的需要,因此,E.F.Codd提出了多维数据库和多维分析的概念。OLAP数据库的提出引起了很大的反响,OLAP数据库作为一类产品同OLTP数据库明显区分开来。
在此后近30年的演进中,分析型数据库先后出现了共享存储架构数仓、大规模并行处理(MPP)架构数据仓库以及数据湖等技术架构。近年来,随着企业数据分析需求的不断提升,具有流批一体和存算分离,能通过元数据层在数据湖上实现数据管理功能的智能湖仓受到了更多关注,分析型数据库迎来新阶段—智能湖仓。伴随企业数字化转型战略深入推进,分析型数据库内涵也在不断扩展,我们认为当下的分析型数据库是指为应对企业管理、业务、数据分析师、数据科学家等人员对数据的各类分析和应用需求而提供的各类数据存储和计算引擎,包括传统数据仓库、云数据仓库、数据湖等,以及目前正在兴起的智能湖仓。
后疫情时代背景下,分析型数据库在更多业务场景中实现了更广泛的应用,如流调溯源、时空分析等,分析型数据库市场也迎来了爆发式增长。近些年国内分析型数据库创业公司日益涌现,产业资本不断涌入,获得融资的公司数量及额度均大幅增长。据公开资料统计,2013-2021年,主打数据分析场景的数据库企业成立数量为11家,占总数据库企业总成立数量的24%,融资次数共计约40余次,融资总额约近50亿元人民币。竞争激烈的市场,哪些公司具有真正潜力;当前火热的市场是否只是一场泡沫;“智能湖仓”阶段后,分析型数据库又将向哪个方向发展,本报告将进行一一梳理和详细解答。
魏凯
中国信通院云计算与大数据研究所副所长