解决方案
研究内容
行业动态
参与征集
会议
关于我们
数据智能
2022年中国湖仓一体平台市场研究报告|爱分析报告
湖仓一体架构能实现数据资产统一管理、降低数据冗余、降低大数据平台架构运维复杂性,将成为大数据平台的主流架构。
2023年06月20日
数据智能
摘要
为适应数据应用需求,大数据平台架构持续演进,历经数据仓库、数据湖两个阶段。2020年,湖仓一体概念提出,湖仓一体架构因能实现数据资产统一管理、降低数据冗余、降低大数据平台架构运维复杂性,将成为大数据平台的主流架构。
根据爱分析调研,2022年中国湖仓一体平台软件市场规模15.2亿元。其中,科杰科技市场份额占比11.1%,华为云占比9.5%,星环科技占比7.3%。爱分析预测,2025年,中国湖仓一体平台软件市场规模将达近100亿元,2022-2025年三年复合增长率为86%。
图表1:湖仓一体平台软件市场规模及增速
(数据来源:市场调研、爱分析测算)
图表2:2022年湖仓一体平台软件市场份额占比
(数据来源:市场调研、企业年报)
湖仓融合作为湖仓一体的先进架构,在ACID事务性、存算分离、批流一体、元数据统一管理等方面具有明显优势,未来将成为湖仓一体架构实现的主流技术。
要在竞争激烈的湖仓一体市场取得成功,厂商应当重点关注云原生、湖仓融合、Data Fabric、DataOps等能力的构建,以上能力将构成湖仓一体平台软件的技术壁垒。
在布局上,需重点布局金融业,同时关注工业、交通等潜力行业。
01
湖仓一体架构介绍
1.1 大数据平台架构进入湖仓一体时代
随着数据量级持续扩展,数据类型多元化,以及数字化转型深入企业数据应用场景变得日益复杂,业务对于数据实时性的要求需要企业兼具批处理、流处理能力;复杂的业务类型又需要企业同时具备描述性分析、预测性分析、诊断决策性分析以及探索性分析等能力。相较数据仓库、数据湖,湖仓一体更能完全满足数字化转型企业对大数据平台的各种需求。这也预示着大数据平台架构历经数据仓库、数据湖两个阶段后,正式进入湖仓一体新时代。
图表3:大数据架构演进驱动因素
1)企业数据分析需求推动数据仓库出现
20世纪90年代,为满足企业敏捷数据分析需求,基于联机分析处理(OLAP)的数据仓库概念开始出现并迅速发展。数据仓库能解决分散数据源的集成、分析问题并作为第一代数据分析平台开始被大范围使用。
图表4:数据仓库示意图
2)海量异构数据的分析需求促使大数据平台进入数据湖阶段
21世纪互联网时代,社交媒体、搜索引擎等新应用层出不穷,为数据应用场景带来剧烈变化,数据体量从GB级提升至TB和PB级,原有大数据平台架构的可扩展性远远无法满足计算需求。同时文本、图像、语音等非结构化数据量急剧增长,异构数据低成本存储对大数据平台提出了新的挑战。数据湖以极低成本实现任意格式数据的统一存储、管理和分析,尤其适用于数据挖掘、预测、推荐等高级分析场景等优势开始被广泛应用。
图表5:数据湖示意图
立即登录,查看报告完整内容
材料提交