数据智能

由浅入深,信创落地全面提速|爱分析报告

《2023爱分析・信创实践报告》正式发布!

2024年02月02日
  • 人工智能
  • 企业服务
  • 数据智能

 

01 报告综述

在国际局势日趋复杂的大背景下,中央及地方政府出台大量信创相关政策,对信创目标规划、财政补贴、人才支持、生态发展等多方面均做出了明确规定。加快信创产业发展,打造全面自主可控的国产IT架构,已成为我国实现高水平科技自立自强、保障国家安全、推动经济社会数字化转型的重要抓手。

同时,供需两端合力驱动信创在“2+8+N”行业加速落地。多年以来,国内IT行业及数字经济发展所需的基础设施一直被国际巨头所垄断,存在诸多的潜在安全风险,实现核心技术自主可控已经迫在眉睫。而国内厂商的技术能力持续突破,信创产品正在从“要用”向“能用”的跨越,支撑起各行业的常态化采购。

基于上述背景,当前我国信创产业部分领域已经由“试点验证”迈向“规模推广”阶段,各行业实践明确了从基础硬件、到基础软件、再到应用软件的纵向替换路径,以及从数字办公系统、到非核心业务系统、再到核心业务系统的横向路径。从信创替换趋势来看:

基础硬件和软件的替换需求空间最大,以数据库为代表的核心基础软件仍是信创替换的重点;

数字办公系统是央国企信创全面替换首当其冲的软件,接近替换的尾声阶段,其中文档中台作为日常办公和文档管理的基础设施,成为央国企改造的必选项;

大部分行业处于由数字办公系统逐步向智能营销等非核心业务系统替换过渡阶段;能源行业信创落地步伐较快,信创应用逐步从非核心业务系统向ERP等核心业务系统发展。

图1:企业信创替换路径及替换重点方向

  • 构筑数据管理核心安全屏障,数据库国产化替代正当时。大多数企业已经基于Oracle、DB2等国外数据库,构建了完善的数据应用体系。一方面,数据库作为数据存储和处理的核心软件,支撑上层软件应用和业务管理决策,而传统国外数据库产品难以满足高涉密行业对于数据存储安全的需求。另一方面,传统数据库缺乏弹性扩容、实时数据分析能力,已经无法应对当下数据高并发场景的压力。数据库的国产化替代,成为企业提升自主可控能力、保障数据安全的重要抓手。
  • 文档中台打造办公新体验,赋能企业高效协同办公与信息安全。文档中台对企业办公效率及安全性提升的价值显著,是央国企必须国产化的场景之一。传统文档管理面临缺乏统一管理工具、文档协同困难、文档安全风险高等问题,影响文档管理的质量和价值挖掘。文档中台能够提供办公文档查看、编辑、协作、管控等能力,助力企业大幅提升办公协同效率的同时,实现文档数据的统一存储、全方位数据资产的安全防控。
  • 高端ERP国产化替代全面开启,新一代数字核心系统助力企业经营提质增效。ERP系统作为贯穿企业各部门的核心管理系统,承载了大量核心业务数据,但国内高端ERP市场长期被SAP、Oracle等海外厂商所垄断,不仅存在数据安全性、服务稳定性的风险,而且面临传统技术架构无法灵活快速满足业务需求的问题。伴随行业信创的深入、国产厂商产品的成熟,进行ERP软件的国产化升级,将成为企业保障数据安全、实现经营提质增效的必然举措。

综上所述,本报告选择搜索型数据库、文档中台、ERP等3个重点市场进行应用实践分析,以期为企业决策层及业务部门、IT部门负责人提供信创落地实践经验,助力其更好地推进数字化转型升级。
02
搜索型数据库

2.1 经纪业务增长乏力,财富管理成券商增长新动能

搜索型数据库能对数据全文进行搜索,实现对非结构化数据的高效处理分析,是企业复用知识经验、提高经营效率的有效方式。由于国内搜索型数据库起步较晚,国内企业多采用开源软件Elasticsearch完成全文搜索。但使用Elasticsearch也为企业带来挑战和风险,如Elasticsearch开源无法保障数据安全,且对本地化中文支持能力弱、维护成本高等。信创背景下,国内搜索型数据库厂商正在崛起,使企业替换Elasticsearch成为可能。企业对国产搜索型数据库的需求具体如下:

图2 企业对搜索型数据库的核心需求与解决方案示意图

适应企业一到多个内容检索场景。企业不同场景下对搜索型数据库的功能需求不同,如员工查询公司规定流程或是对专业知识进行检索的场景,需要搜索型数据库具备全文检索功能;电商平台对销售额、用户行为、热门商品进行分析场景下,需要搜索型数据库具备聚合分析来计算总销售额、各类商品销售额、用户平均销售额等,协助电商平台优化商品推荐策略;社交媒体中或跨国媒体生成场景下,需要搜索型数据库支持多语种的全文检索和内容推荐等。

满足企业海量数据场景下的实时、高并发访问需求。与结构化数据不同,企业非结构化数据类型丰富且增长迅速,搜索型数据库需要适应企业持续丰富的数据类型和持续增长的数据体量。一方面,搜索型数据库需要满足用户对快速响应的需求,提高用户体验,如股票交易、外汇交易等场景下,需要搜索型数据库的高时效性支持实时交易决策以及监控市场波动;如用户在社交媒体中对新闻的实时检索、电商平台中消费者对商品价格、促销信息和库存的实时检索等,都需要搜索型数据库具备高时效性。另一方面,企业面向C端的内容搜索场景需要满足上千、上万甚至更多人同时在线使用,需要搜索型数据库具备高并发性。

满足企业信创需求。由于非结构化数据涉及到企业经营方方面面,信创背景下,政府、国央企和金融等行业需要将既有的开源搜索型数据库更新为国产自主研发的搜索型数据库,保障数据库安全可控。同时,国产应支持对既有数据库的平滑迁移,使企业可低成本低影响的完成替换过程。

基于以上需求,国产搜索型数据库应在分词、数据索引、排序等核心技术以及分布式数据架构等方面具备较强的能力优势。具体如下:

厂商应具备分词、数据索引、排序等技术,提高数据检索效率。用户业务场景不同,对分词算法要求不同,如中文环境下,分词算法应支持对中文文本切分,而在多语种搜索场景下,分词算法还应支持中日韩、英法德等多语种切分。针对数据索引,厂商应提供不同场景的索引类型,如针对文本全文搜索提供全文索引,支持用户进行关键词搜索、短语搜索等,针对地理位置查询提供地理空间索引。针对排序,厂商应具备单一字段排序、多字段组合排序、相关性排序、地理位置排序等多种排序算法,适应用户诸如价格排序、销售额和价格排序、文档搜索、地理搜索等不同场景。

支持分布式数据管理。厂商应具备分布式存储技术,支持海量数据存储并随着企业业务增长而弹性扩展,通过多副本机制实现数据服务高可用,支持高并发,在大量用户请求下仍能保持毫秒级查询速度。同时,厂商也应支持自动故障恢复、多租户与冷热数据分层存储等功能。此外,在数据安全保护方面,厂商应提供权限管理、加密存储等机制保障数据访问和数据存储的机密性。

自主研发,且支持国产化适配。厂商从底层分词算法到核心引擎以及上层系统都完全自研,并且支持与龙芯、海光、飞腾、鲲鹏等国产芯片以及及中标麒麟、统信 UOS 等国产操作系统的适配。同时,厂商应兼容常用的Elasticsearch读写接口,或是支持从Elasticsearch到国产搜索型数据库的平滑迁移,减少用户系统改造。

典型案例1:某国家局建设行业管理融媒体平台,打造协同高效的全媒体传播体系

当前,媒体融合已经进入深水区,中央媒体、地方媒体和行业媒体纷纷结合大数据、AI智能、云计算等互联网新技术,从内容、渠道、平台、经营、管理等多方面实践探索媒体融合发展路线。

某国家局是国务院直属事业单位,负责全国对口行业的规划、指导、监督和管理。该国家局媒体发布渠道包括该局网站、省级和市级300多个网站群、xx头条APP、中国xx报、xx杂志、微博和微信等第三方媒体号等。

传统媒体工作方式低效,难以支撑融媒体时代发声需求在传播内容和传播渠道日益丰富的