人工智能

企业落地大模型的路径、场景与案例|爱分析洞察

本次分享重点聚焦企业如何落地大模型,通过分析国产大模型市场进展和能力边界,阐述大模型在企业、科技厂商的落地现状。

2023年07月25日
  • 人工智能

7月15日,爱分析主办的大模型网络研讨会成功举行,研讨会围绕企业大模型落地的能力边界、业务场景、实现路径及成功案例展开,其中爱分析联合创始人兼首席分析师张扬、合伙人兼首席分析师李喆在会上共同进行了“中国市场大模型落地进展与趋势洞察”的主题分享。

基于近两个月超100家企业用户和厂商的调研成果,本次张扬和李喆的分享重点聚焦企业如何落地大模型,通过分析国产大模型市场进展和能力边界,阐述大模型在企业、科技厂商的落地现状,并重点分析了能源、银行、消费品零售、汽车等行业的落地案例和场景价值。

现将张扬和李喆的演讲实录整理后分享如下。

 

李喆:大家好,我是爱分析的合伙人兼首席分析师李喆。今天我们的整个主题分享会分为三部分,其中我会重点分享中国市场大模型进展与趋势,以及大模型在科技厂商落地进展,我的同事张扬会针对大模型在企业用户中的落地进展进行重点论述。

 

1.中国市场大模型进展与趋势

1.1 大模型定义

首先我们需要对大模型进行定义,目前来讲参数量级别达到十亿以上,且具备一定泛化能力的模型即可以被称为大模型,而大模型和小模型区别可以体现在多个方面。

在建模方法上,大模型核心是深度学习、自然语言处理及多模态技术,小模型则会主要用到机器学习、统计回归等技术;此外在参数量、应用场景等方面二者也有一定差异,可以参考图中所示。

我们重点聊聊在做模型训练和推理时大小模型的区别,这个跟企业用户实际应用有关。

训练层面,一方面,因为大模型已经进行了预训练,可以直接去做标注,所以目前来看大模型的冷启动成本会相对较低,小模型相比之下会偏高。另一方面,当涉及多个任务去做对齐时,大模型的成本反而会比较高,这也是小模型的其中一类优势。

在推理层面,大模型的一大问题是响应速度慢,即便是目前的GPT3.5也存在反馈速度较慢的弊端,小模型反馈则要快出很多。

 

1.2 大模型能力边界

接下来我们聊聊大模型的能力边界,我们更多是从大模型在企业内部落地的视角出发,所以按照应用类型进行区分,可以分为生成类应用、决策类应用以及多模态应用。

现阶段企业内大模型还是以生成类应用为主,但长期来看决策类应用和多模态应用是未来的主流方向。一定是有更多的未来价值。

决策类应用可以分成两个阶段,一个是辅助决策,即通过诊断问题做出归因分析并提供可行建议,另一个是智能决策,直接做出前瞻性预测和指导业务开展。现阶段受限于模型本身能力和可解释性问题,决策类应用比较受限,但我们认为未来除了少数强监管行业外,决策类应用会有很大价值。

多模态应用现阶段主要是受限于技术发展本身,我们非常看好未来应用场景。因为企业内部真正应用场景中除了纯文本之外,其实还是有大量的图像、视频等数据,真实业务场景一定是几者结合。这些图片的数据怎样跟文本场景结合并且打通,这个非常依赖于大模型多模态技术的发展。

 

1.3 国产通用大模型和行业/领域大模型的市场机会

 

接下来我们聊聊目前大模型市场情况。我们按照完整大模型产业链对市场进行了划分,从基础设施的云平台,到模型层的不同类型模型,再到中间层的应用开发工具,最后是应用层的各类服务。

通过与海外大模型市场对比,我们能看到国内外的一些差异。在中国,处于模型层的厂商数量相对较多,但海外则将视野重点聚焦在中间层的部分。从现状而言,国内市场的发力点主要集中在模型层和应用层,应用层很好理解,但模型层未来是否存在市场机会?

从长期来看我们实则非常看好国内市场在模型层的应用,主要可以概括为以下几点:

第一,市场的国产化诉求比较强烈。一些大型央企业和银行第内部其实对于员工使用ChatGPT用于办公和生产场景存在明确限制,至少5家银行在1年内有明确采购国产大模型服务的计划。

 第二,集团层面进行大模型能力建设。以央国企等集团型企业为例,有自上而下的明确购买或自研通用大模型的需求。

第三,数据安全角度要求进行本地部署。对于大企业来说,一方面在模型推理时需要做到本地部署,而且在前期做模型训练或者指令微调时,大量企业内部的数据集也无法对外。

基于以上三点我们认为中国的通用大模型是一定会出现的。
 

除了通用大模型,我们认为行业/领域大模型同样存在很大市场机会。

第一,监管层面,尽管本周刚刚发布了《生成式人工智能服务管理暂行办法》,但受限于意识形态等问题,我们判断大模型在C端的应用短期内不会放开,当下还是集中在B端应用。

第二,数据安全层面,企业用户并不会把数据开放,因此,特定场景的SFT数据获取有着较高的难度,特别是对于通用大模型而言。

第三,中国市场发展现状,国外是OpenAI的出现将门槛拉到很高的高度,因此,大部分厂商都是基于OpenAI来开发应用,而国内市场是通用大模型和行业/领域大模型同步发展,通用大模型能力不足给了行业/领域大模型机会。