企业落地大模型的路径、场景与案例

7月15日，爱分析主办的大模型网络研讨会成功举行，研讨会围绕企业大模型落地的能力边界、业务场景、实现路径及成功案例展开，其中爱分析联合创始人兼首席分析师张扬、合伙人兼首席分析师李喆在会上共同进行了“中国市场大模型落地进展与趋势洞察”的主题分享。

基于近两个月超100家企业用户和厂商的调研成果，本次张扬和李喆的分享重点聚焦企业如何落地大模型，通过分析国产大模型市场进展和能力边界，阐述大模型在企业、科技厂商的落地现状，并重点分析了能源、银行、消费品零售、汽车等行业的落地案例和场景价值。

现将张扬和李喆的演讲实录整理后分享如下。

李喆：大家好，我是爱分析的合伙人兼首席分析师李喆。今天我们的整个主题分享会分为三部分，其中我会重点分享中国市场大模型进展与趋势，以及大模型在科技厂商落地进展，我的同事张扬会针对大模型在企业用户中的落地进展进行重点论述。

首先我们需要对大模型进行定义，目前来讲参数量级别达到十亿以上，且具备一定泛化能力的模型即可以被称为大模型，而大模型和小模型区别可以体现在多个方面。

在建模方法上，大模型核心是深度学习、自然语言处理及多模态技术，小模型则会主要用到机器学习、统计回归等技术；此外在参数量、应用场景等方面二者也有一定差异，可以参考图中所示。

我们重点聊聊在做模型训练和推理时大小模型的区别，这个跟企业用户实际应用有关。

训练层面，一方面，因为大模型已经进行了预训练，可以直接去做标注，所以目前来看大模型的冷启动成本会相对较低，小模型相比之下会偏高。另一方面，当涉及多个任务去做对齐时，大模型的成本反而会比较高，这也是小模型的其中一类优势。

在推理层面，大模型的一大问题是响应速度慢，即便是目前的GPT3.5也存在反馈速度较慢的弊端，小模型反馈则要快出很多。

接下来我们聊聊大模型的能力边界，我们更多是从大模型在企业内部落地的视角出发，所以按照应用类型进行区分，可以分为生成类应用、决策类应用以及多模态应用。

现阶段企业内大模型还是以生成类应用为主，但长期来看决策类应用和多模态应用是未来的主流方向。一定是有更多的未来价值。

决策类应用可以分成两个阶段，一个是辅助决策，即通过诊断问题做出归因分析并提供可行建议，另一个是智能决策，直接做出前瞻性预测和指导业务开展。现阶段受限于模型本身能力和可解释性问题，决策类应用比较受限，但我们认为未来除了少数强监管行业外，决策类应用会有很大价值。

多模态应用现阶段主要是受限于技术发展本身，我们非常看好未来应用场景。因为企业内部真正应用场景中除了纯文本之外，其实还是有大量的图像、视频等数据，真实业务场景一定是几者结合。这些图片的数据怎样跟文本场景结合并且打通，这个非常依赖于大模型多模态技术的发展。

接下来我们聊聊目前大模型市场情况。我们按照完整大模型产业链对市场进行了划分，从基础设施的云平台，到模型层的不同类型模型，再到中间层的应用开发工具，最后是应用层的各类服务。

通过与海外大模型市场对比，我们能看到国内外的一些差异。在中国，处于模型层的厂商数量相对较多，但海外则将视野重点聚焦在中间层的部分。从现状而言，国内市场的发力点主要集中在模型层和应用层，应用层很好理解，但模型层未来是否存在市场机会？

从长期来看我们实则非常看好国内市场在模型层的应用，主要可以概括为以下几点：

第一，市场的国产化诉求比较强烈。一些大型央企业和银行第内部其实对于员工使用ChatGPT用于办公和生产场景存在明确限制，至少5家银行在1年内有明确采购国产大模型服务的计划。

第二，集团层面进行大模型能力建设。以央国企等集团型企业为例，有自上而下的明确购买或自研通用大模型的需求。

第三，数据安全角度要求进行本地部署。对于大企业来说，一方面在模型推理时需要做到本地部署，而且在前期做模型训练或者指令微调时，大量企业内部的数据集也无法对外。

基于以上三点我们认为中国的通用大模型是一定会出现的。

除了通用大模型，我们认为行业/领域大模型同样存在很大市场机会。

第一，监管层面，尽管本周刚刚发布了《生成式人工智能服务管理暂行办法》，但受限于意识形态等问题，我们判断大模型在C端的应用短期内不会放开，当下还是集中在B端应用。

第二，数据安全层面，企业用户并不会把数据开放，因此，特定场景的SFT数据获取有着较高的难度，特别是对于通用大模型而言。

第三，中国市场发展现状，国外是OpenAI的出现将门槛拉到很高的高度，因此，大部分厂商都是基于OpenAI来开发应用，而国内市场是通用大模型和行业/领域大模型同步发展，通用大模型能力不足给了行业/领域大模型机会。

企业落地大模型的路径、场景与案例｜爱分析洞察