7月15日,爱分析主办的大模型网络研讨会成功举行,研讨会围绕企业大模型落地的能力边界、业务场景、实现路径及成功案例展开,其中爱分析联合创始人兼首席分析师张扬、合伙人兼首席分析师李喆在会上共同进行了“中国市场大模型落地进展与趋势洞察”的主题分享。
基于近两个月超100家企业用户和厂商的调研成果,本次张扬和李喆的分享重点聚焦企业如何落地大模型,通过分析国产大模型市场进展和能力边界,阐述大模型在企业、科技厂商的落地现状,并重点分析了能源、银行、消费品零售、汽车等行业的落地案例和场景价值。
现将张扬和李喆的演讲实录整理后分享如下。
李喆:大家好,我是爱分析的合伙人兼首席分析师李喆。今天我们的整个主题分享会分为三部分,其中我会重点分享中国市场大模型进展与趋势,以及大模型在科技厂商落地进展,我的同事张扬会针对大模型在企业用户中的落地进展进行重点论述。
首先我们需要对大模型进行定义,目前来讲参数量级别达到十亿以上,且具备一定泛化能力的模型即可以被称为大模型,而大模型和小模型区别可以体现在多个方面。
在建模方法上,大模型核心是深度学习、自然语言处理及多模态技术,小模型则会主要用到机器学习、统计回归等技术;此外在参数量、应用场景等方面二者也有一定差异,可以参考图中所示。
我们重点聊聊在做模型训练和推理时大小模型的区别,这个跟企业用户实际应用有关。
训练层面,一方面,因为大模型已经进行了预训练,可以直接去做标注,所以目前来看大模型的冷启动成本会相对较低,小模型相比之下会偏高。另一方面,当涉及多个任务去做对齐时,大模型的成本反而会比较高,这也是小模型的其中一类优势。
在推理层面,大模型的一大问题是响应速度慢,即便是目前的GPT3.5也存在反馈速度较慢的弊端,小模型反馈则要快出很多。
接下来我们聊聊大模型的能力边界,我们更多是从大模型在企业内部落地的视角出发,所以按照应用类型进行区分,可以分为生成类应用、决策类应用以及多模态应用。
现阶段企业内大模型还是以生成类应用为主,但长期来看决策类应用和多模态应用是未来的主流方向。一定是有更多的未来价值。
决策类应用可以分成两个阶段,一个是辅助决策,即通过诊断问题做出归因分析并提供可行建议,另一个是智能决策,直接做出前瞻性预测和指导业务开展。现阶段受限于模型本身能力和可解释性问题,决策类应用比较受限,但我们认为未来除了少数强监管行业外,决策类应用会有很大价值。
多模态应用现阶段主要是受限于技术发展本身,我们非常看好未来应用场景。因为企业内部真正应用场景中除了纯文本之外,其实还是有大量的图像、视频等数据,真实业务场景一定是几者结合。这些图片的数据怎样跟文本场景结合并且打通,这个非常依赖于大模型多模态技术的发展。
接下来我们聊聊目前大模型市场情况。我们按照完整大模型产业链对市场进行了划分,从基础设施的云平台,到模型层的不同类型模型,再到中间层的应用开发工具,最后是应用层的各类服务。
通过与海外大模型市场对比,我们能看到国内外的一些差异。在中国,处于模型层的厂商数量相对较多,但海外则将视野重点聚焦在中间层的部分。从现状而言,国内市场的发力点主要集中在模型层和应用层,应用层很好理解,但模型层未来是否存在市场机会?
从长期来看我们实则非常看好国内市场在模型层的应用,主要可以概括为以下几点:
第一,市场的国产化诉求比较强烈。一些大型央企业和银行第内部其实对于员工使用ChatGPT用于办公和生产场景存在明确限制,至少5家银行在1年内有明确采购国产大模型服务的计划。
第二,集团层面进行大模型能力建设。以央国企等集团型企业为例,有自上而下的明确购买或自研通用大模型的需求。
第三,数据安全角度要求进行本地部署。对于大企业来说,一方面在模型推理时需要做到本地部署,而且在前期做模型训练或者指令微调时,大量企业内部的数据集也无法对外。
基于以上三点我们认为中国的通用大模型是一定会出现的。
除了通用大模型,我们认为行业/领域大模型同样存在很大市场机会。
第一,监管层面,尽管本周刚刚发布了《生成式人工智能服务管理暂行办法》,但受限于意识形态等问题,我们判断大模型在C端的应用短期内不会放开,当下还是集中在B端应用。
第二,数据安全层面,企业用户并不会把数据开放,因此,特定场景的SFT数据获取有着较高的难度,特别是对于通用大模型而言。
第三,中国市场发展现状,国外是OpenAI的出现将门槛拉到很高的高度,因此,大部分厂商都是基于OpenAI来开发应用,而国内市场是通用大模型和行业/领域大模型同步发展,通用大模型能力不足给了行业/领域大模型机会。