范式突破，大模型引领AI步入通用人工智能及人工智能商业化快车道

年初火爆出圈的ChatGPT，掀起了一场全球资本界、科技界甚至全民狂欢。而ChatGPT的本质，是OpenAI公司大语言模型（Large Language Model,LLM）的一种前端应用形态。凭借背后大语言模型的“智慧”，ChatGPT才能进行快速、流畅的连续对话，识别人类沟通意图，并精准回复，在效果方面超出用户预期甚至人类平均水平，还可以写代码、写小说等等。相较于ChatGPT背后的大语言模型GPT3.5，OpenAI的GPT-4作为多模态模型，不仅能够处理图像内容，且回复更可靠、更有创意，能够处理更细微的指令，在律师等专业和学术领域，完胜GPT-3.5。

图：GPT-4 和 SOTA 模型性能对比

（资料来源：东方证券研究所）

3-4月以来，国内大模型领域已进入“混战”模式，各路玩家纷纷入局。前有百度大语言模型“文心一言”首发，后有阿里云“通义千问”高调官宣上线邀测，国内AI四小龙之一的商汤科技甚至发布“日日新”大模型“套装”，公布了大语言模型“商量”、以文生图的“秒画”、数字人生成平台“如影”、3D内容生成平台“琼宇”等多个大模型。字节跳动亦不甘示弱，大力招兵买马，还邀请阿里M6大模型前带头人杨红霞加入其AI Lab。此外，据公开材料，美团联合创始人王慧文、阿里副总裁贾扬清、前字节跳动视觉技术负责人王长虎、前京东AI掌门人周伯文、前搜狗CEO 王小川、创新工场董事长兼CEO李开复、出门问问创始人李志飞、快手前MMU负责人李岩等一众互联网大佬均投身大模型赛道，大模型的创业热情可见一斑，也侧面印证了大模型对于AI发展的重要性。

具体来看，从技术架构角度，AIGC由基础层（如算力、数据集、云计算等）、基础生成算法（如Transformer、Diffusion、CLIP等）、AI预训练模型（即通用大模型）、行业大模型、前端应用构成。所谓大模型，包括通用大模型、行业大模型两层。

通用大模型（Foundation Models），是利用大算力、具有巨量参数的深度学习算法，在大规模无标注数据上进行训练，以寻找特征并发现规律，进而形成可“举一反三”的强大泛化能力，可在不进行微调或少量微调的情况下完成多场景任务，相当于完成了“通识教育”。与传统的、需要根据应用场景定制开发和训练、整个开发和应用落地过程主要依赖大量AI专业人员手动调参调优和大规模标注数据以保证模型可控性与精度的小模型相比，通用大模型由于具有自监督学习能力，不需要或只需要极少的人工介入（如RLHF人类反馈强化学习技术)即可完成训练，因此训练效率更高，适用范围更广泛，很好地解决了传统AI商业化落地的难题。但通用大模型由于体量巨大，并且对算力资源、算法模型、数据集等要求极高，训练成本十分高昂，因此通用大模型无论是国内还是国外，都主要是互联网巨头与科技巨头、大型科研机构的主场。

通用大模型虽然具有良好的泛化能力，但由于缺乏特定场景的语料和数据集的训练、模型调优，因此在特定场景下的“专业度”欠佳。各行业应用场景需要基于通用大模型，结合自己所积累的行业Know-how对大模型进行微调（Fine-Tuning)，并在此基础上结合行业化、场景化数据进行进一步训练，以提升大模型针对特定行业及应用场景的模型表现和可控性，形成行业大模型，完成“专业教育”。比如百度文心大模型所打造的国网、浦发、人民网、吉利、TCL-百度·文心等行业大模型。基于行业大模型，各行业企业即可通过API接口等方式，方便、快捷地调用、整合与自身行业更为匹配的行业大模型的底层能力，从而开发出自身的前端具体应用，比如由大语言模型驱动的、问世即封神、颠覆办公体验的Microsoft 365 Copilot。

总之，大模型通过“大规模预训练+微调”的新范式，适应多种行业应用场景需要，在应用成本与应用效果的统一、AI应用的ROI指标上相较于传统AI提供了更优解。正如英伟达CEO黄仁勋等业界巨头所讲，ChatGPT为代表的大模型的成功，预示着AI进化路径已相对清晰，规模化商用将有望爆发，基础设施已铺就，政策、需求、技术等多重因素合力助推，AIGC领域将迎来爆发式增长，将有望形成以大模型厂商为核心的生成式AI应用生态。

那么，国内大模型厂商将如何应对中美技术差距？现阶段在利用通用大模型进行调优和再训练时，还存在哪些障碍？将大模型与前端行业应用场景相结合时，有哪些潜在的路径？各行业组织在接入和应用行业大模型时主要有哪些关键考量因素？这些都是爱分析近期准备展开研究的问题。

基于以上背景，爱分析将在2023年第二季度推出的《2023爱分析·AI大模型厂商全景报告》中进行详细的介绍国内大模型市场情况，围绕大模型落地的重点业务场景，对优秀厂商展开评估，为企业的大模型厂商选型提供参考。

参与方式

《2023爱分析·AI大模型厂商全景报告》评选征集活动现已开始，欢迎扫描下方二维码，参与征集活动。

征集截止日期：2023年5月30日

参与要求

厂商全景报告重点研究范围：

入选厂商评选标准：

本研究将从三个维度确定特定市场的入选厂商，包括：

产品是否符合本研究中特定市场的厂商能力要求；
最近一年在特定市场服务过的客户数量/在特定市场累计服务过的客户数量；
最近一年在特定市场的收入规模/在特定市场的累计收入规模。

（不同市场对客户数量和收入规模的要求会有差异，具体可咨询爱分析工作人员。）

厂商类型：

上市、非上市公司均可，包含大模型领域的初创公司、互联网、科技公司等。

入选厂商评选要求：

入选厂商需要具备大模型解决方案或产品，能够满足本次研究特定市场的要求；
入选厂商需能够接受爱分析调研了解厂商的业务、产品、服务、客户等相关情况。

参与价值

参与本次厂商全景报告征集的厂商，将有机会：

入围《2023爱分析·AI大模型厂商全景报告》，提升厂商品牌知名度和行业影响力；
将有机会受邀参加爱分析在AIGC及大模型领域的线上、线下活动，与企业、投资机构等进行深度交流；
报告将定向分发1000+企事业单位及政府机构、100+投资机构，将迅速获取市场关注；
报告将在爱分析官方及相关媒体宣传，至少30+媒体矩阵传播，各合作伙伴联合宣发。

参选流程

1. 征集阶段：征集采取定邀和自主报名，爱分析AIGC项目组将在报名两天内联系报名厂商，沟通相关细节；

2. 初审阶段：各参选厂商初筛通过，项目组将通知参选报告详细流程，并由参选厂商自主提报初审材料；

3. 调研阶段：根据项目调研需求，安排厂商与AIGC及大模型领域相关专家进行深度调研访谈，验证厂商提报材料并对厂商产品、服务和能力进行评估；

4. 撰写阶段：根据实际调研成果，撰写包括厂商公司介绍、业务场景、产品与服务、典型客户等内容；

5. 报告发布：《2023爱分析·AI大模型厂商全景报告》&《2023爱分析·AI大模型应用实践报告》由爱分析官方媒体、各合作伙伴联合发布。

范式突破，大模型引领AI步入通用人工智能及人工智能商业化快车道｜厂商征集