金融

智能撰写中台落地投研业务,实现30+应用场景扩展

大多数的金融业务流程,是基于文档完成价值跟信息的传递。同一个业务流程上,推进多个金融文档自动生成的过程,其本质是推动完成该金融业务数字化的过程。

2023年10月26日
大多数的金融业务流程,是基于文档完成价值跟信息的传递。同一个业务流程上,推进多个金融文档自动生成的过程,其本质是推动完成该金融业务数字化的过程。
  • 金融

导读

大多数的金融业务流程,是基于文档完成价值跟信息的传递。同一个业务流程上,推进多个金融文档自动生成的过程,其本质是推动完成该金融业务数字化的过程。今天将从以下三个部分,分享智能撰写中台的价值和实现路径:

1. 数字化与文档智能生成有什么关系
2. 构建符合业务需要的智能撰写中台
3. 应用案例的实践分享
分享专家:彭傲立 予信科技创始人、董事长
李棣 予信科技副总经理&首席金融科技咨询顾问
* 内容已做精简,如获取专家完整版视频实录和课件,请扫码领取:

01 数字化与文档智能生成的关系

首先给出第一个结论:金融文档自动生成的实质,其实是金融业务的数字化。
这个结论可以分为两个维度来阐述。第一是金融文档的撰写过程拆解,第二是典型的金融业务流程拆解。
1.1 金融文档的撰写过程拆解
上图中右侧有6个序号,是金融文档由专业人士完成撰写的典型步骤。
以一份招股书为例,无论写哪个章节,投行人首先需要根据该章节待撰写的内容去准备好数据,数据通常来自于发行人提供的资料(底稿),或者是某些网站,例如裁判文书网,或者第三方的数据源,例如万得、聚源、天眼查、企查查等等。获取到数据后,还有一个去伪存真的过程,甚至有些数据的获取需要满足合规性要求的规定动作,那上述的场景对应前两步数据收集和数据筛选。
其次,获取数据后是不是直接填数就可以了?肯定不是,事实上第三、四步的处理才是整个流程点石成金的部分,也是投行业务体现专业性的部分。
还是以投行的IPO招股书撰写为例,投行人员要按照外部的监管要求、内部质控的要求、遵循IPO相关的法律法规、规章制度,再对所获得的原始数据进行加工。这就是业务分析跟合规性分析。
我有做过简单的统计,截至目前投行领域相关的法规,部门规章制度就有576部,合计400多万字,所以整个的规则框架是比较复杂的。像其他的,比如资管、经纪、银行的信贷,它虽然没有投行那么复杂的业务规则框架,但重点在于每个业务板块的规则框架都是不一样的。
最后,基于数据分析的结果,业务人员会补充主观的结论或者描述性的语句再成文。基本上所有的金融文档撰写步骤都是类似的,从实践上来看,这六步在金融领域是通用的,无非是所需的数据不一样,和加工数据的规则不一样而已。
1.2 典型的金融业务流程拆解
日常展业的流程包括:业务机会获取-业务推进流程-业务审核流程-披露报送流程,举个例子,在投行的场景下,业务流程就是承揽、承做、审核、报送,如果是换到银行信贷场景,对应的就是获客尽调、信贷分析、送审、批额度,其中每个环节都是以文档为单位进行信息的传递。
金融业务流程其实就是金融文档的生成和传递的流程,基于文档去完成价值跟信息的传递。同一个业务流程上推进多个金融文档自动生成的过程,其本质是推动完成该金融业务数字化的过程。

02

构建符合业务需要的智能撰写中台
2.1 搭建智能撰写中台的基础:合规
这里给出第二个结论:金融业务数字化的基础是确保合规性,有合规保障的降本增效才是加分,合规有漏洞的数智化应用是在让风险漏洞进一步脱离人为管控。
金融业务不变的底层核心就是合规,也是金融业务不可触碰的红线。做好文档自动生成过程中的合规性把控是最重要的,所以金融文档智能撰写,首先要解决准确合规问题,其次再去考虑如何降本增效。
以监管最为严格的证券行业举例,从2022年1月-2023年6月,券商受到监管处罚的统计中,大家可以看到高峰高发区就是投行业务、经纪业务。投行项目中的披露材料里面,披露的错误其实是经常发生的,不仅造成了不少的品牌影响,也会导致收入上的损失,个别严重的还会导致业务停滞。
投行业务在整个数字化的投入上,常年在各个业务条线里是垫底的,但受处罚比例却遥遥领先。由此看出,可以考虑把有限的投行数字化建设预算先花到确保业务合规性方面,尽可能地用数字化的手段去规范业务,再在此基础上推进降本增效的数字化建设。这种建设顺序可以降低沉没成本、重复建设出现的概率,减少资源和预算浪费。
金融文档是如何守护好合规红线的呢?几乎任意一份的金融文档,都可以划分出合规性要求高、容错率低的部分,以及容错率较高、描述性较强的部分。在实践中,无论是哪个版块,都必须帮客户去处理好文档生成过程中的合规数字化,确保容错率低的内容准确合规,这是基础。
在这基础上如果算得过来账,或者说需要加强投入的话,可以通过其他的技术手段,去处理容错率高的部分,比如嫁接各种大小模型,去生成各种各样的描述性内容,这样对于一个文档的生成,其实就可以兼顾合规性的把控与高生成率了。
2.2 智能撰写中台是什么
一篇金融文档的撰写过程,可以分为数据获取、清洗、业务规则分析,包括合规性的确认,以及最终成文。
构建一个智能撰写中台,按照同样逻辑,可以分为数据获取端和规则推理端。
数据获取端简而言之就是解决了多元异构数据沉淀为结构化数据的问题,这是解决数据的采集和处理。规则推理端主要解决结构化的数据获取以后,如何使用的问题。
整套智能撰写中台包含前台界面和配置后台的金融业务规则引擎,可以模拟金融人写材料的过程,将监管制度、法规、实操知识、风控要求融入每份文档的每个数据的处理过程当中,最终保证准确的输出,和金融文档生成的合规性管理。
对于IT部门而言,智能撰写中台可以接入大模型,也可以与常规的、常见的系统做耦合。再比如和IM进行打通,形成整套可以沉淀it资产的解决方案。
另外一方面,智能撰写中台依托于文档从不同的数据源获取数据后,会在业务流转的过程中和业务人员一起完成数据准确性和和可信度的筛选、确认过程,这意味着所有经过智能撰写中台输出生成文档的结构化数据均可以沉淀为未来投行业务可以使用的可信数据,可以做到以业务为条线打破数据孤岛,构建服务于投行业务的结构化数据库。
2.3 智能撰写中台必须具备的6大能力
智能撰写中台的落地,必须具备6大能力。
前两点是专业理解力与合规把控力:智能撰写中台必须对专业级金融场景,能够提供高合规性的支持,这就包括专业理解力与合规把控力。也就是中台必须能够正确地执行专业分析,并在分析过程中做好合规把控、守好合规红线,它能够为各个业务条线担好守门员的角色,先大幅削减人为错漏导致的项目质量问题,再从技术的角度让系统生成的内容准确、可行,从这两点入手实现数字化过程的业务合规性保障。
第三点是高响应能力:因为金融监规则体系是动态的,比如监管法规更新了,公司内部的质控、风控要求也会更新,这就需要业务中台能够对这些更新,做出及时响应,这是从业务本质出发所决定,必须具备敏捷的响应能力。
第四点是规模化能力:通过一种通用平台的构建,能够一定程度上规避重复性建设的问题。予信智能撰写中台其实有几大价值,第一是赋能不同的部门,要能够做到较低成本、快速响应来自各个部门不同业务板块的个性化专业需求,这其实是不容易的。不同部门专业需求的响应有赖于智能撰写中台供应商对不同业务都能理解、解析、构建出符合业务部门需求的模板;第二是需求的快速响应则是业务部门的必然要求,在瞬息万变、动态更新频繁的金融领域,尤其是来自于监管的更新,智能撰写中台需要做到快速响应;最后,一套可以服务于券商各个部门的智能撰写中台能有效避免各个部门的重复性建设、摊薄运维成本,利于推动券商整体IT资产化。
最后两点系统耦合力和大模型整合力:其实是指IT资产的沉淀能力,作为中台需要与现有的主流系统进行整合,同时满足新时代提出的新要求,需要与大模型进行整合。

03

案例的实践分享
第一个案例是在投行业务场景。
基于投行业务的业务特点本身来讲,传统的投行作业基本是以线下的、纸质的、非结构化的数据形态存在,而且发行人的数据很难形成闭环。经常在承揽、申报、甚至发行存续期管理的时候,数据都是脱节的。整个投行业务开始做数字化后,首先要解决源头的数据问题,从源头获取更多的结构化信息。
比如金融机构的内部系统、第三方数据源、外部网站,以及通过自建的OCR或NLP自然语言处理等技术解析获取的数据,都可以为整个投行业务的全流程所用。除此之外,当向企业发起第一步尽调的时候,可根据股类业务、债券业务尽职调查的要求解构,形成线上化的发行人(企业)信息采集,也就可在源头获取到结构化的数据,这样的数据可以直接进入到后续的整个业务流程中形成数据流通。这样根据不同的业务场景要求来做线上的信息采集,其本质在投行业务场景里,是一种标准化尽调的处理。
其次,数据就位后,如何来使用呢?业务规则怎么能够跟数据很好的结合?答案是撰写中台可以发挥作用,以文本为载体,把文本中的每个知识点、每个规则点都解构成数据层面上的一个因子。通过后台因子库,封装了业务层面的规则,并且把它跟数据库底层的数据建立了联系。
所以关键点在于源头数据的处理(包含应运而生的底稿处理)、以及以文本为载体而实现的规则的封装及业务全流程的数据沉淀,这使得上层的业务流建设和底层的数据流建设,成为一体两面的机制同时在运行和推进。
客户在实际落地中,也是遵循了这一套投行业务数字化的建设流程。实际运行8个月的时间内,可以看到两方面的明显效果。
第一是对业务部门,甚至包括对质控部门的提效。无论是从源头规范数据的获取、还是规范信披的要求等方面都能提升效率,对整体文档撰写的质量也大有提升。第二是从数据建设的层面,沉淀了数据因子数量超过5000个,扩展文本的应用场景超过100个。无论对于建设部门还是业务部门,都是比较直观可观的一个效果。
第二个案例是在投研业务场景。
在财富管理业务中,以投资顾问为例,在面向客户服务过程中,和投行业务不同,可能面向的场景,没有较强的信息披露的要求,而是需要面对很多类型的客户,提供非常多样化、丰富的客户服务能力,来进行获客。
案例中的这家机构已经拥有非常成熟的数据中台的建设,在这种背景下,搭建千人千面的客户服务有两个非常重要的要点。
一是面向客户,服务需要具备丰富性。例如经常需要给客户发送很多的材料,可能是word文档、纯文字的,有时也会是PPT、PDF的,有的有非常丰富的色彩,有的是很多图表,所呈现的要素是非常多元的。利用智能撰写中台的灵活扩展性,就能够去输出非常多样化的内容形式,可以生成PPT、图表、html甚至图片等各类服务素材。
二是如何能够面向不同的客户,实现个性化的服务。客户类型维度较多,有不同的风险偏好,因此面向不同的客户,所提供的服务建议和发送的素材都要有所区分。利用智能撰写中台的能力建设,就可灵活地针对不同的规则,做可视化的配置,能够把常见的业务规则、常识逻辑,以及业态的knowhow,都可以通过配置化的方式,在后台快速地实现,从而在前台快速地面向不同类型客户输出。
而且该机构服务上述场景的数据建设也有一个特点,就是这些场景下需要向数据中台调用的数据其实是通过具体的使用场景,向数据中台去申请,然后数据中台会把相应的数据提供给到对应场景的业务库,比如说经纪线、资管线或者是托管线,同时在业务场景实际使用的过程当中,也可以把数据存储沉淀起来,反写回数据中台。
从案例建设效果来看,面向业务部门提效的角度,文档的生成率基本达到了70%以上,大大提升了工作效率。面向公司整体,从数据建设的角度来看,上线4个月沉淀的数据因子就超过了1000个,扩展业务的文本应用场景超过了30个。总体而言,这种公司层级的撰写中台覆盖的场景非常丰富,经纪业务条线中,像投资顾问、信用交易,还有其他条线如资管、托管、风控等等场景,都可以通过上述的能力建设,快速得到实际的应用。
以上就是本次的分享内容。