摘要:七炅整合多方面数据源,为车险业务提供大数据风险评估和定价服务

从大数据风险定价出发,七炅要服务保险全产业链 | 爱分析访谈-ifenxi

调研 | 张扬 卢施宇

撰写 | 卢施宇

2015年6月,保监会开始试点商车费改,保险公司慢慢被赋予自主定价权。不到三年的时间里,费改已经走到了第三轮,各财险公司以监管底价销售加高额渠道佣金抢占市场的方式在未来将难以持续。

这一趋势对于保险公司风险定价能力及成本控制能力提出了更高的要求,保险公司在“苦练内功”的同时,求助于外部大数据公司的力量。七炅信息科技选择从核保定价环节切入,为保险公司提供基于大数据的风控服务。

整合多方数据,七炅输出核保风控服务

与美国、德国等车辆信息化程度较高的国家相比,中国车险行业数据开放程度低、数据源分散。为了做出对保险公司有实际价值的模型,将多方采集的人、车、环境数据进行整合势在必行。

七炅除了与保险公司方面建立合作,外部合作的数据渠道包括政府管理部门、互金公司、征信公司及GPS运营商等,同时也有自己强大的爬虫能力从互联网抓取相关数据。

目前七炅提供的服务针对车险核保,包括风险评级、纯风险损失预测以及定价三个环节,七炅的服务可以实现对三个环节的完全覆盖。

车险分,需要综合多维度的外部数据,包括车主信用评分、车辆行驶数据等。为了保证合作方场景外使用数据的合规性,七炅并不直接调取原始数据,而是与合作方建模输出某一维度的评分。综合不同维度的评分,赋权后形成车辆风险分。

车辆风险分DeltaMotion以DaaS(Data as a Service)形式输出,供保险公司在核保环节查询,收费按照API调取量。

纯风险损失,指的是保险公司基于内外部数据,通过模型预测客户出险概率及赔付金额。在预测的基础上,保险公司在折扣率、渠道费率等监管条件限制下,进行渠道费用分配和定价,制定销售规则。

针对核保的风险定价,七炅开发了整套模型。七炅与保险公司通过咨询方式联合建模,结合双方数据预测风险损失,寻找最优定价方案。这套系统还能够提供业务诊断功能,判断核保政策和精算模型效果,规划公司经营目标 。

七炅提供基于SaaS服务的DeltaVision定价软件,但某些保险公司出于对数据安全的顾虑,定价系统会要求进行私有化部署。通过积累反馈数据对模型进行更新,逐步加深场景理解,可改进车险分模型的设计并实现风险定价系统的产品标准化。

七炅利用网络爬虫技术和与各渠道的合作,获取各保险公司报价数据,帮助其分析自身定价(折扣和费用)策略的优劣势,并补充不同维度的数据,基于保险的大数法则,帮助保险公司创造差异化优势,避免保险公司之间的恶性价格竞争。

从大数据风险定价出发,七炅要服务保险全产业链 | 爱分析访谈-ifenxi

已输出货运车辆车险分服务,风险定价系统预计年内将落地

截至当前,七炅的车险评分系统已经与多家财险公司落地合作,通过DaaS的方式提供查询服务,按照API调取量收费。风险定价系统与理赔反欺诈模型正在与多家保险公司商谈合作落地。

相对于私家车,货运车辆的风险系数更高,保险公司对于风控的需求更高,因此七炅首先上线货运车辆。目前系统已上线400万辆货运车辆,七炅的数据已覆盖全国30%的货运车辆及80%的私家车。

七炅CEO杨明锋透露,七炅2018年计划为6家财险公司提升风险定价能力,并落地超过1亿辆私家车风险评分,实现100万货运车辆查询出单。

未来七炅利用数据和模型优势,有能力从车险销售、核保 以及理赔反欺诈三个环节出发,覆盖更多业务流程,如精准营销、车辆维保等环节,形成全产业链的闭环。此外,基于个人相关数据,七炅也可能从车险服务延伸到意外险、健康险等其它保险领域。

从大数据风险定价出发,七炅要服务保险全产业链 | 爱分析访谈-ifenxi

近期,爱分析对七炅信息科技创始人、CEO杨明锋博士进行了访谈,杨明锋曾任美国KPMG和Deloitte大数据部门负责人,曾为美国政府部门设计反恐情报收集系统,为诸多世界500强企业提供数据科学的战略咨询和应用,其设计和搭建的基于机器学习和人工智能算法的自动营销系统获得美国专利。

访谈中杨明锋就国内车险大数据行业发展及七炅的业务、战略进行了阐述,摘选部分内容分享如下。

从核保核赔环节切入车险行业,未来业务覆盖车险全产业链

爱分析:七炅为保险公司提供哪些服务?

杨明锋:目前主要专注于车险核保,七炅提供覆盖每个环节的产品和服务。保险公司在获取客户信息后需要做三件事:

第一,收集跟车辆、车主相关的外部数据,这些数据与核保风控相关但为保险公司所缺少,数据来源包括中保信、蚂蚁金服、精友等第三方。在这一步,七炅采集不同来源和类型的数据,加工成保险行业可用的数据变量,并为保险公司提供车辆风险评估。

第二,纯风险损失预测。当保险公司完成外部数据搜集后,需要将数据整合预测赔付概率及赔付金额。七炅可以结合保险公司数据与自有数据,通过机器学习算法进行预测。

第三,定价。保险公司完成风险损失的预测后,需要进行定价。车险定价要结合折扣率、渠道费率等监管政策,也要考虑到公司内部对各个渠道费率、分支机构的经营目标的管控等。

七炅开发了一套数据分析软件工具,基于这些限定条件找到最优定价方案,为保险公司实现风险管控、完成业务目标。

此外,由于我们是通过大数据的定价,清楚客户的风险偏好,未来可以在互联网营销环节帮助保险公司定向获客。

爱分析:目前行业内还有哪些公司是从核保核赔环节切入的?

杨明锋:有一些咨询公司会帮保险公司做保险风险定价解决方案,但是他们通常没有能力和意愿进行大数据分析和软件开发,没法帮保险公司补充关键的外部数据资源,因此他们没法帮助保险公司做到差异化竞争,而七炅可以让每家公司在风险定价上都有独特的竞争力。

爱分析:车险分的核心用途在哪方面?

杨明锋: 主要在核保环节,它是判断高低风险的基础,以便保险公司结合风险进行相应的差别定价。

爱分析:七炅为什么先上线货车的风险评分?

杨明锋:目前私家车的车险价格虚高,所以保险公司目前倾向于最低折扣销售,但货车领域的赔付成本很高,占比接近保费的75-80%, 因此保险公司对于货车的风险评价是刚需。

爱分析:货运车辆的人车的匹配是如何实现的?

杨明锋:对货车目前我们不进行匹配,一辆货车的驾驶员变化可能很频繁,另外不管驾驶员是谁,最后都会反映在车的行为上面,因此不妨碍做出足够可靠的风险判断。私家车去匹配驾驶员的可能性就高很多,因为私家车驾驶人员相对固定 。

爱分析:保险行业为什么之前一直没有风险评分,而在这个时间点出现?

杨明锋:因为之前没有需求。从前中国车险行业的定价取决于监管政策,各家保险公司没有自主定价权。过去几年保监会进行费率改革,开始赋予各保险公司自主定价权。但因为国内车险业务成本在监管允许底线之下,所以大家都偏向于按照监管底线的折扣定价。

七炅选择这样的时间点,是因为我们预计未来1-2年之内,费改政策会进一步放宽,使得车险的成本高于监管的底线,依据风险进行区分定价就会成为必须,否则低风险的好业务就会流失 。那时保险公司对于风险评估与精准定价就会有很大的需求了。

这两年车险销售费用竞争得很厉害,跟费改其实也是相关的。保险公司希望在费改放开之前抢占市场。短期之内这还会是主流趋势,但费改放开以后就可以直接给消费者打折而不需要靠给中介佣金费用。这次商车费改之后,陕西、广西和青海这三个省的定价会市场化,我们预计在今、明两年这三个省的销售费率会迅速下降到合理的程度。

爱分析:七炅会涉及销售、维保在内的全产业链吗?

杨明锋:我们会完成全链条闭环服务。基于大数据的风险定价在营销上有天然的优势,因为在定价环节就会知道保险公司的风险偏好,再加上我们了解客户的风险情况,在吸引流量上就可以做得非常有针对性。维保和保险类似,也需要可靠的风控和定价手段,但不需要保险牌照,不排除在适当的时机推出产品的可能性。

爱分析:从UBI切入市场的公司与七炅存在正面竞争吗?

杨明锋:这是两个不同的市场。七炅提供面向B端的服务,而UBI是车险的细分险种,是面向C端的产品,但像美国推行UBI很多年了,它占的总体市场份额也不超过5%。此外,UBI车险也一样需要我们的数据服务来进行更精准的风险评估。

爱分析:七炅的业务会从车险延伸到健康险吗?

杨明锋:会,因为基于人的数据是相通的。我们希望把健康险产品设计得更简单,同时把它做得更实惠。现在保险产品很复杂,导致消费者难以理解而不易销售,所以中介渠道会占很多销售费用,这又导致保险产品不够实惠。

所以我们希望通过技术能力,把保险产品设计得更简单,更易于理解而变得容易销售。再通过技术手段把欺诈可能性降低,进一步让保险变得实惠。

为保险公司补充外部数据

爱分析:七炅的模型中使用哪些数据?

杨明锋:一部分是保险公司的数据,还有与各个行业、政府机构等整合起来的数据,包括人的数据,车的动态与静态数据,关于环境的数据等。

爱分析:包括哪些第三方数据源?

杨明锋:人的数据主要来源于互联网公司,比如各类互金公司及征信公司,我们能帮助这些公司沉淀下来的数据在保险行业寻找新的变现出口。这些公司提供车险用户转化过程中需要的数据,我们将这些数据整合到我们的数据模型中。

在车的数据方面,主要合作方是GPS运营商。

爱分析:货车领域有哪些比较好的外部数据源呢?

杨明锋:货车与私家车的数据源是类似的,但更加强调物流行业的公司。比如GPS的运营商,因为国家监管要求8吨以上的营运货车都必须安装GPS装置,所以运营商会沉淀很多车辆行驶数据。

爱分析:如何保证数据在合作伙伴场景外使用的合规性?

杨明锋:买保险的时候客户会授权保险公司查询自身相关的信息,在源头上拿到了授权。

我们在过程中不使用原始数据,而是通过我们的模型在合作方那里先计算出一个结果,再整合过来应用。所以用户的行为数据、个人隐私数据等并不会在我们的平台上流通。

例如我们与蚂蚁金服的合作,并不是按字段调取数据,而是输出我们合作的车险分。保险公司可以直接调用,然后融合在模型里。

其他的数据方也是类似的,最后把多个维度的分结合在一起打出综合分。

爱分析:理赔反欺诈模型中Y轴的数据是什么?

杨明锋:反欺诈模型不一定需要Y轴数据。我们使用的方法属于无监督学习,就不需要Y轴数据,只需要找异常就可以了。我们提示保险公司哪些可能是高风险的理赔案件,保险公司线下去解决。

爱分析:车险分模型设计是否需要保险公司数据?

杨明锋:在模型开发训练阶段需要保险公司数据,这个阶段可以保险公司内部完成也可以在我们的环境中完成,部署之后就不需要保险公司实时更新的赔付数据。

爱分析:要求保险公司开放赔付数据的难度大吗?会有附加条件吗?

杨明锋:不一定,外行的人去谈很难,我们去谈就会比较容易,因为我们从2013年开始就服务过“人太平”老三家(人保财险、太保财险、平安财险)及多家其它保险公司,在行业内积累了声誉。

中国的车险风险定价系统现在演化到第三代。第一代是完全基于监管政策。第二代基于保险公司的数据,目前市面上大多数第二代风险定价系统都是我们核心团队在创业前做的。现在费改在催生第三代风险定价系统的需求,因为我们帮保险公司做过第二代系统积累了信任,也能够采集到保险公司缺少的数据,所以他们愿意在一定的条件下提供赔付数据给我们。

爱分析:获取的外部数据源需要多长时间?

杨明锋:这个不能一概而论,不同公司的差异很大。有的公司本身提供数据服务,就很好谈,其它要看双方的价值点所在。我们积累和使用数据就像滚雪球,有核心的数据能做出及格产品之后,就快速迭代,不停提升产品效果。

爱分析:在数据源方面,七炅的长期竞争壁垒是什么?

杨明锋:我们的竞争壁垒是全链条的。从数据源来说,七炅采取开放的心态跟各家合作。

想要切入这一领域的竞争对手,既要非常懂保险,又要非常懂大数据。即使有了数据源,想要做出对保险行业有用的模型也要摸索一段时间。

爱分析:为保险公司部署模型需要多久?

杨明锋:我们部署模型很快,一、两个月就搭建得比较完善了,因为核心团队在这个行业中已经有了10多年的经验积累,熟悉他们的核心业务系统。

爱分析:七炅的系统是如何部署的?SaaS还是本地化的方式?

杨明锋:车险分是DaaS的模式,销售政策制定软件是混合模型,可以基于SaaS也可以将整套系统本地化部署在保险公司。

目标扩大服务规模,收取查询费用及保费分润

爱分析:七炅如何向保险公司收费?

杨明锋:车险分是按API的调取量收费,在成熟保险市场API调取费用大约占保费的1.5-2%。

我们的车险分能够让保险公司在低风险的业务上面够获得20%-30%的价格优势,还能做好风险管控,在高风险的这些业务上能增加它的鉴别能力。

营销采用销售提成加分润模式,保费进来直接有固定销售费用的提成,之后因为业务质量好,保险公司赔付成本降低,双方可以把降赔部分进行分成,这也是目前国内保险公司接受度比较高的做法。

爱分析:目前七炅服务的保险公司有多少家?车险分API调取量在什么级别?

杨明锋:我们目前跟车险行业前10的保险公司里面的5家已经建立了比较深入的合作关系。

之前我们基于一个大城市的数据完成了商业模式验证,签约了2家公司,每个月有几千次API调用。

爱分析:七炅覆盖了多少车辆数据?

杨明锋:目前货运车辆已经覆盖了全国近30%,私家车能够覆盖到全国80%以上。

爱分析:七炅的团队规模?

杨明锋:目前团队有16人,今年会继续着力打造技术团队和销售团队,我们会不断进行研发,让模型跟数据都处于行业领先地位。预期年底会到40人左右。

爱分析:2018年有哪些目标?

杨明锋:第一,扩大货车的覆盖,让更多省份的保险公司开始使用,目标实现100万出单使用我们的货车风险评分为依据;第二,覆盖2亿辆私家车的风险评分;第三,把我们的第三代风险定价系统推给行业内革新意识比较强的保险公司,落地6家;第四,打造销售团队,实现营收目标4,000万元。