金融

一个征信老兵对互联网金融风控的感悟,专访算话征信CEO蒋庆军

那么大数据征信到底会用到什么技术, 如何盈利,市场现状和前景又如何?

2016年11月03日
撰写 | 黄峤濛
  • 蒋庆军
  • 征信
  • 算话征信
  • 金融
  • 代理人展业工具
  • 智能核保

当前国内的消费金融产业勃然而起,加上P2P行业的野蛮生长,各互联网金融平台急需征信数据来控制信用风险。 

然而,目前个人征信市场的覆盖率较低,央行征信系统中只有3.6亿人的信贷记录且维度单一,显然已经无法满足当前多元化的需求。在此背景下大数据征信生逢其时,能够利用自身的海量数据和用户信息解决覆盖率低和数据源单一的问题,为消费信贷需求的增长提供有力的支持。 

市场将爆发式增长,早已有各类巨头进场布局。目前央行下发《关于做好个人征信业务准备工作的通知》,已经批准了8家试点企业,既包括芝麻信用这样的互联网巨头,也有一些如中诚信这样的传统征信公司,但个人征信牌照仍迟迟未发。在这之后,包括京东金融、小米,及我们今天的主角 算话征信等都在央行第二批通知进行个人征信业务的准备工作的名单里。  

一时间,大数据征信站上风口。那么大数据征信到底会用到什么技术, 如何盈利,市场现状和前景又如何?

带着这些问题,我们采访了算话的CEO蒋庆军,他曾是上海资信的研发负责人,拥有数十年的行业经验。在此之前,我们先来了解下蒋庆军和他的算话。 

征信业科班出身的创始团队 

算话的创始团队主要来自于国家首家个人征信的机构,上海资信公司。上海资信成立于1999年, 目前的控股股东为央行征信中心。 

算话成立于2014年底,目前团队有60人左右,核心管理层为原上海资信几个主要业务部门的负责人,有十多年的从业经验。算话公司团队在上海资信期间经历了新中国第一个个人征信系统,即上海个人联合征信系统的建设和运营。 

CEO蒋庆军可谓是征信行业科班出身的老兵,毕业于北京大学数学学院概率统计系,曾任上海资信公司研发中心负责人,主持开发过中国第一个征信局个人信用评分模型,这个评分被在沪商业银行使用超过400多万次。 

算话一直以实现非银信贷行业的信用信息数据共享为己任。创始人蒋庆军表示,截至目前,算话已经签约了400多家非银信贷机构,而在相关行业中,不少机构在算话征信的推动下已经逐步意识到了信用信息共享的重要性。 

以下是爱分析对算话CEO蒋庆军的专访内容: 

爱分析:目前征信行业主要采用哪些技术手段,您认为各有什么样的优势和局限? 

蒋庆军:目前征信行业主要提供大数据征信、反欺诈和信用评分系统等技术手段。 

技术一:大数据征信 

大数据征信首先获取丰富的数据来源,然后才是进行数据筛选、清洗、建模,这其中会会涉及到大量的专业技术。比如在建模技术上,经常采用所谓的神经网络(Neural Network)、支持向量机(Support Vector Machine)、随机森林(Random Forest)等算法。技术架构上常常采用母子模型结构,并通过动态挑战者模型挑选和淘汰机制来优化模型。 

大数据技术的优势在于,在缺乏信贷数据时的场景中,能够使用大量其他数据进行弥补。并且在解决特定问题时的预测能力和区分效果也比较好,模型运行的自动化程度较高,更符合互联网金融的要求。 

然而,大数据技术用于征信行业也有以下的局限: 

1)大数据征信对IT运营提出了更大的挑战 

大数据技术由于需要收集、调用和计算大量不同来源的数据,对决策引擎和运营环境提出了更高的要求。首先,海量变量的快速同步计算,给模型的运行维护带来了较高的复杂度,提高了对模型开发、监控、验证、IT开发和业务应用人员的素质要求。其次,计算复杂度也导致模型开发过程和IT处理过程难度加大,对机器内存、CPU、IT运行模式提出了挑战。 

2)大数据征信模型对关键入模变量的依赖性强 

大数据评分的入模变量要比传统评分多很多,来源复杂且不稳定,一旦这些模型关键数据不能持续可得,或数据质量不能得到保障,容易导致模型区分能力下降甚至模型不能持续运行。 

3)大数据征信数据的使用未来面临监管的不确定性 

大数据模型由于使用了大量多种类型的数据,所以往往业务解释不是很明确清晰,尤其可能会使用到黑盒子的子模型,这些数据在未来面临内部验证和外部监管的约束,还可能会遇到解释的困难。

4)大数据征信模型的稳定性有待检验 

大数据领域更体现数据之间的相关性,而非因果性和业务含义。采用网购等非违约相关的大数据建立的信用风险评分模型,有可能只显示了较短期限内数据之间的相关性,不能保证在评估客户违约可能性上具有长期的区分力。 

技术二:反欺诈服务 

反欺诈云是通过对全网欺诈行为的监控、收集、分析,形成欺诈情报,并从攻击者的角度学习欺诈分子的策略、技术、流程,可以及时预警潜在的针对客户的欺诈风险。 

以算话的服务为例,反欺诈云有如下的优势: 

1. 拥有海量征信资源数据:比如公安、法院等外部征信资源数据和行业共享黑名单数据。 

2. 中文模糊匹配技术:系统基于搜索引擎进行多段式拆分降维匹配,采取地址和公司特定智能分词索引算法,加上机器学习机制完善各词段权重系数,能够随着数据量的增加而不断提高匹配准确率。 

3. 实时高效的网络关系:反欺诈网络首先能够定义88种网络关系发掘多层次多维度关系,建立动态网络关系图,从而比如实时探测计算,覆盖每笔欺诈申请,同时基于关系网络建立欺诈规则及专家评分模型,有效识别欺诈申请。 

4. 支持分布式海量计算: 版本更新上线无缝连接,服务器不间断运行,每笔申请反馈时效在1s以内。 

爱分析:目前信贷数据的全国范围内分享情况如何,怎么评判非银数据的质量? 

蒋庆军:互联网金融普遍开始使用大数据征信技术,主要原因就是信贷数据目前没有实现全国范围内的共享,即使是一些大的互联网信贷机构也只有本机构客户数据,目前非银信贷机构的共享数据质量尚待进一步提升,专业的数据清洗和整理能力和使用共享数据来评估信用风险的能力尤为重要。 

爱分析:征信机构的盈利模式是什么? 

蒋庆军:征信机构的赢利模式都是类似的,营收主要来自于基础信息查询费和风险评估的衍生服务费。发达市场里这两个收入的比例基本相当,在美国公司Experian的收入结构中,基础查询类收入占48%,衍生服务占52%。 

爱分析:算话采取反欺诈、风控服务等增值服务来吸引客户的效果如何,现在客户量和覆盖率如何? 

蒋庆军:算话的征信与大数据服务合作机构超过400家,其中征信共享数据涉及非银行借款人信息超过数百万人。在反欺诈云方面,算话反欺诈服务7月份上线以来,目前每天反欺诈评估查询量近10万次,评估量月增速超过100%,反欺诈检测结果的准确率超过80%。

爱分析:算话的个人征信服务系统与央行征信报告的异同点是什么? 

蒋庆军:类似之处如下 

1)都是独立第三方、收集跨机构的金融信贷相关的信用信息,实现信息共享; 

2)只允许向平台共享信息的机构查询该行业共享信用信息数据库; 

3)都同时还收集一些其他信息:如法院裁定信息等。 

差异点在于 

1)前者是国家行为,算话的信息共享是民间商业行为,机构自愿共享; 

2)前者共享信息的主要是银行业金融机构,算话共享信息的都是非银行的信贷服务机构; 

3)前者采集的主要包含金融信用信息,算话除共享金融信用信息外,还提供个人授权查询和采集的其它非金融信息数据源。 

4)除共享征信业务外,算话还同时推出反欺诈评估服务、大数据风险评分模型和算话速查APP等丰富的风控增值服务。 

爱分析:算话征信共享进展如何,目前征信行业建立共享机制难点在哪里? 

蒋庆军:目前算话自己推动建立的的共享机制目前已经取到很多合作机构的支持,“行业信用信息共享”是算话团队一直所倡导和支持的,也是算话管理团队十多年的专业特长。 

这个理念本身从算话公司一成立就在非银信贷领域倡导和推广。应该说,这个理念的推动与深入,也伴随着算话的发展与壮大,合作机构从最初对此不了解、不支持到将信将疑、再到认可、信任,直至共享数据。 

当前,推进行业信用信息共享机制的难点在于,要建设非银信贷行业征信基础设施,首先要求行业内对通过征信机构实现信息共享这个事达成共识,但目前非银信贷行业对此还存有种种顾虑,原因在于: 

1)征信机构的公信力有待提高。目前信贷机构对征信机构信任不足,担心征信机构由于自身管理不善或内部道德风险,导致数据泄露,或引起优质客户流失。 

2)征信机构的独立性需要进一步明确。由于很多金融机构或信贷机构也成立子公司做征信服务;所以反过来,信贷机构客户就担心独立征信机构将来自身开展个人信贷业务,和客户竞争。这两种情况是一个硬币的两个方面,逻辑上是一致的。 

3)对业务的公平性顾虑尚未完全消除。数据共享本身会起到行业各机构共担客户信用风险的作用,所以在各信贷机构发展有先有后,机构实力有强有弱的实际情况下,领先发展的信贷机构加入征信共享平台客观上会对参与共享的较弱小信贷机构的业务开展有一定好处。因此,比较领先的信贷服务机构对加入共享平台就会在竞争方面产生一些顾虑。 

4)对部分征信机构的数据处理能力不放心。由于当前市场上很多征信机构的从业人员缺乏真正的个人征信业从业经验,所以对进入征信数据库的数据质量的把握尚不能完全让信贷机构放心,信贷机构会担心由于使用错误数据导致影响自身风控决策的效果,造成损失。

爱分析:对于个人征信领域的公司,成功的关键点有哪些,如何评判? 

蒋庆军:作为征信机构代表和征信从业者,谈谈个人对征信服务本身的理解。要做好个人征信服务,必须做到以下关键几点: 

第一,坚持专业性和专注性。征信服务是一件非常专业的事情,需要专业的团队去做。 

第二,保持机构独立性。征信机构必须保持自身的业务独立性,只能开展征信服务,不能自身从事任何贷款业务。 

第三,找准自身定位。征信机构要看清市场形势,找准自己的业务定位。算话致力于为网贷服务机构、消费金融公司、小贷公司等非银信贷机构提供征信服务。 

第四,着力行业深耕。征信机构须对自己选定服务的目标行业努力耕耘,提供更精更专的服务,取得客户认可。 

第五,重视合规和个人信用权益保护。首先,征信业务在很多方面事实上涉及到法律层面的事情,所以要重视合规,服从监管,积极履行保护个人信用权益的职责和义务。其次,征信机构担负着个人获取公平信用服务的法律责任,责任重大,必须认真对待,切不可掉以轻心。最后,征信机构必须最大程度确保数据安全,确保个人隐私信息安全,并要确保信用数据库中的所有数据尽可能准确、及时、完整。 

第六,重视征信服务的严肃性和科学性。征信服务由于涉及很多人的具体经济权益,所以要高度重视征信服务的严肃性和科学性,不能娱乐化和用于商业营销。在提供信用评分的时候,要最大程度确保评分模型的科学性,不可随意或粗糙。 

在数据积累的广度和深度不够的情况下,不宜过早对外提供信用评分等风险评估服务或超越自身数据可以支撑的评分服务。譬如,只有水电煤缴费记录数据,却提供信用贷款还款风险评分服务。诸如此类。 

爱分析:您对目前有部分征信公司转型做助贷的现象怎么看,目前个人征信领域面临的困难有哪些? 

蒋庆军:征信服务在初期是非常薄利的一个业务。国际上的经验和历史表明,征信机构的亏损期一般在5-7年之上,这就意味着并不是所有的征信服务机构最终都能生存下来。 

创业团队如果事先并不了解这一情况就贸然进入征信服务领域,当然就会遇到很多意想不到的困难。创业公司如果在股东引入、资本结构和赢利预期等各方面不能事先做好合理的安排,就可能会遇到很多困难,非常可能在业务发展过程中不得不面临痛苦的转型。 

对于某些征信公司的转型,具体原因并不清楚。但总体上来说,原因可能是多方面的,比如:信贷业务的快速赢利的诱惑过大、团队对征信业兴趣和决心不够、征信行业经验不足、创业资金不足、技术能力不够、投资人对赢利的压力过大或不现实等等。 

其实部分征信公司的转型,从长远来看是有利于个人征信市场发展的,水落石出,每家机构做自己最擅长的事对整个市场和行业是好事。 

当前,国家金融信用信息基础数据库与市场化征信服务机构之间的关系尚不明确,加上业务边界不够清晰,个人征信牌照迟迟未发,某种程度上都会影响市场化独立征信服务机构培养更快向互联网信贷服务行业提供服务的能力与效率。 

爱分析:前段时间,互金协会建立信息互联共享机制,对于算话的意义何在? 

蒋庆军:互金协会建立信息互联共享机制有利于信贷机构进一步接受和普及信息共享理念,对公司开展业务实际上是有利的。 

算话作为中国互联网金融协会的会员,支持协会对实现行业健康发展所采取的各类举措,如有需要的话,算话也非常愿意在中国互联网金融协会在这项工作的推进中发挥自己的作用。 

以算话团队在行业深耕多年的经验和技术力量,相信能够对此项机制的建立、测试、运行尽一份会员应尽的职责。算话的愿景与协会促进行业健康发展的远景规划是一致的。