摘要:已签约信和财富,布局门店、电话审核和APP端

翼开科技CEO魏清晨:金融反欺诈是AI多模态情感计算最佳落地场景 | 爱分析访谈-ifenxi

调研 | 吴永哲 王誉钢

撰写 | 吴永哲

翼开科技是一家技术定位情绪识别的服务商,基于自主研发的多模态情绪识别算法,通过解读图像、声音、生理等数据判断个人的情绪。经过近两年时间的积累和探索,翼开科技优先选择在金融反欺诈领域落地,并推出“EmoFin AI多模态金融反欺诈方案”。

目前,这套方案主要应用于金融反欺诈的三个场景:门店视频审核、APP在线视频审核和电话音频审核。

以门店视频审核为例,首先,在借款人双录的过程中,EmoFin AI全程采集借款人的面部肌肉、眼神、头部肌肉动作等相关数据,并对其进行面部建模。然后,EmoFin AI通过对图像数据进行一帧帧地分析提炼“微表情”和“眼神”反欺诈算法,对声音数据则提炼“声纹”反欺诈算法。最后,通过动机分析进一步判断借款人的真实借款意愿,是否存在“隐瞒”或“编造”等表现,最终完成对借款人从情绪识别到欺诈与否的判断。

其中“微表情”反欺诈技术,EmoFin AI重点提取人类脸部的近20条肌肉单元,并依据专家模型对图像逐帧分析。据悉,区分真假微笑就有至少四个方法:嘴角上扬、左右对称、持续时间、眼部周围等。

相比业内的反欺诈手段,大多通过历史数据来识别欺诈客户,例如客户的征信、流水、资产、负债、上网数据、购物行为等,EmoFin AI基于信审实时数据的分析能起到良好的补充和辅助判断的效果。

据翼开科技CEO魏清晨介绍,目前EmoFinAI方案已签约信和财富,并试点部署在其北京地区门店和手机APP端。除了对借款人欺诈分析外,翼开科技下一步的计划便是分析门店业务员内外合谋的风险。

目前,翼开科技团队比较精简,一共20人左右,其中90%都是技术开发和项目团队。

翼开科技CEO魏清晨:金融反欺诈是AI多模态情感计算最佳落地场景 | 爱分析访谈-ifenxi

近期,爱分析专访翼开科技CEO魏清晨,就翼开科技的战略发展进行交流,摘选部分内容分享如下。

翼开科技CEO魏清晨,曾任中国中期(000996)信息公司副总经理。

认知压力越大,欺诈客户说谎特征越明显

爱分析:在传统信贷审核的流程中,客户经理会针对借款人的哪些行为进行打分?

魏清晨:通常情况下,每个机构内部都有一套针对借款人信息准确度核实的打分系统,但是客户经理并不会对借款人的回答表现,比如是不是支支吾吾、神情异常等进行判断。一方面,主观评价体系非常依赖个人经验,差异太大。另一方面,客户经理并不是专业的风控人员,更多只是承担一个外呼核验身份的角色。

爱分析:如何通过情绪识别出欺诈客户和诚实客户?

魏清晨:首先,根据图像和声音的原始数据去分析情绪。然后,再去分析情绪背后某种趋近和回避的不同的动机与意图,这是情绪识别或情感计算的一个基本流程。

在这个流程的每个环节,翼开科技会下沉一些反欺诈的算法,比如微表情、眼神、语音声纹等。然后在情绪结果方面,欺诈客户和诚实客户在借贷过程中的情绪反馈差别非常大。一方面,由于诚实客户一直担心借款能否通过,导致情绪反馈活跃度通常要普遍高于欺诈客户。另一方面,两者的还款动机截然相反,比较典型的情况是,欺诈客户担心谎言被拆穿,往往出现恐惧的情绪。

爱分析:担心和恐惧这两种情绪在原始数据呈现上有什么明显的差别?

魏清晨:从字面理解上,两者可能差不多。但是从数据表现来看,由于欺诈客户和诚实客户的动机不同,在回答问题时,诚实客户往往是在回忆或如实地表述,而欺诈客户是在编造、撒谎,两者所承受的认知压力是完全不同的。

再比如眼神、眼部肌肉的活跃情况,欺诈客户往往眼神的眨眼、躲闪等异常活动较多,而且维持时间较长,眼部肌肉出现异常情况等。

爱分析:如何解决不同客户之间个性化表情差异的问题?

魏清晨:通常在设计问题流程时,我们会在第一步设计相对没有认知压力的一些问题,比如用户的基本信息等,在此前提下,进一步分析他的微表情、眼神、声音和情绪的结果。这类数据能采集到客户的一些个性化特征,以此形成每个用户认知加工的基本画像。

第二步,施加一些业务相关、带有认知压力的问题,包括负债情况、收入、家庭等问题,然后再采集客户的微表情、眼神、声音和情绪等数据。通过对比之前基本画像的数据,我们便能判断客户此时的认知压力和思考情况有何变化。

针对风险较高、认知压力比较大的问题,我们可以再追问一些细节,借此能把疑似欺诈客户说谎的特征激发地更加明显。

专家模型、机器学习先后串联、相辅相成

爱分析:在技术层面,针对音频和视频的情感分析有什么不同?

魏清晨:图像和音频的处理技术不同,音频的情感分析主要是基于声纹特征,从大概几百个参数中提取出与情绪表达、说谎等相关的10余个参数,然后将其特征进行可视化分析。

视觉计算方面,去年我们在技术上实现了一个升级,即从原来图片识别表情进化到视频,能够一帧一帧地去进行分析。

爱分析:翼开科技主要的技术有哪些?

魏清晨:在音视频的前期采集层面,目前有一些开源的算法,包括编解码等,这方面有比较成熟的软件。翼开科技的技术主要体现在数据采集之后的分析阶段,包括分析特征、分析情绪,然后进一步分析欺诈风险等。

爱分析:视觉计算技术从图片发展到视频,对于情感分析有哪些变化?

魏清晨:视频包含一个动态的变化,其核心是不同帧之间的变化。

从图片变成视频后,意味着我们可以分析的维度变多了。比如分析真笑和假笑,如果基于图片,最多只能分析他嘴角上扬的程度、左右对称的程度和眼部肌肉活动的程度等。但是换成视频,我们可以增加一个重要的维度——时间,而且时间的维度或许超过前三个维度,通过分析他从不笑到笑花费多长时间、微笑持续多长时间等来进一步判断。这便是一个只有基于视频才能分析的数据维度,而且十分重要。

爱分析:目前机器能识别出多少种表情或情绪,识别准确度有多高?

魏清晨:现阶段按照技术路线的不同可以分为两类,一个是基于机器学习模型,目前大概能识别6-8种基本情绪,准确度较高。另一种是基于专家模型,通过记录活动、定义表情,这类表情在心理学上按照最细的颗粒度区分是130多种,目前从工程上能实现的则是24种,正面和负面各占12种。

这两种模型各有利弊,机器训练模型的优势是通过导入大量的数据进行训练,基本情绪的识别精度可以达到较高水平。专家模型的优势在于对情绪的定义更为细腻,同时对于真假情绪的区分度能力要远高于训练模型,训练模型只能识别呈现表情或情绪,而很难识别真伪。

爱分析:专家模型需要大量的标注数据进行训练吗?

魏清晨:不需要,专家模型方面有大量的论文和研究成果,主要基于理论研究、认知理解和实验产生。相比较机器训练模型是一个黑盒,专家模型则是一个白盒。

爱分析:目前翼开科技主要采用哪种模型?

魏清晨:现阶段,如果只是识别情绪结果,比如喜怒哀乐等,主要采用机器训练模型。但是如果部署至产业,需要对情绪进行解构、更精细地分析,专家模型的权重会更高一些。

泛金融领域优先落地,医疗、公安行业存在需求

爱分析:除了金融反欺诈,未来可能落地的场景需求有哪些?

魏清晨:首先在泛金融领域,除了在金融反欺诈环节,第一部分就是在贷后的催收环节。我们可以通过在贷后通话环节进行语音分析,分析逾期行为是主动或者被动,进而判断逾期者的还款意愿,以在催收黄金期内尽快匹配不同的催收策略。

第二部分,在保险反欺诈领域也可以运用。保险和贷款的场景相似、逻辑相反,保险是先收钱后出钱,贷款则是先出钱再收钱,出钱之前恰恰是反欺诈的关键时机。所以,保险反欺诈的重点在报案、核保和理赔等环节。

其次,在医疗、公安等领域,情绪分析也具有一些场景需求。比如我们曾与某大型医院合作,对数千人的数据病例进行算法分析,尝试对抑郁症、精神分裂等疾病进行早期排查。另外,在公安领域,主要应用在审讯环节,对犯人的心理活动进行分析。如果对方的心理防线趋于衰减,那就继续追问;如果心理防线趋于增强,则尝试调整线索和策略等。

爱分析:客户对于情绪识别反欺诈的精度要求大概在什么水平?

魏清晨:目前,翼开科技的识别精度在互金行业是被认可的,一方面,互金的坏账率较高,另一方面,他们自身的反欺诈能力较为有限。但是,银行客户的贷款利率远低于互金公司,所以银行对于坏账的容忍度要更低。

爱分析:为什么选择金融领域作为优先切入点?

魏清晨:基于以下几个维度。第一,数据基础比较好。在金融信贷的面审环节,根据双录要求都有音、视频存储的数据。其次,所有的数据自带标签,即后续每个人的还款记录。

第三,情感计算在金融场景的价值非常易于核算。比如情绪反欺诈系统每命中一个欺诈客户,它带给甲方的价值就是本金+募资成本,所以甲方在付费意愿和能力方面都比较强。

爱分析:在部署方式上,翼开科技采取何种方式?

魏清晨:系统部署方式主要取决于甲方的IT基础和需求,如果甲方IT基础好的话,系统就部署在甲方的数据中心即可,如果基础不好则可以选择部署在我们的云端。

爱分析:目前合作的客户有哪些?

魏清晨:已签约的客户有信和财富,另外还在接触多家互金公司和银行。

首先,我们6月份在信和财富北京的两家门店进行了布局,稳定后会推广至全国的几百家门店。其次,APP端业务也已经上线进行使用。另外,电话审核和电话催收场景,也已经拿到甲方的数据,并初步训练出行之有效的算法模型。