人工智能

硅谷创业公司进军中国，DataVisor用无监督算法对抗欺诈高速变化

有效抵御未知的攻击模式，适应欺诈行为的快速变化

2018年07月09日

调研 | 刘馥亮撰写 | 唐靖茹

人工智能

美国征信巨头益博睿（Experian）报告显示，中国网络欺诈损失占GDP比例0.63%，居全球第二，且亚太区59%的受访公司预计欺诈行为在未来五年内将继续增加。

中国网络交易增长迅速，移动端使用增长更加大了反欺诈难度，但中国企业对网络欺诈的担忧程度却较低，其中一个重要原因是法律对消费者的保护力度不足，很多案例中最终由消费者为欺诈买单。

近期，最高人民法院就信用卡纠纷公开征求意见，其中明确认定了发卡行、非银支付机构、电信运营商对于防范信用卡网络盗刷所负有的安全保障义务，以及损失发生后应承担的赔偿责任。随着立法推进，越来越多的企业会主动采取反欺诈措施，基于大数据和人工智能的反欺诈技术服务将释放更大潜力。

创立于美国的DataVisor是反欺诈领域的领先技术服务商，其独特的无监督反欺诈机器学习算法可以自动识别用户异常和攻击行为，有效抵御未知的攻击模式，适应欺诈行为的快速变化。

据DataVisor中国区总经理吴中介绍，不同场景中产生的用户行为会转换成特征参数，进入DataVisor的模型引擎，进行较为统一的图关联分析，寻找到异常群组，自动有效产出反欺诈决策。

相比国内传统提供规则引擎、黑白名单等数据服务公司，及企业内部有监督机器学习引擎，DataVisor的独特优势在于通过使用无监督反欺诈算法，对客户脱敏的大规模数据进行运算分析，从而做到提前预防和监测。同时在累计处理全球超过40亿用户帐号的情况下，DataVisor全球智能信誉库也涵盖了更加丰富的IP区段、电话区段等脱敏信息，辅助不同场景的反欺诈分析，提高检测率。

DataVisor目前的客户分为四类。

第一类是社交网络，包括美国的Pinterest，中国的陌陌、探探等，为客户解决大规模注册、盗号、撞库，以及垃圾信息、诈骗、涉赌、涉黄信息等问题。

第二类是电商和O2O平台，如美国的二手交易网站letgo，国内的京东、大众点评、微店等，防范虚假账号注册、盗号、刷单、薅羊毛等欺诈行为。

第三类是游戏、工具类产品，如FunPlus、、猎豹移动、今日头条等。企业进行市场推广时会按照下载安装量向渠道付费，其中可能会有假量参与，造成推广成本的极大浪费。DataVisor可提供假量分析，减少企业损失。

最后一类是金融行业，包括互联网金融和传统金融机构如国内的某大型银行，主要应用于打击交易欺诈，辅助授信场景等。

据了解，今年DataVisor中国区业务将继续探索互联网细分场景，并延伸更多的金融领域应用，打造更多标杆案例。硅谷创业公司进军中国，DataVisor用无监督算法对抗欺诈高速变化

近期，爱分析专访DataVisor中国区总经理吴中，就反欺诈领域行业动态及DataVisor的业务发展情况进行了交流，部分精彩内容分享如下。

无监督机器学习可有效识别未知攻击模式

爱分析：反欺诈领域技术服务有哪些常见的模式？

吴中：常见的有三类。

第一类是用黑白名单。目前，国内这种欺诈监测方式比较多，有些专门的大数据公司提供黑白名单检测服务。这类模式的问题在于黑白名单的更新速度，以及数据库受污染的问题，而且有很多如刷机设备等，可以避开这种检测方式。

第二类是规则引擎，也很好理解，通过分析样本，人工总结一些规则，相当于专家经验固化成一些规则去做防控，做得更系统化一些。

第三类就是用有监督的机器学习，道理基本一致，通过机器学习样本，从而替代人工学习。

以上这几类均属于有监督学习的范畴。逻辑都是要事先知道攻击的模式，给学习者一些样本，或者一些经验性的知识，或者一个名单，然后让其去挡掉新的攻击，但是这样无法很有效地应对目前的攻击发展模式。欺诈一旦专业化之后，变化是非常多的，它跟你的对抗也是非常快的。

DataVisor采用无监督学习实际上也是从这个角度入手，比较有效地去发掘一些未知的攻击模式，在欺诈模式变化的时候，使反欺诈手段更快地自动跟上。DataVisor是最早采用无监督机器学习算法模型的服务商，目前已经在国内外得到很多中大型客户的认可，在全球范围内也是领先的。

爱分析：无监督学习和有监督学习的主要差别是什么？

吴中：有监督是给一堆训练样本，本质上是用一个模型去发现训练样本里面的模式；而无监督不用提供训练样本，可以自己通过分析平台上所有用户的行为，自动发掘里面的异常跟攻击。

爱分析：无监督算法在金融领域落地时，发现异常后如何进行决策？

吴中：其实互联网领域也会有这样的过程，根据不同的置信度（准确率等），做不同程度的操作（封禁、限制功能、改密码等）。我们会和我们的客户一起合作，探讨定制最合适的使用策略。

爱分析：如何理解半监督学习？

吴中：半监督本质上还是有监督的一种，其实还是要给标签。

所谓半监督的意思是训练样本里面可能有比较大的一部分没有标签，但一部分是有标签的。一般的做法是结合有标签和无标签的样本，优化分类面；或者通过原有的标签去传播，把标签传播到原来没有标签的样本上，然后把它转化成一个有标签的样本。

所以本质逻辑还是一样，就是你已经知道了一些欺诈模式，可以进行标记。但是它比纯粹有监督学习更好的地方，就是可以用相较少的样本，通过传播的方式把没有标签的样本利用起来。

爱分析：如果有新成立的公司采用无监督算法，DataVisor的先发优势会体现在哪儿？

吴中：第一还是技术。

一方面是无监督反欺诈学习算法。无监督是一个大的品类，实际上把无监督技术真正落地应用到反欺诈领域，然后能出来很好的效果，能直接地接上生产环境去用，以及同样的平台技术，能做到让它适用于不同的场景，这其实是不容易的。

每一个客户专注于一个场景，用有监督或者各种方式，可能做得还不错，但是想达到强适应能力还是比较难的，所以技术上我们还是有比较强的壁垒。

另一方面我们整体的团队背景都非常强，多数技术成员毕业于中美名校，所以团队在技术建设上有优势。

还有一方面就是客户角度，我们也在强调，反欺诈实际上跟业务要有很紧密的结合。

所以这不单是一个客户资源谁先做的问题，实际上我们在这个过程中，也在不停地完善自己的技术和模型，这是提升实战业务很好的途径。所以对DataVisor来讲，这是滚雪球式的正反馈。

服务模式多样，适应不同场景

爱分析：DataVisor提供怎样的服务方式？

吴中：我们有几种服务方式。

一种是SaaS模式，就是把服务内容放在DataVisor 维护的公有云上，然后用户通过加密信道把脱敏之后的数据传到云端，然后返回结果。但是在云上，每个客户的数据存在不同的容器里，是安全隔离的，这是最多的一种模式。

另外我们也支持一些私有化部署，甚至部到他们的机房。针对不同行业、不同客户对数据政策的要求，取决于它是哪一类数据。

爱分析：用户在每一笔交易发生的时候都要传送一次数据到平台吗？

吴中：我们其实也有两种对接模式。

一种是批量对接，可以把数据积累到一定的程度，几个小时给我们推一次，推过来之后进行集中运算，然后把结果返回回去。这个基本上跟客户拿到结果后的一些打击策略相关，如果他对时效性要求不是很高的话，可以采用这种批量的模式。

另一种是实时的。就像某国外大型交易平台，每一笔交易都要得到一个决策。所以他会每一次都先发过来，每一笔交易都会推给实时接口，然后实时给出反馈。

爱分析：DataVisor的收费标准如何确定？

吴中：我们采用年度服务费的模式，包年服务居多，一般根据场景、用户体量、部署方式及结果返回方式，综合生成年服务费。

爱分析：通常一个客户会选择多少家供应商同时服务他？

吴中：视客户具体需求而定，从一两家到十几家都是有可能的，银行通常是四五家。

爱分析：供应商之间会有什么差异吗？

吴中：客户会从不同角度，或者不同的信号方面去解决不同方面的问题。比如有些采购提供设备指纹分析的，有些采购黑名单数据服务的，可以后续用在整个的数据分析里面，我们的模型都可以去用一些黑名单或者设备指纹记录下来的结果。所以不同供应商可能会有不同的专长，覆盖不同的地方，最终形成一套最优解决方案。

中国市场提升迅速，应用场景持续延伸

爱分析：DataVisor在中国区的业务发展过程大致是怎样的？

吴中：中国这边发展得很快。从整个需求跟业务拓展，相对其它地区，比如美国和东南亚之类的，还是比较快，也是跟中国互联网需求比较旺盛有一些关系。

我们从2016下半年进入中国以来，初期专注于建立办公室和团队，同时也在拓展一些初始客户，比如微店、猎豹移动、elex等，全方位了解国内市场。

去年是我们快速增长的一个阶段。无论是从团队规模，还是客户数量，均进入了快速发展阶段。

爱分析：DataVisor在世界范围内哪些地区还有业务？

吴中：现在最大的还是中美，然后东南亚有一些客户。以美国作为总部，欧洲有一些接触，主要还是这几个地区。

爱分析：现在几部分业务的占比情况大致是怎样的？

吴中：其实社交、电商、游戏工具都可以归成互联网。互联网是我们做得最早，也是最强，客户最多的一块。

我们从去年开始突破传统金融和互联网金融。有几个比较好的案例，如国内的几个大型银行和互联网金融平台，今年会战略性地在金融上多一些投入跟拓展。

爱分析：2018年中国区的业务规划是怎样的？

吴中：互联网行业依旧是欺诈变化最多最快的一个领域，同时我们也在这个领域有了非常深的客户基础和业务知识，接下来，我们会将这些丰富的经验知识和创新技术服务更多客户。比如我们今年4月份发布的新产品－UML Essentials，希望帮助更多中小企业解决欺诈难题。

今年另外一个重点是金融和银行。风险控制在金融领域一直是非常重要的，同时，银行近些年，也非常注重引入外部先进的技术，不断完善自身产品、提升内部人员技术能力。在这个人工智能时代，DataVisor作为一家人工智能反欺诈公司，也希望为金融和银行注入更多的智能活力。期待与我们的客户一起，见证技术引领下，人工智能时代的革新。