NLP落地场景何处寻?百炼智能给出智能获客全新视角

新型营销线索供应商

2019年03月26日
调研 | 李喆 崔可家 洪军 撰写 | 洪军
  • 人工智能
  • NLP

近年来,大数据、深度学习等技术陆续受到资本的追捧。而NLP技术,自2018年以来,逐渐也受到广泛关注,市场亦一直在寻找切实可行的落地场景。

目前,在实际应用中,NLP技术已逐步在舆情监控、客服机器人、语音交互系统等场景拥有产品落地。而在其他场景的商业应用探索,百炼智能给出了一个全新视角。

百炼智能是一家基于数据处理技术和NLP技术构建知识图谱,并将其应用于营销线索获取等场景的人工智能公司。

自下而上建立知识图谱带来良好现金流,且可复制性高

NLP技术在寻找实际落地场景时,往往会存在很多问题,例如数据分散、质量不高,行业标准不统一,专业术语较多等。

因此,在构建知识图谱时如何定义实体至关重要,而实体的定义必须要与上层应用结合,从实际应用的场景出发,考虑定义实体以及实体的关系。而这部分需要业务人员的参与才能满足客户的需求。

如果不考虑应用场景,而是自上而下建立一个跨越不同领域的普适性的知识图谱,则可能导致实体和关系过多或过少,过多会导致模型过于复杂,构建难度过高,导致系统失败。过少,则无法满足应用要求。

此外,对于创业公司,在构建知识图谱时采用自下而上的构建方法能够为公司带来良好的现金流。而自上而下往往前期需要进行大量投入,对资金是一项极大的考验。

百炼智能在落地知识图谱时,采取应用先行策略。落地选择金融、快消、医疗等数据丰富的领域。通过定义人、物、组织、地点、时间、事件、关系七大要素将公网上非结构化数据进行结构化重组,并结合企业自身要求,与业务人员一同定义企业知识图谱。

随后,抽取同行业不同企业知识图谱的共性,形成标准化的行业知识图谱。由于,不同行业的知识图谱构建底层逻辑相同,即定义的实体可以通用,同样为7大要素。区别在于,不同行业、不同企业对客群的属性定义不相同。所以,只需要进行少量的属性参数调整就能够完成不同行业的知识图谱迁移。因此,百炼智能提供的产品可复制性高,当随着客户的不断积累,形成了行业的通用知识图谱,则可以形成标准化产品,实现不同行业、不同企业的快速复制。

商务拓展落地场景可靠性高

我们认为NLP技术在智能获客领域落地场景可靠性较高,主要原因有以下三点:

一是需求强烈,市场规模大。扫街、地推、电销、会销等传统的获客方法不仅费用高,转化率极低,而且销售的获客体验也极差:电话不接、邮件不回。因此,如何更高效的进行商业拓展和产品推广一直都是企业的强烈需求点。这一部分是以企业市场部或者销售部的销售线索预算进行采购,市场规模为千亿级别。

百炼智能提供的两款产品——企业版智能获客解决方案和个人版获客微信小程序,均可应用用于销售线索获取场景。

企业版获客解决方案主要是为企业提供SaaS版解决方案。通过建立关系图谱帮助客户寻找潜在客户和进行产品推广。例如,在医疗领域,帮助医药企业针对性的收集医疗行业有影响力的KOLKey Opinion Leader)信息,跟踪了解学术领袖的论文发表动向,并综合评估行业专家的活跃度和影响力,帮助药厂更好的寻找专家指导。

个人版获客微信小程序也是一个帮助个人智能获客的产品,目前处于测试状态。用户可以通过移动端的微信小程序查询个人互联网公开商业资料以及与其有关联的人的公开商业资料信息,广泛应用于商业线索查询、陌生拜访等场景。可以直接帮助个人实现找对人、办对事,极大的提高了获客效、降低获客成本、提升获客体验。

二是大数据渗透率高的行业,基于NLP技术的底层数据信息抽取会有更丰富的数据来源。百炼智能将智能获客解决方案主要应用与金融、教育、医药、互联网、快消、媒体等6大行业。这些行业的数据都较为丰富,为知识图谱的构建提供丰富的资源。

百炼智能的数据来源有公网数据和企业提供的私有数据。通过利用NLP技术对清洗后的数据进行信息抽取,聚合和重写。形成各行业围绕人、事、物、地、组织、时间和关系7种属性的知识图谱,主要应用于企业智能获客、客户关系维护、市场营销等场景。

三是构建的知识图谱实体定义标准统一,能够快速落地。除了数据之外,在知识图谱构建时,如何定义实体与实体关系是一件至关重要的事情。例如,医疗影像行业,病历的名称、处方等都需要经过专家的标准统一,如此一来,使得定义知识图谱的进程会变得异常缓慢。而百炼智能在获客领域构建的实体以人、事、物、组织、地点、时间、关系为主,基本上涵盖了所有的特征,且这些标准可以完成不同行业的商业化应用,产品可复制性较强,延展性高。

百炼智能目前服务方式以SaaS方式为主对外提供服务,服务的客户主要落地在6个行业,金融、互联网、教育、医疗、快消、媒体,并以大客户的B2B场景为主,这些客户在他们所属的领域都是领军企业,具有良好的示范效应。

近日,爱分析专访百炼智能创始人兼CEO冯是聪,就NLP技术发展趋势与百炼智能业务发展进行了深入交流,现摘取部分内容如下:

主要面向B端提供解决方案

爱分析:百炼智能最开始就确定了AI+营销方向还是后续找到这个方向的?

冯是聪:最开始我们选择方向时定义了3个前提条件。一是必须与AI相关,因为AI是引领这个时代的大趋势,而不是昙花一现。二是一定要有自己的数据。三是可以提供SaaS服务,这样才可以充分发挥创业公司的优势,全心投入于将技术转化为产品。

基于这三个标准,最开始我们找了智能投研,但是经过市场调查,发现这个方向的市场规模有点小。然后,我们想能不能给企业做竞争对手分析。再后来,我们甚至考虑过看能不能做社交,最后终于决定切入到智能营销领域,这里有一个快速试错的过程。

爱分析:百炼智能现在商业模式主要是toB还是toC

冯是聪:主要还是toB,帮助我们的客户更好的解决获客问题。这里分为两类:大企业(大B客户)或者销售个人(小B客户)。

爱分析:百炼智能提供服务是以解决方案还是标准化产品为主?

冯是聪:我们将在很长一段时间内都以提供解决方案为主。通过在每个领域寻找标杆客户,最开始以项目的形式进行切入。在深入了解行业之后,再寻找同类型的其他客户进行快速复制。

另外,同行业领域相关的一些知识具有相似性,而不同行业领域虽然进行客户筛选的方式差异较大,但是底层逻辑是通用的,只是建立模型时会有一些参数上的变化。

爱分析:百炼智能的两款产品除了服务的形式不一样之外,提供的内容有什么区别?

冯是聪:首先,虽然两者的目的都是为了获客,但他们场景不一样。智能获客解决方案是给整个企业提供有效的销售线索,而对于获客小程序来说,主要是针对企业内的个人,首先帮助他们知道今天有哪些销售线索,然后告诉他们应该如何联系拜访目标潜在客户。

其次在服务形式上有所不同,解决方案是在web端进行服务,小程序是在手机端使用,方便携带。

此外,在内容上,智能获客解决方案展示的内容信息会更多,交互非常方便。而获客小程序展示的内容相对较少,交互方式有所不同。同时,获客小程序是销售个人的智能销售助理,可以非常方便的把他/她个人不希望跟公司分享的内容,保存在个人的小程序里。

最后,尽管有以上三点不同,但他们之间可以打通,相互协作。

爱分析:百炼智能的定位相当于AI+轻量级的CRM吗?

冯是聪:我们的产品应该属于CRM的前面一步,相当于为CRM提供有效的销售线索数据。有了线索,就可以用CRM进行管理。从这个角度讲,我们希望跟所有的CRM供应商合作。

产品可快速复制

爱分析:百炼智能主要是想通过单个企业去延伸整个行业的知识图谱?

冯是聪:是的,但我们更喜欢称呼它为关系图谱。因为我们是根据实体的属性、实体与实体之间的关系结合成一个关系图谱。这个图谱所包含的属性包括人、事、地、物、组织、时间、关系

我们的个人版获客微信小程序就是这个框架的缩略版,目前涵盖了除物品外的6大要素。例如,任何一份新出的新闻报导,我们都可以从中将这6个要素抽取出来。

爱分析:百炼智能的产品可以在同行业不同企业之间进行复制吗?

冯是聪:这是完全可以的。我们现在不会去签独家,就像卖CRM系统一样不会只卖一家。而且我们的产品可以很容易形成标准化的产品,因为他们背后的逻辑是一样的,数据处理过程也相同,区别在于不同行业、不同企业对客群的属性定义不相同,这些只需要进行稍微的改变就可以了。

爱分析:在服务同行业的不同企业时,会不会给他们提供相同的客户销售线索?

冯是聪:不同客户会有一些细微区别,他们对于客户画像的定位不一样,如果画像相同的话,我们推荐的客户也会是一样的。所以,相同的客户画像,一定会有相同的销售线索,在这种情况下,差别就在获取客户的执行力。这也体现了我们的价值,采购了我们的客户会领先一步,反之就会落后。

爱分析:百炼智能是明略数据业务线的延伸吗?

冯是聪:不是,我们和明略数据完全互补。明略数据主要处理客户内部的数据,而百炼智能主要处理互联网公开的数据,所以我们和他们是完全互补的。从这个角度讲,我们跟明略数据是天然的合作伙伴关系。

先发优势、数据积累、人才、产品,多方位构建竞争壁垒

爱分析:百炼智能相比于其他公司,竞争优势在哪里?

冯是聪:优势是综合性的。先发优势是最明显的壁垒,但仅仅依靠先发优势壁垒太浅,很容易被追赶。所以还有领域知识、数据源、人才等各个方面。

首先人才转化为技术、然后技术转化为产品、产品转化为服务。我们最开始成立的时候,就是一群拥有这个领域知识的人才,然后现在已经逐渐把技术转化为产品,最后再将产品转化为服务。我们也很重视服务,所以希望能够建立全方位的竞争优势。

爱分析:知识图谱主要用NLP对文本数据进行处理的吗?

冯是聪:对,主要是文本数据,还有少量的图片数据。我们已经成功研发出了部分行业的产品,技术实现了有效落地,只是现在需要更多不同领域客户来进行行业拓展。

爱分析:数据标注是人工标注还是自带标注的?

冯是聪:我们会人工标注一些原始训练的数据,但是大多数都是自动标注的。数据不能全部用自动标注数据,因为有些行业,有自己的专业领域词汇,按照通用的分词工具,分词准确率会大大下降。当然,除了分词,还有很多任务需要标注。

爱分析:服务医药客户的时候,是否因为专有词汇所以需要进行大量的人工标注?

冯是聪:并不需要,我们不是帮助他们做研发的药品,而是帮助药商寻找能够影响药品销售的行业专家,通过这些行业专家做产品推荐从而进行药品推广。

我们会将医生的行业影响力、学术文章发表情况、学历、职称、临床实验情况等作为综合考量指标。例如,我们给药商推荐了某位专家,然后药商去陌生拜访这位专家,这位专家也将这个药试用过了,效果是真的很好,对患者有价值,他们就愿意去推荐使用这个药品,我们在这中间起到了确定专家和提供专家联系渠道两种作用。

爱分析:NLP技术的难点在哪里?

冯是聪:难点是综合性的,包括算法、工程化能力、解决实际问题的能力、优化和迭代的能力,等等。

构建的知识图谱,应用场景延展性高

爱分析:关系图谱除了获客这个场景之外,还有其他应用场景吗?

冯是聪:有很多其他应用场景,例如风控等场景。归其本质,我们是根据公开网站上的非结构化信息,经过NLP技术加工处理,得到结构化信息,生成关系图谱。

我们生成了关系图谱之后,可以应用在很多场景,只是作为一个创业公司不能够什么都做,所以我们会优先选择智能获客这一场景切入。因为这一场景的市场规模大、企业付费意愿强,支付能力强、行业数据信息完整度高。虽然这个数据库不能一时半会建立好,但是建立这个数据库价值度很高,我们愿意花很长时间去进行建立。

我们一年之内的定位是做智能获客,包括智能推荐销售线索、成单预测、陌拜等。长远来远来说,我们的定位是将整个互联网的数据进行结构化整理。

爱分析:百炼智能也会做推荐的工作吗?

冯是聪:一定会的。当线索太多时,靠人力搜索经常不能满足用户需求,推荐的话可以很好的服务客户,因为这不需要客户自己花费很多的精力去探索销售线索,而是系统直接自动给用户推荐。

爱分析:除了搜索、推荐还有其他的功能吗

冯是聪:除了搜索、推荐之外,还有一些社交的元素。有很多时候根据信息本身很难判定它是否可信,因此为了提高信息的可信度,需要提供社交功能。例如,可以转发、评论、点赞等。

爱分析:百炼智能下一步会做广告投放的事情吗?

冯是聪:这个我们会找合作伙伴来做这个事情,例如秒针系统。如果需要的话,我们可以提供算法、数据,具体投放过程我们会找合作伙伴,无需自己再搭建一套投放系统、监测系统、DMP系统,等等。在这方面,我们尽量和合作伙伴合作。

爱分析:百炼智能认为未来会有一个公司做整个大的知识图谱做应用,还是不同公司构建不同行业做应用?

冯是聪:第二种更有可能。未来,可能会像是公安领域里面,明略是做的最好的。在保险领域是百炼智能做的最好,最后大家慢慢统一起来。不一定会有一家企业统一所有行业,而是大家像互联网一样由于利益共享驱动,将所有行业连接起来,就像互联网按照协议连接起来一样。