人工智能

圆桌对话:智能+时代的机遇与挑战

人工智能技术落地进程中机遇与挑战并存

2019年12月24日
  • 人工智能

近日,爱分析在京举办2019爱分析•中国人工智能高峰论坛。论坛邀请到了百分点CTO刘译璟、阿博茨CTO刘铁、快商通执行董事肖龙鹏、云测数据总经理贾宇航作为分享嘉宾,共同就“智能+时代的机遇与挑战”这一主题进行了精彩讨论。此次论坛由多维海拓执行董事尤頔主持。

现将圆桌讨论实录分享如下。

尤頔:感谢台上几位嘉宾的到来,先请各位介绍一下公司以及在AI应用中有哪些具有代表性的落地场景。

刘译璟:百分点于2009年成立,我们的使命是“用数据智能推动社会进步”。起初的主要业务是提供线上个性化推荐,目前转向数据智能业务,是一家综合技术服务商。我们主要是结合大数据和人工智能,特别是认知智能方面的技术,为企业和政府提供端到端的解决方案,打通从数据采集、处理、分析到数据智能应用场景。

贾宇航:我主要负责云测的AI数据标注业务,Testin云测最早以云测试起家,后业务领域增加了AI数据服务品牌-云测数据。云测数据通过自建数据场景实验室和数据标注基地,为智能驾驶、智慧城市、智能家居、智慧金融、新零售等领域提供定制化的数据采集、数据标注服务,全方位支持文本、语音、图像、视频等各类型数据的处理。截至目前,云测数据在华东、华北、华南设有数据交付中心和数据采集基地,已成功为数百家企业提供AI数据服务。

肖龙鹏:大家好,我是来自快商通的肖龙鹏,快商通成立于2009年,并于2012年开始专注于AI领域。公司聚焦于语音识别的相关发展,并以让人工智能走进每个人生活为使命。快商通从之前的技术供应商再到现在的端到端解决方案提供商,医美、金融是公司主营业务场景。

刘铁峰:大家好,我是阿博茨科技的刘铁锋,阿博茨的主营业务场景是金融领域,就是做AI在金融领域的相应落地。比如,金融机构有很多纸质的数据来源,阿博茨则会用AI的方式将相关数据抽取出来。

目前已经涵盖了基金、证券、保险、券商等主流的金融机构,除了国内金融机构外,我们在海外也有一些业务,以上就是阿博茨科技的主要概况。

尤頔:很多创业公司都会在人工智能在落地的过程中遇到很多挑战。在这一年里或是更远之前,各位有没有遇到过一些让你记忆犹新的挑战,又是怎么解决的?可以作为案例和我们分享一下吗?

刘译璟:最近,百分点帮助国家市场监督管理总局缺陷产品管理中心召回了某款电器。客户每年要对上亿个产品进行监控,并从中筛选并召回存在安全隐患的产品,这个工作量非常大。按照之前的工作流程,需要找到相关的证据再监测,需要消耗大量的人力资源。

近期,百分点利用深度学习和自然语言处理技术,对成千上万的产品描述、价格、图片等信息进行文本过滤、口碑提取、分析等处理,发现某款电器出现大量消费者投诉等现象,可能存在安全问题。后来经过质量监测和专门的实验发现确实存在安全风险。这是一个典型的利用人工智能,帮助政府精简工作,保障消费者利益的案例。

人工智能技术在这个案例中的作用,首先是将非结构化的数据结构化,并从所有文本数据中提取品牌、产品等一系列的标签,再通过标签构建模型。其中涉及到数据处理、建模、判断产品的质量等工作。

我们发现,好的场景一定要有数据,能够清楚地描述场景是什么样子的。要么做数据结构化的工作,要么做交互的工作,要么做业务建模的工作。

众所周知,在市场环境中一个新概念的提出往往会带来蜂拥而至的效果,但这个场景最终是否能落地却鲜少被关注,这就造成了很多企业的困惑。如果想要落地场景的话,首先企业自身要能讲清楚自己的业务价值,并有数据为佐证,而且技术提供方能够基于数据实现场景的价值,这样才能达到比较好的落地。

贾宇航:刘总讲的非常好,目前人工智能正在逐渐落地的进程中,数据是非常重要的一环,是尤其欠缺“小数据”。

小场景数据的缺乏而增加了真正落地的困难度。比如,关于人的行为姿态的数据非常多,但人跌倒到数据非常少,其实我们就是要检测跌倒,识别跌倒并及时告警。云测数据作为第三方的数据服务商,我们发现很多行业和很多领域应用人工智能技术时,其痛点也是小数据。

今年的热点话题中,数据的获取尤为困难。今年不光是猪肉的价格贵,毫不夸张说猪脸识别的成本比人脸识别的成本还要高,价格的高低体现着数据稀缺的程度和难度。作为人工智能数据服务企业,致力于帮助这些企业获取更优质、更高效、更安全的数据,帮助他快速落地。

肖龙鹏:快商通之前也遇到过很多的问题,总结下来主要分为两点:第一,客户的期望值和你技术的成熟度很多时候是处于两个阶段的,客户期望用你的技术发现业务场景中的痛点并解决的非常完美,但现实并非如此。这个时候就需要客户对技术具有一定的包容度,愿意让技术在实际业务场景中训练并提升产品的成熟度。这是目前人工智能技术落地场景的一个难点,如果无法解决,技术落地和业务周期就会拉长。

第二,是数据的问题,数据是AI的生产力,但每个行业的数据标准都不一样,所以在算法实际落地到场景时,因为数据的不一样,导致有价值的数据不能用。只能重新积累相关的数据。这就是目前快商通遇到的两个最大的问题。

尤頔:客户有时候不仅需要我们有产品能力,还要有运营能力。需求的变化对原有产品落地的解决方案,个性化服务带来了一定的挑战,请问我们是如何应对客户的需求的。

刘译璟:早在2016年,百分点就考虑到了这个问题,我们认为它是挑战更是机遇。数据本身就和业务结合得特别紧密,只有在实际业务中才能优化技术。不应该仅仅给客户一把钥匙,而是要告诉他们如何使用,特别是政府类客户。

所以我们要尽可能多的参与到客户的业务活动中,比如出各种各样的辅助决策的报告。要想清楚了交付的价值,以及需要具有得交付能力,而不只是简单地提供一堆产品。想清楚这一点,组织模式和业务模式都会随此而改变,适应之后就会尝到运营的好处。

尤頔:您刚才提到我们服务了很多政府客户,这些政府客户在诉求上有什么样的特殊点吗?和其他的客户相比起来,是否有一些实际的案例可以分享?

刘译璟:除了刚刚提到的召回案例,还有某市检察院得案例。现在很多市民会问某一事件应该如何处理,比如说环境污染应该去哪儿投诉?包括现在正在做的统计局方面的业务,每年到了要报税的时候,就会有大量的问题要征求政府机关。这种诉求非常强烈。

那么,如何通过机器交互的方式解决这些问题,降低客户的人力诉求?大致来看,政府客户的诉求可以归到三类:1. 非结构化数据的结构化,特别是文本数据语义结构化;2. 数据处理,特别是业务建模和预测;3. 更自然的人机交互,例如,通过搜索、语音、文字等的问答得出结果。

总结归纳一下,我们要做的工作是把最终的应用场景梳理清楚,知道解决的是交互问题还是数据结构化问题,又或者是业务建模的问题,确定客户需求之后提供相应的产品或者技术。

贾宇航:就企业服务来讲,中国和美国两个市场的差异非常大。我们发现中国甲方企业追求成果,并不期望要一个标准化的软件和服务,在中国更多是定制化,为解决甲方需求产生的对应服务。

结合到人工智能,刚才提及人工智能正处于落地的阶段,落地需要小数据。就小数据而言,企业结合自身实际场景,需要有非常多的定制化。云测数据经过这么几年的运营,接触不同的定制化需求,目前可满足不同企业不同定制化诉求。我们在服务的模块中尽可能做到流水线化,并且把服务模块抽象化、中台化,通过前端的对接,利用我们的中台化服务能力去服务不同的企业。

尤頔:贾总,云测有很多业务来自于数据标注。作为第三方公司,现在很多人工智能公司都有自己的团队。您如何看待外部的赋能,像我们这样的第三方解决方案提供商和内部团队之间,在这件事情上的配合是什么样? 

贾宇航:未来是两者缺一不可的,内部团队可能是基于一些隐私保密性,数据不能拿给第三方进行标注所设立的,所以内部团队对于一些敏感信息行业来讲是不可取代的。另一方面,初期的算法模型迭代,可能有一些定制化的需求,早上制定出需求晚上就要更改,这些需求就不适合第三方的公司进行协作。第三方的公司在生产标准化,特定行业的技术积累以及运作模式的积累,对于大规模高质量的数据标注方面有一定的优势。基于此,可能企业内部肯定有自己的标注团队,但这个标注团队规模不会特别大,主要是面向算法前期的迭代需求,逐渐随着算法模型的成熟,需要大批量数据的时候,那个团队可能会逐渐地转变为数据的质量审核的团队,最后由第三方和内部团队协作的方式来完成。

尤頔:我们会对特定的行业提供专门的解决方案吗?

贾宇航:是的,我们发现随着人工智能技术在行业中的不断渗透及深入应用落地行业与产业的结合越来越密切。不仅是数据标注能力或者采集能力需要一定的积累,同时还需要有一些产业的经验相结合。

假设在自动驾驶行业中,我发现标注质量好的人同时拥有丰富的驾驶经验,这也是一种知识积累的体现。云测数据在驾驶、家居、金融、安防、新零售等领域提供专门的数据采集和数据标注的解决方案,逐渐深化我们相应的业务能力以及领域知识的积累,然后再赋能于这些行业。

肖龙鹏:AI助力企业数字化这一块,需要从产品和交付能力两个维度来看,分别是数据运营能力和生态建设能力。比如,生物识别技术落地于保险领域,我们刚开始提供的是技术能力,当技术产生了价值,产生了数据之后,新的问题又来了,那就是客户并不会做数据的运营。因为技术是我们提供的,客户看不懂,但有很多新的数据产生,所以肯定会让你去配合客户做整个数据的价值化挖掘,从数据挖掘反推到数据上,这是一个要提升的点。

大部分的企业数字化包括了很多系统,且都是穿插并行的。供应商提供基础的产品解决方案之后,需要跟进所有的业务流程去做整个生态对接,这是我们做的第二个点。

尤頔:刚刚肖总也提到,生物识别在快商通的应用中是核心主打的功能模块之一,您能举一个具体案例吗?如何结合到智能客服等SaaS应用场景中,如何把AI的功能发挥出来。

肖龙鹏:目前生物识别技术刚刚实现商业落地,可能大家对此的熟知度并不是很高,但国外很早之前就已经落地了。国内金融领域的应用也是刚刚兴起的,为什么说金融领域是一个最好的AI落地场景。因为这个领域存在大量的数据,尤其是语音数据。很多银行使用的智能外呼产生了大量的语音数据。我们有一家合作的上海银行,是国内最先将声纹于外呼技术相结合并落地使用的银行,这种技术的主要应用场景是普惠金融,例如,让客户在贷款前先念一段话,同时会针对人脸、身份证、声纹进行多要素的识别,到真正放款的时候,会进行电话回访,确认贷款申请和贷款审核人员是否为同一个人。

刘铁锋:因为阿博茨的业务集中在金融领域,所以与金融业的客户接触的更加多一些。我们主要接触两个部门:业务部门和IT部门。IT部门基本上是以降低成本为主,如果能提升收益,客户会对技术落地更感兴趣。我认为这也是人工智能在企业业务层面落地的两个方向,一个是直接帮客户提升收益,另外一个是降低成本。从客户接受度来说,提升收益的吸引力远远大于帮助客户降低成本,这是其一。 

其二,倒逼人工智能供应商去深入理解客户的业务。阿博茨帮助客户有效的节省决策时间,提升他们决策的效率。这一点对于客户来说接受度是相对比较高的,尽管你没有直接拉升收入,但是提升了业务人员的吞吐量以及处理业务的效率。

尤頔:我们了解到阿博茨在AI、RPA领域非常深入,您能不能举一个RPA落地的实际案例,无论是银行业还是相关的泛金融产业里。

刘铁锋:今年RPA确实是一个非常热的话题,我知道绝大部分的AI企业都开始切入RPA领域,我有如下几个观点。 

第一个观点,流程的自动化是AI能力自然的延伸。阿博茨的AI能力帮助客户提升输入、输出效率,不管是输出结构还是数据,这些成果需要嵌入客户随后的业务流程中去,或者和信息系统结合,才出现了AI企业跟客户更多业务场景的结合。这是AI企业里RPA发展的路径。 

第二个观点,我们认为RPA是两个系统、流程之间的串接器,人与人可以通过语音对话、文字进行交互。机器之间的对接也有两种,第一种是通过API,有点像文字的方式。第二种是RPA,通过系统自动化的方式,录屏、截获、输入、输出直接提供信息,类似于语音对话,这样比较直接。这个也使得AI企业往RPA渗透比较自然。

第三个观点,大家提及AI落地有些挑战,而RPA则能直观地让客户看到机器处理业务的能力也很优秀。比如,将图表里中的表格抽取出来,或者把这段文字中关键信息抽取出来,对客户价值度并不高。但是在信息抽取之后,帮助客户录入业务系统中,且完全不需要人工介入的时候,RPA对于客户的价值就体现出来了。

举例来说,在银行的信贷审核部分,审核文件时,需要员工打开文件比对签名是否一致,身份证是否一致,这是非常消耗人力资源的。阿博茨通过AI将字段抽取出来做自动比对,AI在银行业的落地的效果是非常直观的。类似的在快递行业,把快递单据做对比录入,都是基于AI数据文本的抽取能力、图象的抽取能力,甚至文本的理解能力把关键信息提取出来,帮助客户将信息填充到相应的业务系统。你可以认为原理都是一样的,只是表现形态不太一样。

尤頔:我们也知道阿博茨的服务客户中有相当比例时来自于海外的,国内客户和海外客户之间有什么区别吗?包括付费方式,付费习惯上存在哪些异同点?

刘铁锋:国内企业倾向于一次性买断,为了保证自身的自主可控,这是国内企业能够接受的方式。对于海外的用户来说,他们倾向于订阅模式,或者按照处理量的模式付费。比如与港交所合作的过程中,港交所原先有接近300人将各上市公司公告、财报中的信息抽取出来再录到港交所的系统中。阿博茨帮助港交所将识别率提高了97%,现在只需要30个人处理最终比对工作就行。港交所愿意按照业务量去付费,而不是一个固定费用。对于海外客户,更加倾向于订阅的方式。这对于阿博茨来说是非常好的付费方式,每年都能依靠业务规模去成长。

尤頔:您刚才提到了一个观点,中国很多企业客户倾向于一次性买断产品。但如果服务的是大型的金融机构,其自身IT团队也非常庞大。很多企业服务公司和AI公司服务过一些金融公司之后,就没有后续的服务合作的机会了。

是如何把握和这些大型金融机构客户,或者是有自主的IT开发能力的客户合作中的握尺度。

刘铁锋:现在大部分证券公司、基金公司,不光有AI部门和金融科技公司,还要求领域内的业务优先交付给自己的金融科技公司。这对于AI公司来说带来的挑战是非常大的。

回归到业务的本质,AI公司提供的价值在什么地方。在我们来看是三个方面的能力:第一个是算法能力,第二个是数据的能力,第三个是领域内知识和业务的知识沉淀。 

就算法能力来说,现在所有的AI公司算法能力大致相近。数据能力则取决于能否获得跨行业,跨领域的数据,实际上阿博茨在处理数据方面,具备一定的优势。原因在于阿博茨切入的行业相对来说宽泛一些,对于领域知识的沉淀,如果把数据作为单点来看,领域知识沉淀像是线或者是面,甚至构建一张网,能够基于这张网做出决策支撑,这是AI公司的核心的能力。

将AI公司和金科公司放在一起看,如果涉及与客户业务的绑定,比如说银行核心系统,证券核心系统,坦率讲很难与金科公司竞争。但在某些具体的专业领域里,表格和图表处理能力是阿博茨的核心能力之一。读取财务报表、无边框的表格,理解每一个表格的意思,甚至把表格中间不同的字段之间的公式计算出来,这就需要强大的处理能力,即刚刚提及的算法能力加上数据的能力。第三个就是阿博茨对业务的理解,能够理解公司和公司之间的关系这就不是银行金科部门所具备的。所以最好能做到横跨行业,甚至跨多行业。

刚才提到表格和图表处理能力,不仅仅是处理银行的数据,大家很难想象到阿博茨能够与中国最大的钢铁公司宝武钢铁合作,他们的交货单,阿博茨能够用同样的技术,加上机器训练理解客户在这个行业中的表征,这就是基础能力往更多行业的泛化,这样反倒能够和金科公司的竞争,取得一席之地。

尤頔:我们都知道资本市场目前对于AI公司是趋于谨慎的。请各位嘉宾分享一下,在企业的发展和运营策略上是否有对应的措施来应对所谓资本市场的寒冬。

刘译璟:在2016年之前,百分点打的比较宽,各个行业都有涉及。但凡有一个行业需要做用户画像,数据治理,我们都会尝试。

后来我们发现,仅凭八百多人的资源是不能覆盖这么多面的,只能聚焦细分行业。于是,在2016年之后,我们决定聚焦于四个领域,分别是政府、公安、零售快消、媒体出版。在做业务的过程中,业务人员和技术人员的比例需要在一个合理的水平线。同时,还会有一系列的成本管控措施。 

综合来说,这涉及企业的运营能力和管控能力,如果管理能力跟不上,企业的组织模式、业务模式也就跟不上,总有一天会难以为继。百分点在2016年想明白了,在2017年就快速盈利了。所以现在整个公司运作是健康的。

在这里我要说,管理真的非常重要,一个企业能够长久地走下去,技术和产品只是一方面。除此之外,客户关系、解决方案、组织模式和企业文化都非常重要。企业规模在30个人左右的时候,技术和产品是关键,等企业规模上升至几百人、上千人,优先考虑的应该是管理问题。

贾宇航:云测数据看到人工智能训练数据是所有甲方企业的刚需,并且企业在数据上的确存在痛点。所以我认为数据行业存在刚性的需求。云测数据看到了发展的趋势,未来需要逐渐地延展自身的能力。

我们未来的发展策略是一横一纵的发展,一横:未来越来越多的行业会引入人工智能,云测数据也在积极布局其他行业相关的数据服务能力。一纵:有些人工智能行业也会逐渐深化。人们在享受人工智能带来的优便时,对于人工智能也存在一定的期望,这种期望会指引着未来人工智能逐渐像多模态发展,人工智能将逐渐与各行各业深度地融合。对于数据服务人员就要有更深入的业务理解能力,以及领域知识的积累。从纵深的角度来讲,会往更深的业务层次进行积累。

肖龙鹏:在资本寒冬中,能够存活下来的AI公司是具备一定自营基础的公司。存活方式是在企业经营理念中做加法和减法。

做减法往往就很痛苦,所以取舍的问题一直是企业经营过程中非常重要的问题。我们之前也经历过这样的阶段,当时我们坚定地做减法,聚焦擅长的领域做产业的深入,提供客户愿意买单的产品、技术或解决方案。

刚才刘总说了企业管理,企业管理是非常重要的,我们现在一直在提倡人均产值最大化,而不是通过广泛招人去提升整个公司的业务进度。 

刘铁锋:在资本寒冬中给企业带来了极大的挑战。在阿博茨看来有几个方面。

一,不能按照ToC的模式运营公司,这涉及到太多落地和实施的问题。想通过ToC的方式大量做规模、做标杆,是不太现实的。

二,不能用做ToC的心态做人工智能企业,目前技术的成熟度还没有达到标准化和应用化。现在还是偏向于定制化的服务,甚至于针对企业个性化的工作。

三,把握好公司的现金流,保持账面资金充裕让公司能够生存下去。 

总之,就经营一家企业,尤其是现阶段的人工智能行业来说,现在还不是一个追求快速爆发的时间点,而是追求能够活下去,熬到市场对人工智能的认知和需求达到一定程度的时间点。

我个人还是对这个领域非常有信心的。给大家举一个例子,我有一个做送餐机器人的朋友,已经做了十年的时间,一台机器价格原先的定价是12-15万,这个价格在当时是很难卖出去的。如今他转变了销售模式,每台机器人售价3000,这对于很多餐厅,特别是像火锅店这种重配重餐厅来说是很容易接受的,因为一名普通的服务员包吃包住的工资也在5000元左右。因为销售模式的转变,这家公司每个月的增长率都会增长15%。

这只是个很简单的例子,可能今天在这个领域里会出现机器成本小于人工成本的情况,未来随着这些领域做的越来越深,还会有成本更低,效率更高的例子出来。

尤頔:时间有限,虽然还有很多话题可聊但今天的圆桌讨论就先到这里了,让我们再次感谢四位嘉宾为我们带来的精彩分享,期待还有机会与各位沟通交流,谢谢。