人工智能

AI落地产业,要越过哪些坑?

挑战与应对

2019年12月21日
撰写 | 黄勇
  • 人工智能

在即将过去的2019年,人工智能经历了明显的泡沫降温,进入了技术成熟度曲线的低谷期。行业开始回归理性,更多地关注产业落地场景,而淡化对实验室算法准确度的比拼。

这一方面是由于计算机视觉、智能语音、自然语言处理等人工智能通用技术走向成熟,纯算法技术层面的比拼缺乏进一步的想象空间。另外,智能驾驶等前沿场景遇到了阶段性挫折。

另一方面,随着产业数字化带来的数据基础的日益成熟,人工智能在落地安防、金融、广告营销等行业的过程中,正在带来显著的效益。传统企业已经充分认可人工智能的应用价值,开始在实际业务场景规模化地引入相关技术。

然而,在深入产业落地的过程中,人工智能技术与企业需求之间仍然存在鸿沟。

企业用户的核心目标是利用人工智能技术达成业务目标,而人工智能技术本身无法直接解决业务需求,需要根据复杂的业务场景和目标,融合多种技术能力和业务知识,形成可规模化落地的产品和服务。在此过程中,人工智能在数据、算法、行业know-how、服务方式、ROI等方面都面临新的挑战。

人工智能助力企业数字化转型的三个价值层次

企业数字化转型正在走向深入。从信息化走向在线化、智能化的过程中,随着数据量的增长和业务场景复杂度的提升,企业必然需要应用人工智能技术。具体而言,人工智能助力企业数字化转型的价值分为自动化、智能化、创新化三个层次。

自动化,是依靠计算机视觉、智能语音等感知技术提升业务自动化程度,并不改变原有业务流程,而由机器替代人来自动执行业务流程,从而提升效率,降低成本。典型的场景,例如工业机器人取代工人进行分拣、组装等重复性劳动;医学影像领域,人工智能系统辅助阅片,提升医生诊断效率;广告营销领域的程序化广告投放等。

智能化,是基于机器学习、知识图谱等技术,让机器具备感知分析和决策能力,可以完成人力无法实现的工作,对业务流程进行改造,创造增量价值。例如在安防领域,基于行业知识图谱技术在几亿个实体中寻找隐性关系,发现团伙作案的行为,人力无法处理如此大数据量的分析。零售领域,基于门店历史销售数据,通过机器学习构建销量预测模型,实现销量预测,实现远高于依靠经验预测的准确度,降低库存和损耗。

创新化,是人工智能与行业深度融合后重塑业务流程和产业链,形成新的商业模式甚至新的细分行业。例如,基于计算机视觉的智能货柜,相比传统机械式无人售货机成本下降50%以上,容纳更多商品种类。无人驾驶是未来最具备创新潜力的人工智能落地方向,一旦无人驾驶技术成熟,传统汽车行业从主机厂到用车场景的产业链关系将被颠覆。

人工智能落地面临的挑战

从自动化到智能化和创新化,人工智能创造的价值在不断增长。同时,业务场景的复杂度也在不断提升,为人工智能技术的落地带来一系列挑战。

1.数据

数据是人工智能的基础要素,要把人工智能应用到业务当中,首先需要解决数据获取和数据治理问题。

在人脸识别等单点场景,涉及到的数据类型一般比较简单。但在更完整的业务场景中,需要采集和分析的数据会变得更加复杂,往往涉及到多源异构数据、时序数据等,数据存储和治理的难度大幅提升。例如,在工业场景,就涉及到工业现场图像数据、工艺流程文本数据和设备运行的时序数据等。

面对数据治理的挑战,需要新的数据治理手段。目前,比较成熟的手段是用大数据湖的模式,同时兼顾结构化数据和非结构化数据的处理,并可以实现更低成本的存储,更好地支撑人工智能算法的数据调用。

此外,数据使用合规的挑战也日益突出。一方面,涉及到个人隐私方面的数据保护政策趋严,对数据的使用需要更加关注安全问题。另一方面,涉及到数据的归属权问题,出于数据安全的考虑,归属于不同主体的数据往往很难实现流动和融合打通。这些因素,会限制人工智能对于数据的使用。

对于数据归属权限制的问题,目前的应对策略之一是采用联邦学习等新技术,在底层数据不进行交换的前提下进行加密训练,可以实现联合建模,并保护数据隐私。

另外,在模型训练前的数据标注环节,随着建模不断深入垂直行业的细分业务场景,数据标注的复杂度提升,要求标注人员掌握更复杂的行业知识,进一步提升了数据标注的门槛和成本。例如,医疗领域对医疗影像和文本的标注,需要具备医学专业知识的人员进行。从数据类型来看,文本类、3D图像类数据不断增加,标注复杂度高于早期的平面图像类数据。

在数据标注方面,可以看到一些第三方的数据标注平台正在兴起。第三方数据标注平台一方面通过受培训的专业团队和定制化的服务,来解决数据采集、数据标注的质量和成本问题;另一方面,也通过研发一些自动化的辅助工具,通过技术手段来提升数据标注流程的效率。

2.算法模型

在算法模型层面,人工智能在与业务系统结合的过程中面临的挑战是模型的可解释性问题。从原理上,大部分基于深度学习的算法是个“黑盒子”,模型不具备可解释性。然而,在落地金融、工业、医疗等行业的生产环境时,出于安全风险控制、监管合规等因素考虑,直接应用到业务系统的模型需要具备符合业务逻辑的可解释性,让业务人员和决策者、监管层能够理解,否则将难以落地。

正因如此,“可解释AI”被称为人工智能的圣杯,日益受到行业关注。实际落地中,可以采用深度学习算法与经典统计类规则结合的方式来进行建模,来解决模型可解释性问题。

例如,芯盾时代针对金融的反欺诈场景研发的反欺诈引擎,其智能决策环节由两部分组成:一部分是规则引擎,是基于100多个金融业务风险场景建立的上千组反欺诈规则和模型;另外一部分是无监督机器学习引擎。两者结合,共同构建智能的反欺诈系统,适应金融客户的需求。

3.行业know-how

从理解业务需求到建模分析,行业know-how是人工智能赋能业务的前提和必备能力。随着人工智能从感知走向认知,要解决的业务问题从单个业务场景、单点问题,向业务全流程演进,行业know-how的复杂度和壁垒变得更高,给技术驱动的人工智能服务商带来更大的挑战。

在这样的背景下,单纯依靠业务经验积累难以解决行业know-how不足的问题,人工智能算法与专家经验和业务规则结合的重要性凸显,知识图谱技术成为重要的解决方案。先通过建立统一的知识图谱来实现知识融合,再进一步推进人工智能的快速落地应用,是解决行业know-how问题的比较可行的方式。

4.服务方式

人工智能落地过程中,还需要考虑服务方式的问题。企业用户的需求是实现具体的业务目标,并保证系统持续运营,而且传统企业往往不具备很强的技术能力。

因此,标准化的人工智能技术产品或者API输出的模式,无法解决业务人员的最终需求,而是需要根据具体业务场景提供定制化的解决方案,并封装成可直接应用到业务系统的产品,需要“AI+产品”。此外,甚至还需要提供持续的业务运营服务,以保证最终业务效果的达成,需要“AI+服务”。

另一方面,人工智能服务商也需要考虑自身业务模式的问题,避免过于定制化和重服务。例如,可以通过中台化的方式赋能前端业务人员,共同为客户解决业务问题。中台层把各项通用能力都中台化,基于中台支撑赋能前端人员去服务客户的业务运营,共同推动解决方案的落地和业务目标的达成。

5.ROI

目前,企业用户投入人工智能应用仍然会面临成本过高的问题。一方面,涉及到芯片等硬件在内的智能化产品成本仍然较高。另一方面,人工智能应用对专业人员的依赖非常大,而算法工程师等人工智能人才的成本也很高。这导致对于某些行业而言,ROI成为限制人工智能应用规模化落地的最大阻碍。

在成本方面,可以看到数据科学平台等产品的涌现,正在提升人工智能建模的自动化程度。数据科学平台可以在数据准备、模型建立、决策部署、模型管理等方面实现自动化,降低整个业务流程对算法工程师的依赖,从而降低人工智能应用的成本。此外,未来我们还会看到算法的进步和人工智能芯片成本的下降。

关于人工智能落地产业更深入解读和案例展示,我们将在即将发布的《爱分析·中国人工智能行业报告》中呈现,敬请期待。