人工智能

AI进入商业落地期,获深创投亿元融资的捷通华声有哪些新战略?

老骥伏枥,志在千里

2018年11月24日
调研 | 李喆 刘馥亮 撰写 | 刘馥亮
  • 人工智能
  • AI通用技术

20186月,定位全方位人工智能技术和服务提供商的捷通华声退出新三板。

20189月底,捷通华声获得深创投领投的亿元级别新一轮融资。

这家连续多年盈利的老牌AI公司,在短短三个月内的多个大动作,反映出公司的哪些战略动向?又揭示出人工智能行业的哪些新趋势?

十项全能五大产品线

捷通华声的技术研发,主要会经历算法开发-产品封装(引擎化)-场景应用三个阶段,而从OCR识别技术开始,捷通华声已掌握语音识别、人脸识别、语义理解等12项核心技术。

具备12项核心技术,捷通华声可以将技术进行组合,最大范围地满足最广泛客户的需求。比如智能客服,即需要将语音识别、语音合成和NLP进行组合,封装成解决方案以服务客户。

技术和产品的多元、覆盖全,既使得捷通华声可以赋能百业,也带来了四面树敌,在各个细分技术领域,都有专注的玩家,这也使得捷通华声要面对各个细分的强有力竞争。为此,在过去的一年里,捷通华声组织了精兵团队在语音、语义等几项核心技术方向的攻关,同时也对产品线进行了调整,调整后聚焦于五大产品线。

五大产品线分别是:云服务、物联网、能力平台、行业解决方案(智能客服)、行业应用系统。其中,云服务面向开发者,能力平台则是将各项技术以公有云的方式供企业客户调用,行业应用系统侧重于以私有云方式提供完整产品,智能客服作为解决方案及产品则是捷通华声深耕行业多年的优势领域,物联网则是下一步将会发力的方向。

捷通华声董事长张连毅认为,智能音箱的火热,反映出AI开始在物联网领域的应用落地开始兴起,音箱是第一个热点,未来将会有更多落地,比如智能电视等,人与电视的交互比音箱高很多,因此捷通华声需要在物联网领域加大投入和布局。

捷通华声过去多年都保持正利润,2017年合同额突破亿元大关。董事长张连毅透露,捷通华声开始对利润的执念进行反思,在行业快速增长期,固守正利润会导致投入不充分、错失产业良机,因此,捷通华声后续将对重点领域、重点技术增加投入,继续加强和拓宽核心竞争力。

近期,爱分析专访捷通华声董事长张连毅,就公司的业务进展和战略变化进行交流,分享如下:

爱分析:从上次20171月访谈,到现在近2年时间,捷通华声有哪些比较大的变化?

张连毅:现在人工智能不如之前那么火了,我们认为人工智能还有很长的路要走,所以捷通这两年在苦练内功。

公司团队规模也有所扩大,企业管理也需要加强,包括企业内部建设,包括人才的引进。同时我们对产品线进行了一次梳理,梳理出了五条线,云服务、物联网、全智能能力平台、行业级解决方案、行业应用系统。在市场方面,仍旧是坚持赋能百业。

爱分析:之前物联网是没有单独列出来作为一条产品线?

张连毅:物联网我们一直在做,捷通跟其它家不太一样,就是我们坚持全方位人工智能技术,我们提供的核心技术达12项,像语音合成、语义理解和麦克风阵列,这些本来就是物联网的核心技术。

过去捷通可能是在智能客服领域做的多一些,下一步也会往物联网多一些发力。

爱分析:物联网领域要多发力,是基于什么样的判断?

张连毅:智能音箱是物联网领域的一个引爆点,让大家觉得,在家庭场景下能有这么好玩的东西,但价值多高,现在下定论还为时尚早。

但在家里面,音箱是个很不起眼的东西,他作为引爆点的地位是确定的,但大家肯定还在寻找物联网领域更大的机会。电视、机顶盒、冰箱等等,捷通很关注电视,因为电视是家庭里面交互最频繁的一个;除了电视,车载和机器人我们也关注。

我们关注和发力,也是与行业里的优秀企业合作,我们不会自己造音箱、造电视。

爱分析:赋能百业具体在落地层面怎么实现?

张连毅:我们这个提法不是宣传的口号,是真的落到实地。每个行业都有非常优秀的企业,而且是浸淫行业很多年,捷通就三百号人,很难通过自己的人去真正深刻理解那么多行业,所以我们的做法就是提供能力,帮助各个行业里的优秀企业使用和应用人工智能技术。

捷通华声会更加专注在能力提供上,比如语音识别,在各行各业应用场景基本相同,所以我们将技术提供给合作伙伴,他们在自己的行业去训练去应用。

爱分析:捷通华声的12项核心技术,每一项技术从开始到最后服务客户需要经过哪些流程?

张连毅:首先是算法,之后是引擎化,就是封装成产品,最后要在行业里去磨合,总结起来就是技术研究,产品开发,落地应用,基本就这三个环节。

爱分析:算法训练阶段,数据如何获取?

张连毅:数据采集主要是云服务可以采集到一部分,其次是自己制作,然后是购买,主要是这三种方式。

爱分析:产品线里有一个是行业应用系统,现在有聚焦的行业吗?

张连毅:我们技术多,服务的客户也多。从重点客户来看,医疗、教育、政务、金融、电信、交通这些是我们重点服务的行业客户。

捷通华声服务的行业还是挺多的。捷通华声在布局的时候,很早之前,从商业的角度就在思考如何避开巨头的打压。布局的行业比较多,希望避免某一个行业的波动对公司造成的压力,这是有利的一个方面,另一个方面就是各个细分方向都会遇到一些很专注的友商的竞争,也算是有利有弊。

我们原来是十大产品,现在调整为五条产品线,也是在走向相对聚焦;但从服务的客户来看,我们做的行业仍然算是多的,这也是为了落实我们赋能百业的战略的。

爱分析:怎么判断一个行业或某一个业务场景,有比较大的市场潜力?

张连毅:大的层面上讲,我觉得每个行业都有机会。但会受制于两点,一个是大众对人工智能过高的期待或过低的认知,现在是过高期待的多一些,比如语音客服,希望你什么都能回答,比如无人驾驶可能也有这方面的倾向。期待过高,其实不利于推广。

另一个是必须结合场景,比如做流水线上,可能是工业机器人,但工业机器人也受制于整个流水线、流程的能力,不是单单一个机器人就可以,是相辅相成的。

就我们所做的来讲,我们会觉得人与人的交流,或者是机器服务人的地方,人工智能会有比较多的落地场景,人与人的交流比如语音识别、语音合成;机器服务人比如智能家居。

爱分析:语音和语义,现在还没找到爆发性的场景,原因可能是什么?

张连毅:语音是一种交流的工具,比如语音合成,很难说谁的声音更好听,在应用上,确实大家都在找爆发点,但也可能它就是这样,渗透在语言交流的各个地方,智能外呼、语音导航,每个手机都有语音助手,其实大家在寻找爆发点的过程中,智能语音已经应用的很普遍了。

因此在我看来,它已经爆发了,只是不像图像识别那样的场景来钱多。人脸识别是因为安防这样特定的需求,找到了一个爆炸应用点,但语音语义确实没想到有什么场景是这样类似的,世界上最大的语音公司是Nuance,探索几十年了也没找到,回归人的本源,它可能就是一种模仿人能听会说、认识理解世界的能力而已。

爱分析:捷通华声将能力提供给合作伙伴的具体形式有哪些?

张连毅:一般两种模式,一种是合作伙伴产品整合能力强,或者是应用解决方案能力比较强,我们就把能力产品直接给到他;另一种是业务场景的需求比较高,比如对识别度的要求,用户交互自然度的要求,那我们就会配合合作伙伴去做深度的定制,这种深度定制必须跟他的产品融合。

爱分析:不同行业的客户做选择能力和解决方案上有什么差异吗?

张连毅:跟行业的IT化水平有一定关系,比如金融电信行业,有挺强大的研发中心,也越来越多在组建人工智能研究中心,他们对人工智能虽然可能是还需要一些沉淀,现阶段更多的是拿你的能力来用,同时也在学习,但他们的实力非常强。

选择上的差异,更多的还是跟企业自身水平有关系。但一个大的趋势是,原来更多的企业是要整套解决方案,最近一年来很多客户就是要能力,自己去整合,证明企业的应用或者整合应用人工智能能力的水平在增强。

爱分析:做行业应用的时候,给企业除了提供私有云平台,还会做哪些事情?

张连毅:在两个点上,一个是物联网,比如智能电视,我们提供能力的同时也会参与做交互;另一个是智能客服,我们会形成整套解决方案。其它的都是支持合作伙伴,我们作为能力提供者。

爱分析:这个交互主具体是指哪些方面?

张连毅:主要是语音交互,也包括文字交互。如果是在物联网领域,交互还涉及到麦克风阵列这样的硬件,客服领域就不需要麦阵了。

爱分析:公有云的形式可能会按调取量收费,私有云的如何收费?

张连毅:我们一般是按线程,比如一个语音识别线程可以服务几个客服机器人;另一种是按数量,比如手写识别,这个就没有线程的概念,我们是按license收费。主导的收费模式还是按线程。

爱分析:公司团队构成大概是怎样的?

张连毅:我们大概分研发中心,产品中心,支持中心。研发中心负责算法,有70多人;产品中心就是负责产品化和五大产品线,有一百多人;支持中心就是做部署实施和服务,有七八十人。其余就是市场营销等。