人工智能

图灵机器人俞志晨:机器人市场先硬后软,最早2018年爆发

关于当前人工智能和机器人市场的真相,都在这儿了。

2017年01月22日
指导 | 凯文 撰写 | 京京
  • 人工智能
  • 人机交互
  • 操作系统
  • 机器人客服
  • 服务机器人

机器人作为人工智能和硬件的集大成者,无论在工业、商业还是消费级领域,都有望在未来几十年中扮演重要角色。

相比起步较早的工业机器人,家用和商用服务机器人近两年才逐渐兴起。背后的推动力量除了人工智能技术的发展,还有相关硬件及控制系统成本的下降。

然而,无论是商用还是家用机器人,市场销售情况并不乐观,哪怕拥有语音、视觉交互、对话问答、运动控制等一系列酷炫的AI功能,在实际使用中仍然饱受诟病。与此同时,这一领域因前景广阔,又吸引着越来越多的创业者和投资人进入,甚至催生了数家估值超1亿美金的创业公司。

那么,这块满载期望的市场如今发展到了什么阶段,存在哪些问题,又将何时爆发呢?

近期,爱分析对图灵机器人创始人兼CEO俞志晨进行了访谈,探讨了当前机器人市场存在的普遍问题,关于市场发展趋势的预测,以及对当前国内AI领域创业形势的看法。

俞志晨2003年毕业于北京交通大学应用数学系,后师承知名人工智能专家贺仲雄教授。2010年,他创建北京光年无限,在移动互联网兴起的浪潮中推出虫洞语音助手。2014年底,公司发布图灵机器人开放平台,提供中文语义分析、对话和问答技术服务,一年后,又推出全球首个人工智能机器人操作系统Turing OS。如今,图灵机器人开放平台拥有数十万开发者,在智能家居、智能车载、智能客服等领域都有广泛应用。

爱分析节选部分精彩内容,与您分享。 

机器人市场先硬后软,爆发须待产业链成熟

Q:一个机器人整机的实现方式是怎样的?

A:从整个结构来看,每家做的方式会不一样。简单的话,会从整机的角度去考虑,先做集成,然后要什么加什么;有的公司一开始就认为,机器人应该是这个样子,所以会重新定义机器人的结构和整个逻辑。

这两种方式一个是从外到内的设计,基于功能来实现整个产品的结构框架,一个是从里到外的设计,重新定义一种新的结构来做出新产品。

Q:很多机器人厂商使用安卓系统,机器人操作系统相比安卓系统有哪些优势?

A:从PC到智能手机再到机器人,无论是使用场景还是使用方式,都是完全不一样的。

从使用方式上看,机器人的交互方式对屏幕的弱化会更明显一些,它更多地依赖于环境感知、语音、视觉等方式来进行交互。这种交互方式与PC的键盘鼠标、手机的多点触控存在很大不同。

从使用场景上看,手机很多时候是随身携带的,而且是手持状态。但机器人通常是一种远距离、非接触的交互方式,这种方式导致它的性能、功耗处理能力、以及交互框架都很不一样。

现在一些机器人厂商使用安卓系统,是因为它便宜、成本低,而且安卓整个产业链比较成熟,而机器人产业链现在还处于一个从零开始的状态。

就像一开始很多智能手机也用的是Windows、Linux等PC操作系统,当然也有Mobile OS,后来才有了全新的iOS和安卓系统。PC和手机的系统看起来没有太大区别,但是我们很难把Windows从PC挪到手机上。所以我认为机器人一定会有这样一个早期阶段,在这个阶段很多人还是会使用之前传统的操作系统。

Q:那您认为到什么时候机器人操作系统才能成为主流?

A:首先需要硬件先发展起来。如果一个产业硬件还没有的话,它根本不需要系统,所以第一步肯定是要把硬件、整机先做起来。目前像Rokid、优必选、ROOBO等一些机器人公司都是在做硬件。硬件起来之后,才会有系统和应用的机会。

如果从整个机器人市场发展来看,我估计至少要等到2018年之后,整个硬件基本上达到至少60-70分的水平,才会有系统和应用的普及和爆发。

Q:图灵合作了很多机器人厂商,您认为目前有哪些问题导致机器人市场还起不来?

A:目前机器人市场的整个基础设施能力、主要技术、以及产业链都还不成熟。

基础设施方面,包括机器人计算平台、一些底层算法以及系统硬件等基础架构都不成熟;

主要技术包括AI人机交互技术和运动控制系统。语音技术目前稍微成熟一点,视觉这块从商业化角度来讲基本不成熟,运动控制系统如果技术好的话价格比较贵,成本低的技术又不行,比如优必选把成本降下来了,但硬件在很多地方还不成熟。

另外产业链方面,一些相关的硬件还都很贵,比如稍微好点的激光雷达、传感器以及运动系统,都还很贵。

所以我认为接下来整个行业经过一两年的努力,一方面可以把技术成熟度提升到一定水平,另一方面产业链也会更加完善,成本大幅下降,硬件只要达到六七十分的及格分,系统和应用一块儿跟上,整个机器人市场就会爆发。

技术并非关键,工程化和产品体验才是最大挑战

Q:机器人操作系统等软件方面目前存在哪些难点?

A:我们从最开始单纯的语音交互和文字交互,到后来融合了一些视觉、表情等交互方式进去。其实更多地是从用户体验角度出发。事实上,表情识别、视觉交互,还有很多其他技术并不是特别难,难的地方在于怎么能够把体验做好,这是需要花很多工夫去做的。

Q:要在哪些方面努力,才能把体验做好呢?

A:要把体验做好,首先要对用户的产品行为进行分析,然后要达到某种效果,需要在整个硬件平台的工程化方面做很多工作。因为很多企业面临的都已经不是技术问题,而是技术本身的工程化问题。

Q:所以技术本身已经成熟了,但是工程化和体验还不成熟?

A: 我觉得技术分为好几个维度,比如核心算法,目前来看都还行,但是核心算法要做到比较好的工程化水平,难度其实会比单纯实现算法突破更大一些。然后要把体验做到最优化,才能达到比较理想的状态。比如要把自由聊天、知识和服务型问答做得更自然、更准确,用户用起来才会觉得舒服,体验才会好。

Q:自由聊天和问答在技术实现方式上是否存在不同?

A:嗯,聊天和问答,从整个技术实现框架和功能上来看,确实不一样,这是一个行业现状。不过我理解这只是目前的一个过渡阶段。因为从技术角度讲,现在没有更好的方式去实现它,所以在实际的工程化方面会把它们分开来做。但是从长期来看,它会达到一种比较理想的状态,因为两者本质是一样的。

另外从功能上看,对于用户来说,聊天和问答很多时候是合在一起的。比如当你跟机器人交互的时候,你肯定希望它在回答问题的同时,也能够和你去做一些日常的交流和互动。因为交流是机器人的一个最基本的属性,就跟人一样,要有说话交流的能力。除非不是机器人,比如音箱,你可能不一定会想跟一个音箱去聊天。好的机器人一定是能够让用户去做一些情感上的交流。

家用商用机器人目前较为鸡肋,产品智能性仍需提升

Q:如何看待商用和家庭服务机器人两块市场?哪一块会先起来?

A:现在无论是商用还是家用机器人,更多的还是一个鸡肋。

家用机器人大多会卖给儿童,因为儿童接受度更高一些,门槛也会相对较低。但是商用机器人其实门槛比较高,价格也比较贵,很多人买它只是一个噱头,实用性还不够。只不过现在大家比较看好机器人这个方向,所以热度很高。

要判断哪个先起来,得看是先起量,还是更成熟,不是说成熟了才能起量。

首先家用机器人量很大,这种量是有市场的,而且集中程度更高,所以起量会更快。而商用这一块量没有那么大。但是从它的性能来讲,接受度会更高一些。比如现在很多大机器人一台几万块钱,它肯定比几千块钱的东西好很多,小机器人的整个功能和硬件结构比较简单一些,甚至在很多人看来,那种东西还不叫机器人。但是从另一方面来讲,对于企业来说,要把之前老的系统换成新的,也的确需要时间。

Q:那么是需要技术再成熟一些吗?

A:对,包括技术和产业链都需要再成熟一些。

就像2013年的时候,很多人还是把语音交互更多地当成一个卖点和噱头,实际上那个时候的确是这样,14年也差不多。直到近一两年,整个智能语音交互,包括视觉交互,才开始在很多领域应用起来。

所以我觉得从行业发展来看,这一两年机器人的行业应用才刚开始,真正要到达一种比较好的状态,如果从2015年开始算,至少需要3、4年时间,也就是到2018-2020年之间,会有各种各样的机器人出来,包括商用的服务机器人,家用的儿童陪伴教育、老人陪伴、家庭管家机器人等等。

而且形态也会不断变化。比如优必选从最开始相对简单的两代产品,到现在也是在不断迭代。越往后,机器人的智能化程度会越来越高。

交互方式要从人性出发,高仿真机器人为理想状态

Q:如何看待家庭服务机器人市场各种形态的机器人?

A:我觉的要从两个角度去看,一个叫泛机器人化,就是很多传统硬件开始往智能机器人的方向去定义,无论是音箱、台灯、洗衣机、空调、微波炉,还是手机,都属于泛智能硬件领域,这些更多地会往大物联网方向去走。

相比之下,我更看好第二种方式,就是会有一个中央机器人,应用一整套智能化体系,其他设备只要联网就行,不用搞那么复杂。

当然,前期这两种方式都会有,但是往后来看,我认为会整个行业会倾向于往集中化的方向去做。

Q:所以您认为智能家电、智能硬件没必要去做太多的智能交互功能?或者说做机器人最好不要以传统家电的形式?

A:对,智能家电的话,浅交互还好,比如开机的语音交互,但是深度交互就会很奇怪。而且语音交互其实也没有必要,因为按一下按钮就行了,为什么非要用语音?语音有它的成本,而且效率比较低下。

交互最终解决的是一种效率问题,交互的变革给用户带来的是一种全新的、更加高效的体验和价值。任何一种交互方式都是本着便利的目的去做的,如果一件事情看起来很炫,但是把简单的事情复杂化了,我觉得其实没有必要,人不会为了适应一种交互方式去改变或者建立一种习惯。

这其实跟手机是一样的,我们已经习惯了触摸,哪怕语音已经实现了,Siri功能做得再好,我们还是不太习惯用语音。但机器人不一样,人对不同的产品会有不同的感觉,我们看到机器人就愿意跟它说话,看到别的东西就没有太多交流的欲望,这其实是人的一种本性。

Q:您认为理想的机器人交互方式是怎样的?

A:现在有很多单纯的文本交互和和语音交互,其实是有很多瓶颈的。就比如让我们俩面对面蒙着眼睛聊天,除了说话之外没有任何的手势和表情互动,这种方式其实很不自然。这也是目前产业界的现状,所以就依赖业界的公司不断推动技术和产品的进化。

原来的图灵测试就是纯文本的对话方式,因为那个时代的技术想象力就到这里。但实际上真正的人工智能是一套非常复杂的体系,就像《机械姬》里面类似于真人的机器人。我认为真正的图灵测试要去判别这样的机器人和人工智能,当然这个难度会比纯文本的难100倍以上。

首先,高度仿人机器人对硬件、材料要求都非常高,比如笑一下不能太僵硬,动一下不能有噪音等等。其次,软件方面,它要能够通过环境感知来判别和认知人事物。

所以我自己觉得文本化的图灵测试没有那么难,到2020年之前就可以做到,只要整个产业推动去做。但是高仿人机器人要通过图灵测试是非常难的,三五十年都不好说。

Q:高度仿人的机器人才是真正理想状态下的人工智能机器人吗?

A:对,可能做产业的话,大家都这么想。文本只是一个语言游戏,它其实很容易做到我们想要的效果。现在很多公司所谓的人工智能机器人,看起来非常惊艳,其实背后都是藏了一个人,或者一堆客服来回答,它也可以回答得很好。你跟机器人聊天,根本没办法知道它背后是人还是人工智能。

机器人客服可以解决七八成问题,成本不在技术

Q:现在所谓的机器人客服还是脱离不了人工吗?

A:对,每个客户、每家公司都有自己的知识库,如果算法搞不定,就会直接跳到人工客服,如果是文字的,就直接返回文字,如果是语音的,人工客服回答完,再用语音合成(类似于变声)发过去。

Q:现在云客服市场也在逐渐往AI转,您觉得机器人替代人工的可能性有多大?

A: 很大。纯粹的取代不好说,但是确实可以取代一些基础的问答,当然这肯定要有一个过程。

Q:现在整个客服市场多大比例依赖人工,多大比例机器人可以解决?

A:这个每家都不一样。有些纯粹作秀的,百分百人工,就像之前交行的交交机器人,看起来很酷炫,其实背后是真人在回答。当然从整个行业来看,70%-80%的问题机器人是可以解决的,包括语音和文本。

Q:也就是说,现在垂直场景机器人客服做起来是相对容易的?

A:相对来说会容易很多,但是要看你用什么标准去衡量它。比如我们认为能够商业化是一个很强的分水岭,有时候技术可能真的不是最重要的,商业化产品质量才是。比如你至少要保证95%以上的准确率,如果出错太多,一直有人投诉,处理投诉的成本比用这套东西的成本还高的话,客户就不会买账了。

Q:但是为什么在实际客服行业中,机器人客服比例没那么高?

A:对,从技术角度讲,机器人客服门槛和成本还是比较低的,但是业务成本会很高。比如,如果我要帮你做客服,我得把你们公司的业务全部分析一遍,包括流程、业务分类、分析和处理,这些成本是很高的,技术本身成本并不高。

AI高估值有市场因素,投资人愿意为好公司出高价

Q:如何看待当前AI类创业公司的高估值?

A:这件事情可以这么理解:

首先,现在市场上不缺钱;其次,投资人确实在找比较靠谱的好公司,他们愿意为好公司出钱,哪怕贵一点。不好的东西哪怕再便宜他们也不愿意买。

所以我觉得大家可能就是这种心态,认为这个领域确实是个很好的机会,无论是AI也好,机器人也好,其实好公司没几家,而这些好公司又确实有实力,所以对于真正好的公司,投资人还是愿意去花这个钱去赌一把。

Q:从您接触过的投资人来看,您觉得他们如何判断AI领域公司的好坏?

A:投资是有个人喜好在里面的。所谓的技术实力,就看你怎么看了。有人觉得中国所谓的技术公司并没有什么技术实力,因为都是用的国外技术,包括一些专家、教授出来创业,用的也都是国外开源的东西,只是有人做得早而已。

这一领域不像互联网,中国公司互联网方面基本都是偏上层应用,BAT也好,360、滴滴也好,都属于上层应用,底层技术方面中国公司是没有的。

但是到AI领域,全是底层的技术公司,因为如果底层技术没有出来,做上层应用是没有意义的。而国外做底层技术的公司,无论是谷歌、微软还是IBM,在中国又没有太大影响力。所以也给了中国公司很多机会去做。

Q:科技巨头进军AI会不会对创业公司造成一些影响?

A:我觉得应该是利大于弊。因为这个领域跟互联网还不太一样。首先,肯定要有一帮人去撑这个市场,如果只有一两家在做,做起来会很累,有人帮你教育市场的话,就会省事很多。当然自己肯定得能活到最后。