人工智能

“国产Atlas”出现了,这两大商业化方向靠谱吗?

据说Rokid创始人Misa投了这家公司。

2017年03月07日
指导 | 凯文 撰写 | 京京
  • 人工智能
  • 仿人机器人
  • 科研机器人
  • 双足机器人

前不久,波士顿动力(BD)公布了进化版Atlas——轮腿式机器人Handle,灵活的双腿和双轮在地上旋转、跳跃,俨然一位花样滑冰运动员。

老东家从谷歌换成丰田,丝毫没有影响BD对双足机器人的探索热情。不过,从目前情况来看,这家黑科技公司似乎并没有考虑谷歌当初提出的一些产品化策略,比如消除噪音,降低成本,适合量产等,而是继续在军用方向发力。

同为双足人形机器人的本田ASIMO如今已经十多岁了,不仅四肢灵活,而且在感知、交互等方面越来越智能。不过同样由于价格昂贵,目前也只是小范围地用于娱乐、教育、接待等。

被软银收购的法国机器人公司Aldebaran研发的人形机器人NAO虽然在科研领域广受欢迎,但由于体型较小,因此并不能完全满足高校需求。而如今随着团队重心转向Pepper,原有产品似乎进展颇慢。

国内也有人形机器人公司,但无论是优必选Alpha,还是亮相CES 2017的Talos,都是小型机器人。双足大仿人机器人的风头一直被国外公司和研究机构占据,国内鲜有动静。

一方面,由于这类机器人研发难度大,对于高校老师来说,做几年都难出成果,还影响评职称,因此更多由学生来做,但成熟度方面也就有所欠缺。另外随着学生离校,项目无法持续积累,会呈现大幅波动状态,因而影响科研成果转化。

另一方面,由于双足人形机器人尚不成熟,对技术要求高,前期研发投入巨大,且缺乏明确的商业化方向,因此也很少有公司选择这一领域进行创业。

不过,在自动化和机器人领域钻研多年的张锐,敏锐地嗅到了双足人形机器人短期内可以落地的两大方向——科研院校和科技馆。

看准两大痛点,钢铁侠科技诞生

张锐是自动化专业出身,毕业后在北航无人机所做了一年军用无人机后,去了中科院自动化所做复杂系统建模研究,而后又到航天五院从事嫦娥卫星研发工作,参与过无人机、机器人、航空航天等多个领域研发工作。

由于长期从事科研工作,张锐对科研领域的需求有着敏锐洞察。

他发现,科研院校对人形机器人有着明确需求。在市场上没有出现类似产品之前,高校会自己研发,但成本巨大,一般需要过亿科研经费。而且全国很多计算机系、自动化系、人工智能方向的老师,更擅长算法,而并不擅长做机器人本体。与其花上亿元制作,不如直接购买机器人成品来得划算。

另外,高校也是科技馆机器人的主要采购来源,但一般价格高达千万,而且由于大多出自学生之手,因此一旦出了问题,高校无法保证维修,科技馆只能报废。

看准了这两大痛点,2015年,年仅26岁的张锐联合其大学同学兼老乡庄园,以及几位同学同事,共同创立了钢铁侠科技。计算机专业出身的庄园,毕业后进入了互联网领域,先后在UC浏览器、新浪微博、创新工场任产品经理。两人一人主抓技术,一人主抓产品商务,逐步构建起了将近20人的精悍技术团队,成员大都来自中科院、航空航天院所以及外企资深工程师,拥有大量科研经验和硬件技术实力。

由于成立之初便得到了一些高校老师的支持,因此钢铁侠科技前期并没有在融资方面花费过多时间,而是专注产品研发。

2016年3月,第一代原型机研发成功。同年11月,公司获得千万元Pre-A轮融资。一年后的1月中旬,第二代产品组装成功,不仅加上了酷炫的外观,还大幅优化了底层设计,自主研发了大量核心零部件,形成了完整的自主知识产权。

图:钢铁侠科技第二代机器人产品

专注硬件和控制算法,自主研发零部件降低成本

按照学界定义,智能机器人应该具备感知、交互、决策、控制四大功能,而对于双足大仿人机器人来说,核心难点在于环境感知、步态控制等环节。钢铁侠科技主要解决这两大难点,相当于做了机器人的小脑,高校可以在此基础上去做交互、决策层面的二次开发。

钢铁侠科技采用自主研发的姿态传感器、力矩反馈传感器、避障传感器,配合摄像头及力觉模块,可以实现机器人自主导航和步态规划,同时结合“运动脑”中的软件算法和控制程序,满足运动过程中的平衡控制。在这些硬件中,除了摄像头可以直接从外面采购,其他能够适配大人形机器人的传感器比较少见,因此大多由团队自主研发,并交给代工厂生产。

由于钢铁侠科技的机器人产品更多是直接面向用户,因此解决噪音问题尤为重要。不同于Atlas高噪音、高功耗的液压方案,钢铁侠科技采用自主研发的全套电机方案,不仅无噪音,而且可以自由调节行走速度。

此外,Atlas的高昂成本主要由于其零件设计不规则,金属架需要3D打印定制,而支持3D打印的金属粉末本身成本高昂,因此整体成本巨大,售价高达数百万美元。 而钢铁侠科技选择自主设计零部件,交给厂家代工生产,而且主要是合金材料,成本大幅降低。

在供电方面,钢铁侠科技采用特别定制的电池,续航时间长达4小时,比NAO等小人形机器人续航时间高出三倍左右。

而操作系统方面,由于机器人本体上分布有大量传感器、电机、控制器等,需要一套通信机制,因此钢铁侠科技采用了机器人专用操作系统ROS,并对系统内核做了大幅优化。

张锐表示,单从硬件成本来看,一些腿部结构件和采购来的传感器成本较高,其他成本并不高。整个产品最大的核心价值还在于知识含量。由于这是国内大人形机器人的首创,因此团队也申请了包括机械器件、电子器件、算法层面等在内的多项专利。

短期瞄准科研和科技馆市场,未来应用到更多领域

当前,整个服务机器人市场都处于产业化早期,无论是深入到具体行业,还是进入每个家庭,都不具备大规模应用条件。尤其是双足大仿人机器人技术门槛高,各方面技术尚不成熟,因此只能根据市场发展阶段,逐步实现商业化。

由于科研机构和科技馆主要用于研发和展示,因此对产品功能实用性要求不高,而且需求旺盛,单次需求量不大,且对价格不敏感,无疑是现阶段大人形双足机器人最合适的落地方向。

对于高校来说,钢铁侠科技保证其机器人具备良好的运动控制能力,高校购买之后可根据自己的课题方向进行二次开发,培养机器人知识储备。目前,国内有相关研发需求的高校大概有2000多所,而且同一所高校的不同院系,包括计算机系、自动化系、机械系等,在科研和教学方面对人形机器人都有需求。此外,国家政策鼓励高校成立机器人专业、机器人学院,也有利于这一市场的需求扩大。

科技馆方面,全国有大大小小2000多家科技馆,对双足人形机器人产品也有旺盛需求。由于科技馆主要来自财政拨款,因此资金充裕,相比高校,购买力更强一些。为了满足科技馆展示要求,钢铁侠科技不仅会对机器人外观进行优化,还专门定制了一些个性化功能,包括平地行走、转弯、爬楼梯、开门、拎包之类。而对于科技馆而言,这样的双足大仿人机器人无疑可以吸引更多客流。

据张锐介绍,钢铁侠科技二代机器人产品售价几百万一台,已经接到了来自部分高校和科技馆的预订单,出货量大概在10台左右。由于机器人零部件需要找代工厂加工,然后由团队技术人员亲自组装、检测,因此,产品供货还需三、四个月左右。

对于未来,张锐也有一些长远考虑,等双足人形机器人成熟之后,他们也会考虑跟一些行业公司合作,将产品用于商场、养老院等不同场景。

张锐表示,目前大人形双足机器人在运动平衡、视觉导航方面都不成熟,但视觉公司已经很多,运动控制公司还相对较少,钢铁侠科技的目标就是将人形双足机器人运动控制功能做精做深,成为行业内一家不可替代的公司。

图:钢铁侠科技CEO张锐

近期,爱分析对钢铁侠科技CEO张锐进行了调研访谈,现将精彩内容摘录如下。

Q:为什么选择做双足大仿人机器人?

A:首先,这块没有大公司在做,因此任何一个大公司对我们都不构成威胁。而且中国的大公司除了一些传统行业、地产之类,都是互联网公司,互联网公司在软件方面很擅长,但是在机械运动控制方面是软肋,这方面更多的人才还是集中在航空航天领域。所以相对来讲,我们来做会更占优势一些。其次,现有环境多是按照人的生活环境设计的,仿人机器人在人机交互领域更有优势。最后,双足大仿人机器人在技术方面非常具有挑战性,我们有这样的技术实力去做,能够形成一定的壁垒。

Q:两代产品研发周期分别多久?

A:一代产品半年左右,二代产品大概9个月。不过一代机器人只做了机器人的双腿,二代是一个完整的机器人,同时加上了机器人的外观,包括一些结构、电路、算法都是重新设计和开发。

Q:咱们的机器人产品核心技术是哪块?

A:主要是两大块,一块是机器人本体设计,还有一块就是我们做的机器人“运动脑”。

本体这块,我们的机器人跟ASIMO一样是130cm高,而且相比一些高校自己做的大机器人来说,有更高的灵活度和机电一体化程度。

“运动脑”是控制机器人运动和平衡的一些软件算法和控制程序,相当于人的小脑。我们的机器人有很好的运动和平衡控制能力,就得益于我们这些算法和控制程序。

Q:咱们的机器人可以自主学习吗?

A:我们的机器人在软件方面就设计的是让它可以自主学习。

它会积累自身的一些状态,比如走过一个地形,机器人的传感器会记住相应的参数,再走另一个地形时,可能跟前一个地形略有不同,但是从传感器返回的数据来看是相同的,机器人就会把这两种地形归为平地运动。再比如爬楼梯,机器人会知道一步有多宽,之后再去爬香山时,遇到一级一级的台阶,传感器返回数据后,机器人就会知道那个状态,从而用爬台阶的算法去适用爬山。

所以只要让机器人在实际的环境中,去做这些动作,它都会记住。相比人来说,机器人所记忆的环境更精细一些,因为它是完全量化的。未来机器人如果应用到各行各业,它们就有机会在特定领域进行长时间学习,时间长了就会越来越强。而且这个学习过程不需要人在现场,一切都靠数据。

Q:视觉方面是自己做还是外接的技术?

A:自己做,因为视觉跟机器人导航相关,机器人在行走过程中需要知道自己在什么地方,要往哪走。现在这块技术门槛已经没有那么高了。国内有很多专门做视觉的公司,但是不一定是针对机器人的。

拿我们的机器人来说,摄像头是装在机器人身上的,到底往前走到什么程度,我们自己是知道的,然后再结合视觉部分去做融合,相对来讲会更精准一些。如果单独拿一个摄像头算法装在机器人身上,是不准确的,因为参考点都变了。原本是在固定这个点下做的视觉,现在跑到另一个点,算法本身就不一样了。

Q:机器人行走需要像无人车一样实地测试积累数据来优化算法吗?

A:无人车主要靠视觉去做导航。但我们的机器人是有很多传感器的,当然也包括摄像头。但是我们给机器人装视觉的目的不是为了验证算法,而是为了给它做导航。无人车要识别路在哪里,我们是要识别地形是怎样的、怎么走,我们现在已经给机器人做了三种地形:平地、斜坡、台阶,其他地形也正在做。

Q:Atlas受力反应特别强,他们是如何做到的?

A:机器人的核心在于三大部分:感知、决策、执行。

首先,感知方面,有些传感器能检测到力与力矩的变化,还有一些姿态的变化;

其次,决策方面,也就是算法层,能够让机器人知道该做出什么样的反应;

最后,执行方面,就是机器人能够按照决策结果以最快的速度对动作做出响应;

波士顿动力在这三方面都做得很好,所以整个受力反应特别强。我们目前正在做一项新的算法研究,计划让我们的机器人在受力反应方面也拥有超乎常人的能力。

Q:您如何看待Atlas这类机器人未来的商业化方向?

A:波士顿动力首先没有想要商业化的想法,因为他们不缺资金,他们有美国军方支持,所以不算是商业公司,不着急卖产品。从全球范围来看,双足大仿人机器人都处在一个技术不断成熟的阶段,因此面向行业或消费者的商业化还比较远。

Q:NAO机器人目前在国内高校市场占有率如何?会不会与咱们的产品构成竞争?

A:国内很多高校都在用NAO,他们公司在中国有代理商。这款产品基本覆盖了二本以上所有学校,二本以下覆盖率也高达60%。因为它体型较小,因此售价只有10万左右。

我们的产品会与NAO形成互补,因为产品形态不一样,满足的是不同的需求。

Q:目前主要通过哪些方式获客?

A:现在基本不需要花太多时间去获客,因为我们有很多高校资源。

Q:前期订单是不是来自一些科研需求更强、经费更充裕的学校?

A:对,主要是一些比较好的学校,因为好学校本身也是一种背书。而且国家教育方面的机构随后也会推出一些相关政策支持,他们出政策、负责高校推广,我们出机器人,来共同推动一些高校方面的机器人活动。

Q:这块的政策大概会在什么时间推出来?

A:我们前段时间跟一些国家部委已经开过会了,基本已经确定下来了,今年5月我们会先参加一些展会,9月份,由国家部委主办、我们协办的活动就会正式推出,到时我们会和一些高校开始合作。

Q:政策推出后价格会降下来吗?

A:不会。因为我们的机器人更多的是面向科研,而不是面向普适教育。现在一些高校用于教育的机器人基本几千、几万块钱都有,但是我们更多的是面向高端科研,而且高校方面也会享受到一些补贴。

Q:科技馆订单会不会主要是一些更有购买力省级科技馆?

A:省级科技馆确实都有这个购买力,但我们也在接触一些市级科技馆,一些地区,尤其是欠发达地区的市级科技馆反而更不差钱,需求更强,因为国家的扶持力度可能更大一些。

Q:未来实现量产会考虑自建工厂吗?

A:目前还是代工+自己组装。外地产业化是早晚的事,后期我们会考虑。

但是代工和自建工厂各有利弊,出货量不是很高的时候找代工厂比较划算,不需要花很多钱在固定资产上;但如果出货量比较大,我们公司所有人都组装不过来,那就确实需要一帮人专门在一个地方做组装。

Q:组装对技术能力要求高吗?

A:对工艺要求比较高,当然正常情况下我们公司需要对组装人员做一个培训。现在基本都是我们自己的技术人员去做,未来建工厂的话,培训一批工人就可以完成。不过,产品化是一套流程,组装只是其中一个环节之一,组装完还要做一些质检测试等。

Q:现在的工业机器人可以完成机器人制造的哪些环节?

A:比如机器人一些电路板的加工焊接,包括所有机械零部件放在工厂自动化生产线上去做加工也是没有问题的,但是一些精细化组装目前工业机器人好像还没有达到这个智能程度,现在工业机器人只能完成一些电焊、喷漆、抓取、移动等动作。

Q:实现精细化组装也是工业机器人发展方向之一吗?

A:对,不过实现整个智慧工厂的核心不是机器人,机器人只是扮演一个重要角色,真正的控制决策还是软件层面的东西,比如控制软件和ERP软件对接。工业物联网也是智慧工厂的基础,工业机器人能保证的只是一个环节,不是一个体系,而智慧工厂是需要一个体系。

Q:小人型机器人与大人型机器人在运动控制技术方面差别大吗?

A:小人型机器人基本不存在算法,只要硬调就行了,而且它展示的所有动作都是标准动作,只是原地动,而不是来回走,更不牵扯复杂地形。现在很多在校大学生都可以做这种小人型机器人去参加比赛。

国内做小人形机器人的公司比较多,从去年年底开始,业界的许多商业公司都觉得大人形机器人才是未来,尤其是那些原本做轮式机器人的公司,现在也觉得做双足行走的腿式机器人才是真正的未来,有比较大的应用空间。那种轮式机器人虽然能够较快出产品,但实际上并没有太大应用价值,所以很多公司都在往大人形双足机器人这个方向去靠。

Q:双足大仿人机器人目前还存在哪些技术难题?

A:首先,运动控制本身还需要不断积累和验证,目前只是在有限环境下做了验证,现实环境实际上是没有限制的,还要做很多设计和测试;

其次,机器人视觉方面,目前各家商业公司做的都是静态视觉,摄像头固定在某处不动。但仿人机器人跟人走路的节奏类似,走的时候,摄像头会晃动,这个问题如何解决;

最后,机器人技术与行业应用目前来看是脱离的。如何把机器人研发和一些具体的应用领域和行业经验相结合,也是一个问题。

Q:摄像头晃动问题如何解决?

A:首先摄像头必须跟机器人结构相匹配,这就需要在结构上做一些功课,另外在算法上也要加强。

Q:如何看待当前智能服务机器人产业发展状态?

A:智能服务机器人产业从这两年才开始起步,技术积累期较短,整个产业链的各个环节都处在自身需要提高的阶段,因此把有瑕疵的技术整合起来,也只能是一些技术含量比较低的产品,很难让消费者满意而形成爆品。但是手机在苹果之前也经历了漫长的大哥大、诺基亚时代,正常的硬件产品发展路径都是这样的,所以要有耐心,苹果也是慢慢积累而成长起来的。

Q:技术方面主要存在哪些不足?

A:运动控制和视觉是主要的两块不足之处,另外语音技术虽然现在相对比较成熟,也有很多公司在做,但是哪怕准确率提升到99%,剩下的1%可能就是让人感觉最差的地方,所以每个方面都需要不断加强。

另外,从构成机器人的三大块——感知、决策、控制来看,语音、视觉、运动控制都需要输入,跟传感器相关的图像输入目前还有很大问题;决策层方面,无论是运动控制、语音交互,还是视觉,也都需要再优化一些。

从目前情况来看,国内做视觉的公司为什么做不了机器人导航,因为他们的视觉跟机器人是孤立的,谷歌开发的一些东西之所以会在全世界受到追捧,是因为他们的视觉是在机器人身上验证过的。

Q:未来服务机器人的产品形态会是什么样的?

A:短期内会出现多种形态并存,长期来看,人形双足机器人可能会取代其他形态。未来成熟的机器人可以满足人各方面的需求,不仅能智能交互,还可以做体力劳动。就像手机的发展历程一样,智能手机最终取代了各种形态的功能机,甚至取代了数码相机,智能人形双足机器人最终也会终结现在的市场混乱状态。

Q:您认为现在服务机器人行业有泡沫成分在吗?

A:任何一个产业早期都会出现多种产品形态,最终会由市场来选择,有一部分会被淘汰,有一部分会成长起来,所以也并不能说是泡沫。

Q:整个市场爆发会在近两年内发生吗?

A:我觉的比较难,什么时候我们把运动控制做好了,整个产业就能爆发(笑)。大概需要多长时间,很难评估,当然整个产业研发速度也会越来越快。

Q:您认为未来哪种操作系统会成为机器人的主流?

A:现在服务机器人的操作系统,大多是安卓系统。用什么操作系统,取决于要实现什么样的功能。

服务机器人有较强的交互需求,而且大多还是带屏幕,因此采用安卓系统最合适。而双足大仿人机器人身上分布着许多传感器、电机、控制器等设备,需要一套通信机制,因此用ROS系统更合适。当然机器人身上也不是只用一种操作系统,还是要看它所在的位置、需要完成的功能去做选择。人形机器人如果身上也装一个PAD屏,那么那块用安卓还是最合适的。其他操作系统,比如Linux也会用。

Q:今年计划把团队扩充到什么规模?

A:我们没有明确的计划,有需求了就招,主要还是看发展阶段,最近一两个月可能会招到接近30个人。其实我们做完第一代机器人只有10个人,第二代产品做完才14个人。即便现在要引入一些非研发类人才, 20多个人的高质量团队暂时够用。我们希望尽量用小团队来办事情,提高研发质量和效率。

Q:接下来有融资计划吗?

A:我们上一轮的钱还没花。我们融资不是为了融钱,更多地是为了吸引一些资源,比如可以在生产加工、拓宽市场渠道等方面给予我们一些支持。最近有很多机构在联系我们,我们很可能会随时结束掉新一轮融资。