人工智能

用机器视觉做手势交互,微动押注的未来即将到来

智能手机的普及,使得触摸替代了按键,成为新的交互方式

2016年11月06日
撰写 | 京京
  • 人工智能
  • 微动
  • 手势交互
  • 机器视觉

用机器视觉做手势交互,微动押注的未来即将到来

在PC诞生的这几十年间,我们与计算机的交互方式一直都没有变过。智能手机的普及,使得触摸替代了按键,成为新的交互方式。

然而,当VR、AR、机器人以及全息投影等技术逐渐兴起,传统的键盘、鼠标、手柄、触摸等交互方式已经不再适用于新兴设备和场景,什么样的交互方式才会成为未来的主流?

微动的四位创始人认为,是人与人之间最自然的沟通方式——手势。

同学四人组合伙创业,锁定手势交互

这个四人团队依靠同学关系组建而成,成员包括刘津甦、刘哲、党建勋和张硕。

发起人刘津甦在中科大读了10年本硕博,还在卡耐基·梅隆大学做过访问学者,专业是机器人的机器视觉及行动控制;刘哲拥有南开大学电子信息科学学士和工商管理硕士学位,曾是一家物流公司的中层管理者,尤其擅长市场和运营;党建勋本科毕业于北航,后前往加拿大麦吉尔大学攻读计算机科学博士学位,在硬件架构及嵌入式算法方面拥有很强的实力;张硕则是北航VR重点实验室研究员,曾在华为做过软件工程师,专注手感操控技术以及相关智能硬件的应用和商业化。

这个有算法、有前端、有硬件、有运营的四人团队,在2009年便凑在一起组建了Sharpnow Group,音译自“瞎胡闹”。虽说是种自我调侃,但他们并没有把创业当作儿戏。经过刘津甦半年多的研究,发现他们想做的事情在算法上是可行的,四人便在2011年一起注册了公司,决心开始创业。

用机器视觉做手势交互,微动押注的未来即将到来

图:微动四位联合创始人,从左至右:张硕、党建勋、刘津甦、刘哲

基于刘津甦的机器视觉背景,以及四个人对未来趋势的判断,他们最终把创业方向确定为手势交互。

刘津甦任董事长,负责核心算法;刘哲任CEO,负责运营、管理、资本;党建勋任CTO,负责硬件架构及嵌入式系统;张硕任CMO,负责市场、商务、前端开发。

两代产品成功众筹,但2C不是主要方向

2013年,硅谷一家做手势识别的初创公司Leap Motion发布了第一代产品,受到科技界广泛关注。Leap Motion的横空出世,给微动团队打了一剂强心剂,让他们更加坚定了自己的创业方向。

同年底,微动成功做出了一款原型机,不仅验证了其算法可以在硬件上跑通,还证明了一整套软硬一体化手势交互解决方案的可行性。

2014年,他们将原型机进行了量产,并在点名时间上发起了一次众筹,市场价590元,众筹价199-299元。此次众筹后,微动得到了一批早期用户的支持,并收到了很多关于产品设计、体验、功能以及应用等方面的建议。

针对这些建议,团队继续改进技术、打磨产品,还合作了几家游戏以及软件应用商,通过提供手势交互功能,以丰富产品使用场景。

2015年底,微动第二代产品——微动Vidoo Primary手感控制器发布,同时在淘宝发起众筹。这款产品不仅适用于PC,还适用于VR头显,通过USB即可连接。

用机器视觉做手势交互,微动押注的未来即将到来

图:微动第二代产品微动Vidoo Primary手感控制器

与Leap Motion 2014年进入中国后的定价相同,这款产品的市场价也是688元,众筹价为488元。最终,众筹任务超额完成。近期,微动还将推出“手感操控+光学定位手柄+空间定位”的虚拟现实交互系列产品,致力于打造完整的虚拟现实交互解决方案。

虽然通过众筹形式发布的两款产品似乎都是面向消费者的外设,但是主要购买用户还是一些开发者、发烧友、以及合作伙伴等。

由于整个VR/AR市场尚未成熟,直接将交互设备单独作为外设推向消费者,并非一个很好的市场策略。因此除了提供软硬一体化的交互设备,微动还会和一些VR/AR厂商进行深度合作,将搭载其算法的硬件模组集成到VR/AR设备中。

所以,从严格意义上讲,微动更多的是一家交互方式解决方案提供商。而他们的手势交互以及图像识别技术,除了可以用于VR/AR/MR设备,还适用于车载、医疗、智能家居、终端设备等多个场景。

不局限于VR/AR,探索手势交互多种场景应用

车载

在传统的汽车场景下,司机要在中控做交互,往往需要寻找特定的按钮,这在某种程度上也会影响驾驶安全。近几年逐渐兴起的车载语音交互,虽然提供了很多便利,但是在面对方言以及驾驶环境嘈杂等情景时,其效果仍然会受到限制。

为此,微动想要让司机不再使用视线去找按钮,直接通过手势执行音量调节、温度控制等操作,从而提高司机的驾驶安全。

用机器视觉做手势交互,微动押注的未来即将到来

图:微动车载手势交互场景

为了在汽车市场进行落地,微动在A轮融资中引入了上汽作为战略投资方,一方面可以直接和上汽旗下汽车品牌合作研发,推进前装市场落地,另一方面,微动也更容易进入相对封闭的汽车市场,以寻求更多合作。

目前,微动和一些汽车厂商的合作研发正在进行中,预计相关车型会在2018年初上市。

医疗

医疗场景的应用主要包括两种,一种是某些特定医学影像,一种是医院终端设备。医院终端设备虽然每天都会消毒,但还是有很多人不愿意去碰,手势交互正好可以解决这个问题。

当然,类似的终端设备在商场、银行、地铁、图书馆等多个场景都有应用。

除此之外,针对智能电视、冰箱、洗衣机等家电设备的手势控制,也会逐渐取代遥控器和按钮,成为智能家居中的新型交互方式。

用机器视觉做手势交互,微动押注的未来即将到来

图:微动家居手势交互场景

出货量决定价格,产量决定成本,商业化刚刚起步

在面向B端的商业模式上,微动一方面通过向企业提供软硬一体化的解决方案来获取收入,另一方面,针对一些拥有较强供应链和议价能力的大规模厂商,微动会将算法授权出去,以出货量为单位计算授权费用。

具体定价则会考虑很多因素,包括厂商规模、前期集成难度、以及对未来出货量的预期。如果预期出货量不乐观,价格就会相对较高,如果预计是一个手机级别的出货量,价格也会非常优惠。

而在一体化产品的成本上,刘哲介绍,占比最大的是摄像头传感器,其次是光学镜头。

不过,从供应链角度讲,影响成本最大的因素还是产量,微动现在的产量还不足以支撑成本的大规模降低。未来如果能实现大规模量产,成本就会下降得很快。

手势交互快速发展,微动提前布局产业链抢占先机

用机器视觉做手势交互,微动押注的未来即将到来

图:微动VR游戏交互演示

当前,国内外做体感交互的公司,除了近两年推出RealSense深感摄像头的Intel,以及前文提到的Leap Motion,还有国内几家新兴的创业公司,有的做全身体感交互,有的专注手势交互在VR/AR领域的应用。

Leap Motion在手势识别的深度学习算法上存在明显优势,从而决定了其产品体验和效果也更胜一筹。 不过,由于Leap Motion的计算处理更多地依赖主机,因此主要是和一些主机级VR厂商(比如Oculus)合作,而微动则主要面向国内占比最大的VR一体机市场。

手势交互要走向普及,VR设备是一个很好的台阶,但目前VR的普及还依赖于硬件成本的下降、体验效果的提升、以及内容的充实,而这里面又存在着一个先有鸡还是现有蛋的问题。至于AR,虽然科幻电影里“指点江山”的场景足够酷炫,但是要成为现实,恐怕还要再等十年。

不过,微动即将推出的手感操控+空间定位+光学手柄的VR交互方案,可以让用户以更低的成本获得更便捷、自然的沉浸式VR交互体验,从而帮助推动VR的普及。同时,微动提前布局汽车、家电、医疗等多个应用领域的产业链,也有助于抢占市场先机。

当然,要最终在市场上赢得一席之地,除了要从B端走量、降低成本,不断完善技术、优化产品体验也是重中之重,毕竟产品最终的使用者还是对体验高度敏感的C端用户。

用机器视觉做手势交互,微动押注的未来即将到来

近期,爱分析对微动联合创始人兼CEO刘哲进行了调研访谈,现将部分内容摘录如下。

Q:目前团队规模和构成如何?

A:目前团队不到50个人,分别在北京、深圳、天津三个地方。北京主要是前端开发,UI/UE,商务、市场等,其中前端开发十几个人,销售团队5个人左右;深圳主要是核心算法和硬件研发团队,有20个人左右;天津主要是财务、行政等一些职能部门。整体来看,技术人员占了一半多。

Q:最初是怎么确定将手势交互作为创业方向的?

A:我们当时有三个方向:手势交互、人脸识别、瞳孔识别。基于我们的专业背景,以及对未来应用场景的综合分析,我们选择了手势交互。因为人脸和瞳孔可能在一些细分领域会有广泛应用,但是手势交互会像语音一样成为一种自然的交互方式,所以它会有非常广泛的应用场景。尤其是在2011年,VR/AR尚未兴起的时候,我们就预见了这个趋势,现在看来,我们当初设想的东西也正在慢慢变成现实。

Q:微动的Vidoo和Leap Motion的产品有何差异?

A:我们在产品路径选择上有一些差异。Leap Motion最早是一款基于PC的交互外设,就是通过手势控制PC上的一些游戏、内容和应用。我们第一代产品也是PC外设,但是我们在运算本身有一些差别。

Leap Motion是将双摄像头捕捉到的图像实时传回到PC,再由PC进行图像分析计算。但是由于我们最初就认为PC不是未来趋势,所以我们是把计算集成在计算能力很强的FPGA上,用FPGA对双摄像头获取的图像进行分析和计算,再将指令传给终端。尤其是在VR场景下,实时渲染的计算量非常大,一些跟图像图形相关的巨型游戏和应用,手机的CPU、GPU是不足以承载的。所以Leap Motion现在更多的是和一些主机级VR厂商合作,而我们合作的主要是VR一体机。

Q:用手势交互,时间长了会存在疲劳问题,如何解决?

A:我们其实很早就已经意识到了这个问题,解决这个问题不仅仅是从硬件或者算法本身去解决,而是需要对用户使用习惯去做引导,使他们形成一个比较舒适的使用习惯。所以我们也在今年成立了自己的UE团队,这个团队一部分工作就是要解决体验问题

Q:为何选择前装市场?

A:因为前装和后装在量上还是有明显差异。当然,我们不排除去做一些后装产品,但是目标一定是要打入前装市场。上汽的投资也可以帮助我们快速地跟汽车行业去做对接。

Q:目前和上汽合作到什么程度?

A:汽车行业周期很长,从产品研发到后期测试,可能要经过一年半到两年时间。因为这个过程包括技术的结合,以及一系列复杂的标准测试,因此是一个相对漫长的过程。不过去年年底宝马已经将手势操控集成上去了,国内车厂的创新压力也非常大,所以这个过程可能会比之前快一些,我们预计在2018年初会实现上车。

Q:如何看待国内VR市场的格局和发展前景?

A:从国际市场来看,主机头显基本是三巨头——Oculus、Sony、HTC的天下。而2015年有很多国内厂商投入一体机市场,不过今年厂商数量锐减。与此同时,国内外一些科技巨头包括手机厂商也开始在VR上加大投入,所以整个行业结构也从一些小的创业公司在玩,到现在几个巨头参与进来。这是一件好事,也证明我们用在VR这个方向上是对的,未来这将会是一个巨大量级的市场。

Q:微动的竞争优势有哪些?

A:首先,微动Vidoo已经有两次量产经验,在产业链方面更具优势。

其次,微动Vidoo Primary在硬件层面上,拥有独立的图形图像处理芯片,核心算法不依赖于系统的硬件实现;在软件层面上,拥有中间件架构,用以连接硬件设备和软件应用程序,为在各种硬件平台上开发的手势识别应用提供标准的数据接口。

因此微动可支持多种硬件平台和操作系统,具有很强的灵活性和可扩展性。同时,微动Vidoo Primary识别范围广、延迟低,可以完美适配各类VR设备,是目前市面上唯一可与移动设备搭配并量产化的裸手手感操控设备。

最后,从其他行业应用角度分析,相比采用激光的体感技术,微动 Vidoo Primary具有成本低、精确度高等优势,并且不会像激光一样在高温情况下识别不准确,因此更适合车载电子、智能家居的使用,设备内置的红外LED辅助光源可以使微动Vidoo在夜间环境下也能出色运行。