人工智能

车规级AI芯片性能提升10倍,地平线要做自动驾驶赋能者

算法与处理器深度匹配提升性能,剑指“中国英伟达”

2018年11月05日
  • 人工智能

AI成芯片国产化突破口,团队技术积累业内领先

自中兴事件以来,芯片国产化成为国家战略层面的重要目标。在通用芯片领域,国外厂商如英特尔、英伟达的领先地位已较为牢固。随着人工智能的发展,在垂直行业的AI芯片逐渐成为国内企业机会最大的突破点。

地平线的产品主要为基于硬件芯片和软件算法的人工智能基础层,应用于自动驾驶、城市安防等领域。在自动驾驶解决方案中,地平线主要服务于以视觉感知为主的多传感器融合路线。

BPU研发路线分三步,征程2.0芯片性能实现十倍提升

硬件方面,地平线的BPU处理器是基于ASIC进行深度神经网络学习优化而推出的,在功耗、成本、和垂直领域的算力方面具备优势。

BPU处理器的解决方案研发路线分为高斯架构、伯努利架构和贝叶斯架构三个阶段。基于高斯架构,地平线发布了两款芯片,其中征程1.0芯片可以支持L2级别的驾驶辅助功能,技术参数介于Mobileye Eye Q3 EyeQ4两款产品中间,同时功耗均显著低于二者,典型功耗为1.5W

2018CES上,地平线发布的征程2.0芯片,为基于伯努利架构的车规级高级计算芯片,面向L3及以上自动驾驶。基于该架构,地平线科技同样推出了高级别自动驾驶计算平台Matrix 1.0,其核心芯片为采用征程2.0架构的FPGA,并在该板卡上也整合了其他辅助芯片。

Matrix 1.0支持多传感器融合,能以30/s的实时速率同时处理4720P视频,并将功耗控制在31WMatrix 1.0同时也为验证、开发、进一步优化征程2.0芯片打下良好基础。目前,Matrix1.0已推进至小规模量产,正在量产爬坡阶段

投产后的第二代芯片则可实时处理14K视频,相比于第一代有4倍的像素提升。同时,与征程1.0 芯片用1.5W功耗实现1TOPs算力相比,征程2.0芯片可用两倍左右的功耗实现10倍以上的算力。征程2.0芯片明年一季度将拿到样品。

算法突破提升可靠性,决策环节将更加透明

在可靠性方面,地平线通过算法突破,实现像素级予语义分割,视觉感知可靠性大幅提升,并使时延小于30ms。同时,还可进行距离的识别与判断,预测行人运动轨迹,支持高速、复杂场景下的无人驾驶应用。

视觉感知能力的提升,目标是实现基于语义地图的定位,也就是类似于人脑的视觉记忆,汽车行驶到相同位置时,可基于视觉记忆进行比对,把准确的相对定位结果,与不太精准的绝对定位结合,进而满足定位所需。

在决策环节,地平线希望在第三代产品中实现理性决策体系,即基于规则和人工智能的混合决策体系。相比于现在普遍应用的端到端模型,整个决策过程会更加透明化,做到整体的可分析、可追溯。

地平线经历了2年的芯片设计周期,来实现算力、可靠性和功耗的平衡,而到最后实现量产,共需5年左右的时间。作为初创公司,地平线在该环节已具备较强的先发优势。

未来,地平线在芯片的安全性、整体性能等方面还会继续打磨。既要提升芯片在运行过程中的稳定度,还要提升处理器性能以满足对实施性的苛刻要求。

商业化路径清晰,与OEM进行开放式协同

地平线推出的自动驾驶解决方案,直接服务于商业车队、主机厂和Tier 1。公开的合作伙伴包括博世、奥迪、长安等。在与自动驾驶出租车车队合作时,地平线为每辆车提供3块地平线Matrix计算平台,组成12路摄像头的系统。

地平线将自己定位为中国的英伟达,不过与英伟达不同的是,地平线将继续提供软硬件一体的解决方案,并保持更高的开放度,与国内外OEM共同成长,使客户能够基于地平线的芯片及标准算法,打造更具差异化的AI能力。

近期,爱分析对地平线副总裁李星宇进行了访谈,就自动驾驶领域及地平线的自动驾驶业务与战略作了交流,现摘取部分内容分享如下。

李星宇,地平线市场拓展与战略规划副总裁,自动驾驶行业专家;前恩智浦(飞思卡尔)应用处理器汽车业务高级市场经理;原士兰微电子安全技术专家;15年半导体行业经验。

未来的AI芯片需要算法与计算构架协同优化

爱分析:现在智能驾驶领域,芯片的竞争格局是什么样的?

李星宇:我愿意把现在的竞争格局分成三类玩家,一类玩家是像飞思卡尔那样的传统玩家,其中还包含了瑞萨和德州仪器,他们在车规级的处理器领域是长期以来的玩家,但他们在AI算法方面积累的比较弱,所以在汽车从功能时代跨入到智能时代的时候,事实上是有些吃力。他们的优势在于高可靠性,低成本,非常好的品质管理,以及巨大的客户群体。

第二类的玩家类似于英特尔、英伟达。英伟达其实是做GPU即高性能计算出身,逐渐开始补齐人工智能的能力,所以现在开始变得比较均衡,本质来讲英特尔也是一样,原来做处理器,后来收购了Mobileye去补齐在算法方面的短板,都是研发从硬件开始,逐渐补齐软件能力。

第三类的玩家像是Google和地平线,这类玩家是相反的,是从算法往硬件走,根据算法打造量身定制的计算构架,然后把计算构架在芯片上实现,由软件驱动计算构架的发展理念充分适应软件的需求,代表了未来自动驾驶处理器发展潮流的方向。

爱分析:地平线相对于前两类玩家的一个优势在哪里?

李星宇:可以这样来思考,如果我们观察摩尔定律,每18个月,它的晶体管的密度翻一翻,性能翻一翻,成本掉一半,而现在的人工智能处理器算力的提升是3.5个月翻一番,这是革命性的提升。

如果按照过去的老套路走,因为单个晶体管产生的算力的效能不够高,如果要达到上百TOPS等级的算力,晶体管数量要急剧增加,这会带来难以置信的成本和功耗,商业上是不可接受的。

也就是说摩尔定律已经失效了,不能按照原来的设计理念往前走,必须逆转。只有硬件俯下身来去适配软件的时候,才能够使晶体管所发挥的效能大幅度增加。

AI处理器事实上是处理高度变化的数据流,与面向控制流的冯诺伊曼结构相比,处理方法高度不同,所以只有用精巧的算法,同时匹配上针对算法设计的计算构架,才能够达到极高的效能。

算力、可靠性与功耗大幅提升,地平线第二代产品达到国际领先水平

爱分析:近一年多,地平线的业务经历了哪些发展?

李星宇:首先,我们围绕地平线最核心的业务——自动驾驶处理器去推进,在今年年初的CES上展出了基于第二代计算构架伯努利的自动驾驶计算平台Matrix

这是地平线成立以后在技术领域的一个里程碑。为什么这样讲?因为我们在那一届CES上几乎和这个所有重量级的公司都有过接触,我们的客户对于这个平台的评价非常的高。现在已经推进到了小规模的量产的状态,正在量产爬坡阶段。

我们的一个非常关键的客户是国际顶尖级的,他们正在做Robotaxi的服务,就是基于自动驾驶的出租车服务测试,类似于Waymo在凤凰城的自动驾驶服务,他们在每辆车上运行3块地平线计算平台,组成12路摄像头的系统,这也是地平线,甚至是中国的公司第一次有这样的机会,在国际舞台上击败顶尖对手,拿到的关键订单。这从侧面也折射出地平线在基于人工智能的视觉感知领域已经达到了真正的国际顶尖水平。

所以我认为2018年地平线的一个真正收获是通过Matrix这样一个产品,再一次通过市场确认了我们的优势地位,就是基于视觉的感知。

我们的基于第二代伯努利构架的芯片会在明年一季度拿到样品,我们期待这颗车规级的芯片回来以后,能够以比现在Matrix高出数倍的性能,却低上数倍的成本提供给客户,有机会同时拿下ADAS和自动驾驶领域的关键订单。

爱分析:现在的自动驾驶领域中,在垂直场景对芯片、处理器的要求有哪些关键因素?

李星宇:其实有多个维度的要求。

首先,对算力的需求是惊人的,这是革命性的区别。在过去的数年里,我们看到智能驾驶的等级每提高一级,算力差不多要提升一个数量级。如果要实现全自动驾驶,我们需要数千个TOPs量级的算力,而人脑的算力大概是一千个TOPs,所以事实上如果机器能够增加算力到一定程度,在驾驶方面的能力也会超过人类,这是第一点。

第二点是对可靠性的要求提高,因为当驾驶归于机器时,需要承担巨大的安全责任,会倒逼机器本身整体达到ASIL D的功能安全等级,简单来讲的话,要确保在任何的工作状态下都有可靠的安全检测机制和冗余备分机制,这样传递过来,对处理器的要求很高,对于设计的挑战是巨大的。这里面的安全,是涉及到软件和硬件,涉及到底层和上层的全方位的安全。

我认为随着工程开发越来越深入,挑战变得越来越大,现在比拼的是能不能真正达到自动驾驶所需要的安全等级。

除此之外还有其他的设计挑战。

这里面包括功耗的挑战,算力很大,不意味着可以无限放大芯片的设计规模,因为设计规模一大,功耗就会变得非常非常高,那么散热会成为一个新的问题,因为需要的附加装置,比如说水冷,系统就会变得越来越复杂,同时对于新能源车的续航能力也是一个消耗因素,所以需要保证功耗处于一个可以接受的水平。

再其次是需要很长的设计周期,这对于初创公司其实是一个巨大的考验,因为我们过去的经历表明,做这样一颗高等级的自动驾驶处理器,需要至少五年的时间,才能够从设计到最后的量产。这里面包含差不多两年的设计周期,差不多一年的认证周期,还有差不多两年的设计导入集成验证的周期。

爱分析:第二代产品在算力、可靠性和功耗这三个部分有怎样的提升?

李星宇:实现的是全范围的提升。首先,第二代产品是基于伯努利的构架,可以直接处理4K视频,第一代最多支持1080P的处理。4K相对于1080P,有4倍的像素提升,这是很大的升幅。

同时,第二代产品可以支持像素级别的语义分割和目标识别,使得对于整个环境态势的感知的细腻程度得到质的提升,由此带来精确度和实时性方面的巨大的飞跃。这对于可靠性要求也是极高的提升。

功耗方面预计两倍左右,这是很了不起的,因为性能毕竟有一个数量级以上的提升。

爱分析:可靠性的提升,依赖了哪些技术上的突破?

李星宇:简单来讲,我们在视觉感知的可靠性方面,其实是因为算法突破,比如在像素级别的识别上面做得到位,这就是对可靠性的巨大提升。

爱分析:随着产品的迭代,哪几方面的提升更具决定性?

李星宇:我认为谈到智能驾驶,首先需要安全,所以在安全性上的提升的是第一点。我们需要从系统级层面,保证整体达到ASIL-D的功能安全等级,在芯片层面,至少要保证ASIL-B等级。

第二点,我认为是一个更加开放的计算平台,在未来,OEM交付的汽车将不是一个功能固化的产品,而是一个持续进化的机器人,这就要求硬件平台在汽车运行期间,支持持续的软件迭代升级,这意味着,我们必须打造一个开放、工具链完善、拥有强大算力保障的计算平台。

第三点,我认为是实时性方面的提升。我们提到自动驾驶的安全,它是多维度的安全,它不仅包含了运行期间本身的安全性,还包括处理器能够在性能上达到对于实时性的苛刻的要求,比如要求在十个毫秒内必须做出响应,所以整体来讲,软件与处理器合起来的综合响应性能必须也要有一个质的飞升。

我们也需要支持更多的新功能。举一个例子,定位事实上是现在自动驾驶业界的核心难题之一,在未来我们也会考虑去加上算法的硬件加速引擎。

最后一个是决策,现在的自动驾驶基本上都是基于规则的决策,但是未来我们相信,会是一个基于规则和基于人工智能的混合决策体系,我们把它叫做理性决策体系。我们希望在第三代的贝叶斯构架里面能够体现这一点,实现对于贝叶斯网络的硬件方面的加速,这其实是不仅仅是要求计算构架上的一个突破,同时也是对算法理论的巨大突破。所以其实对于自动驾驶的决策这一点来讲,如果能够真正做好,其实能够代表我们在算法基础理论和计算构架上的双重革命。

未来决策将更加透明

爱分析:如果说把路径规划、决策归为更上层,对于车本身的操控归为底层的话,这两层对芯片硬件的要求,在技术路径上会有不同吗?

李星宇:相当不同。底层的控制,现在工业界已经解决得非常彻底,汽车工业经历了一百多年的发展,涌现出了像英菲凌、瑞萨、飞思卡尔等老牌玩家,他们已经把车规级的控制处理器做的非常成熟。

刚才提到的上层,其实路径规划可以归于决策的一部分,事实上是决策的底层,然后在上面还有一个顶层的综合判断,最终输出真正意义上的执行操作。这需要基于新的AI的算法去实现,倒逼过来,也需要处理器构架的革新。

我们看到在过去很多人都去使用增强学习,去训练端到端的控制模型,或者说决策模型。在一些场合取得了不错的成绩,但是当把它应用到自动驾驶的时候,其实会发现这样的一个端到端模型,在很多场景下面,会有非常愚蠢、非常低级的决策。

这对自动驾驶是致命的,也正是因为这个原因,整个业界迟迟不能把这样的端到端模型落地。

地平线的态度是严肃的,我们希望整个决策过程可以变得透明化,变得可分析、可追溯,这就要求我们需要基于像贝叶斯网络的理性的推理框架,或者理性的决策框架去有机融合,基于规则的决策和任务智能的决策。具体到某一个节点,可能还是不透明的;但整个网络本身是透明的,可分析的。

爱分析:长远来看,政策法规会要求大家使用更透明的规则吗?

李星宇:我对这个问题保持开放的心态。如果某种政策强制去做高度透明化的决策,决策就会变得很呆板,因为为了满足透明化的要求,会几乎把所有的人工智能的因子排除掉,它又变成一个基于规则的决策,这样会导致对环境的适应能力又下降。

当然这样的好处可能是在某些特定的场景下,更容易落地,并且对于自动驾驶公司来讲,在免责方面会更容易做到,因为只需要符合政府对透明性的规则要求,就可以说出了事故,不是企业的责任。

但整体来讲,这是一个开放的领域。Mobileye提出的责任敏感性安全(RSS)模型在这一方面给出了有益的探索,我们认为决策所依赖的原则需要高度透明,但安全决策机制的透明化实现依然是一个极具挑战性的话题。

爱分析:车路协同具体的实现形式会是怎样?

李星宇:从最宏观的层面来看,我相信在未来一个真正高可靠性的自动驾驶体系里面,应该包含车路协同这样的理念。

其实感知和决策是可以做到分布式的,既可以分布在车上,也可以分布在路端。综合的感知和决策体系的优势在于,它可以极大降低单车的成本,并且可以决定性地提升可靠性。

单车的感知依然是基础并且必定存在,但分布式感知是真正的发展方向。

现在,即使是初级的分析都可以证明,基于一个简单的车路协同的方案,可以降低超过50%的单车感知错误。尤其在中国,因为中国有非常强的基础设施更新的能力,所以实现车路协同的整体自动驾驶体系,比其他的国家可能更有优势,尤其我国在5G方面已经有全球领先的商用时间表,我国在高速公路的更新、新城市建设方面也走在全球的前列,所以我认为这其实具备了相当的物质基础去实现。这也是中国区别于美国以及其他地方自动驾驶路线的最关键的特点。

爱分析:车路协同会建立在实现了V2X之后才可以实现吗?

李星宇:对,因为5G其实是包含V2X的部分,但最精准的表述叫5G-V2X。我国在前几天专门成立了5G自动驾驶联盟,中移动牵头成立的,业界非常积极希望加入这个联盟。在国际范围内,欧洲对于车路协同的态度和中国是同样积极的。

这是顶层设计,再往下走,包括决策也是一样的。

其实我们把自动驾驶体系可以看成一个基于经典牛顿力学的一个惯性体系,在这样的一个惯性体系里面,其实车和路可以看成是车不动路动,反过来也一样,在这样一个封闭的体系内,其实最好的决策方式是顶层决策。不是优化单车决策,而是优化在局部路径内的群体决策。群体决策优化使得单车之间发生竞争和冒险的概率决定性地下降,因为可以有上帝视角,统一协调在这个局部路径内的每一个移动主体。

从技术的角度来讲,顶层决策能显著提升整体交通态势感知能力,因为单车的感知和决策能力都不能超越视距,但是顶层决策是超视距的,无论另外一辆车在一公里之外还是两公里以外,都可以清楚的感知到.

顶层决策有利于极大降低自动驾驶决策难度,因为它可以非常有序地进行单车决策的调度,或者说非常有序地排布每辆在控制范围内的汽车,告诉他们在哪条车道上行驶,什么时候并线、什么时候变道,同时这样的体系也会极大地改善智慧交通的情况,政府对提升交通效率、减少交通拥堵和事故发生的需求。

这一切都是单车无法企及的。

但如果要有一个顶层的决策,相当于需要非常中性化的机构来实现,目前来看,政府是最合适的选择,可能会诞生一个全国范围的交通控制网络中心。

爱分析:未来的感知平台,会是怎样的发展形势?

李星宇:这是一个非常宏大的主题,除了分布式感知,基于多传感器的感知融合是另一个大的方向。

我们看到许多全新的传感器正在持续拓展感知的能力,比如探地雷达、混合光谱传感器、动态图像传感器等,这些新的感知手段拓展了自动驾驶的武器库,使得感知融合能覆盖更广的范围和天候。

感知记忆是另一个重大的发展趋势,在未来,毫米波雷达、探地雷达、激光雷达、摄像头等都会将自己的感知结果作为记忆存储起来,生成各种独特的传感器地图,用于定位和提升感知可靠性。

从计算平台的角度看,我们认为在未来,计算平台将成为标准工具,帮助实现软件的自定义应用。

同时,计算平台并不是一个由单个处理器构成的平台,而是一个处理器矩阵构成的平台,高度可配置,更加灵活,易于适配不同的车型对于ADAS或智能驾驶传感器的需求,而且它有利于解决比较关键性的工程难题。

总结来看,感知技术的发展,将催生出面向未来的全新技术。自动驾驶将是自主移动机器的第一形态,对未来技术的发展产生深远的影响,并催生无数种的移动机器人,正如蒸汽机开启了工业革命时代一样。这样激动人心的前景,也正是地平线的使命,赋能万物,让人们的生活更安全、更美好。