人工智能

AI芯片需求增长,探境科技的商业化落地实践

存储优先架构(SFA)突破“存储墙”瓶颈

2020年05月27日
调研 | 张扬 施尧 王磊 撰写 | 王磊
  • 人工智能
  • 鲁勇
  • 探境科技

随着AI 算法不断升级,传统芯片已逐渐无法满足AI算法对算力的要求,从而催生了对AI芯片的迫切需求。在AI的浪潮下,探境科技以自研的SFA架构芯片和AI算法相结合,快速实现了AI语音芯片的落地,客户覆盖美的、海尔、TCL等头部家电品牌厂商。未来,探境科技将凭借SFA架构的优势,向安防、工业、零售、自动驾驶等领域延伸。

随着人工智能的快速发展,深度学习成为主流AI算法,对芯片的算力提出了更高的要求。为了提供足够的算力支撑,专门面向AI计算的高算力AI芯片应运而生。

正是看准了市场对AI芯片的需求,有着20年芯片从业经验的鲁勇博士在2017年创立了探境科技。探境科技研发的AI芯片通过创新的SFA架构,突破了传统AI芯片的“内存墙”问题,具有性能高、功耗低等优点,可以支撑复杂的AI算法。2019年,创立仅两年的探境科技已实现AI语音芯片的量产供货,AI图像芯片也成功流片。

除了芯片,探境也提供深度学习算法。探境科技AI芯片与算法相结合的模式,能够为客户提供完整的解决方案,更利于AI芯片的落地。

探境科技现阶段的目标市场是智能家居行业,客户覆盖美的、海尔等头部家电品牌厂商。探境科技的语音芯片已应用于空调、智能灯具、智能开关、智能垃圾桶等家居用品,满足市场对语音交互的需求。未来,探境科技会向安防、工业、零售、自动驾驶等领域延伸。

AI芯片需求爆发

人工智能发展至今,技术成熟度不断提高,并逐步走向行业落地,在医疗、教育、工业、安全等领域都有人工智能应用不断涌现。

与一般的计算不同,AI计算处理的内容涉及大量语音、图片、视频等非结构化数据,处理过程计算量大。目前主流的深度学习算法具有高并发、高耦合等特点,传统芯片算力无法支撑,催生了专门用于AI计算的AI芯片的发展,AI芯片已成为整个人工智能产业链的核心。

而在AI芯片中, AI语音芯片的需求尤为强劲。

随着技术的演进,人机交互的方式也在逐渐升级。在PC互联网时代,人们通过键盘和鼠标进行人机交互,到了移动互联网时代,人们可以通过触摸屏实现人机交互,而在人工智能和物联网深度融合的Alot时代,语音交互将成为人机交互的主要方式之一。

作为实现智能语音交互必备硬件,AI语音芯片在智能家居、智能车载、可穿戴设备等多个场景均有巨大需求。其中,仅智能家居每年就有几千亿的市场规模。

在时代的浪潮下,探境科技成立后仅用了两年,即实现了语音芯片的量产,并在智能家居领域商业化落地,其图像芯片也实现了流片成功,未来向安防、工业、零售、自动驾驶等领域延伸。

SFA架构破解“存储墙”难题

传统的芯片设计思路基于冯·诺依曼体系,计算和存储单元分离,计算时需先从存储器取出数据,处理后再返回存储器。在这种架构下,即使计算资源丰富,由于存储及数据搬运效率低下,也会限制芯片整体性能的提高,形成了学术界和工业界广泛讨论的“存储墙”问题。“存储墙”成为AI芯片性能的最大瓶颈。

解决“存储墙”问题的关键在于更高效地将数据输送给计算单元,而不是简单地增加更多的AI计算资源。

为了从根本上解决“存储墙”问题,探境科技自主研发了SFA(存储优先)架构。SFA架构由数据层、计算层和控制层组成,突破了冯·诺依曼体系,以存储调度为核心,让数据在存储之间的搬移过程之中完成计算。简单来说,SFA架构通过优化数据路径,降低数据访问次数,达到降低存储系统和整体功耗的目的。

根据探境科技提供的测试数据,采用SFA架构,数据访问量在同等条件下降低了10到100倍,存储子系统功耗下降10倍;在28nm制程下,系统能效比超过4TOPS/W,资源利用率超过80%,带宽占有率降低5倍。

借助SFA架构的优异性能,探境科技的AI芯片可做到对各种已知复杂的神经网络算法的支持,具有很强的通用性。

图:SFA芯片架构

双麦顶四麦的语音算法

除了AI芯片,探境科技在算法上也取得了突破。基于自研的AI算法,打通了语音识别的全链路。

在最开始的语音输入环节,传统的波束成行算法声源定位依赖于单麦唤醒词检测,使用场景受限,例如需要在看电视的同时控制其他电器时效果就得不到保证。此外,也难以处理干扰声源和目标声源方向接近的场景。针对这些问题,探境科技采用频域复数子空间投影(FCSP)的端到端双麦识别算法,用深度学习取代传统的数字信号处理,训练数据覆盖了各种距离、角度和麦克风配置的数据,提高了唤醒率以及干扰声源和目标声源方向接近时的识别率。

在降噪处理上,探境科技的AI降噪算法可处理稳态噪声以及非稳态的突发性噪声,在云端公开语音识别模型测试中,降噪处理后比处理前的识别准确率提高了30%。

在语音识别环节,探境科技设计的高计算强度神经网络(HONN),通过加入卷积运算,提升了模型的计算密度,减小了模型存储压力。与业内常用的深度神经网络(DNN)相比,HONN 所需存储更低,但模型复杂度提高了4倍,在高噪声低信噪比的情况下,能大幅度提高识别率。

根据探境科技提供的测试数据:探境的语音识别方案具有非常好的识别效果,唤醒率、识别率都超过现有市场的芯片水平,尤其在噪声环境下受影响很小,采用双麦甚至可以达到四麦的效果,无论在抽油烟机超高噪声、10米远场距离、还是在3dB的低信噪比环境下,都可以有非常良好的表现。

近期,爱分析对探境科技创始人兼CEO鲁勇进行了专访,就探境科技的产品与服务及行业趋势等方面进行了深入交流,现将部分内容分享如下。

基于SFA架构的AI芯片通用性强

爱分析:探境科技的创立背景是怎样的?

鲁勇: AI从2015年开始热度逐渐起来,最开始是先有AI的算法,后来由于传统芯片难以支撑AI算法,才逐渐过渡到对AI芯片的需求。我们在2017创立公司,也是看到了市场的需求。

虽然那个时候云端的像英伟达的服务器芯片非常多,但是我们仍然坚定地认为最终AI会落到终端设备上来,所以我们决定做面向终端的AI芯片。而且终端AI芯片也更加有意义,因为像英伟达的产品不可能在终端上运行。所以我们认为在终端上做AI芯片非常有价值,更加能够把 AI落到身边的产品上来,这是公司当时成立的背景。

爱分析:SFA架构主要解决了什么问题?

鲁勇:AI芯片面临的最大的一个难题就是“存储墙”。我们通过SFA架构解决“存储墙”带来的各种壁垒。

存储器和计算单元之间有个通道,打个比方,这个通道相当于公路,在传统的架构下这条公路特别拥挤,通行效率低,SFA架构相当于通过规则降低了路上的交通量,提高了运输效率,破解“存储墙”问题。SFA架构能支撑所有已知的神经网络。

爱分析:市场上也有通过存算一体解决“存储墙”问题的做法,与SFA架构有什么区别?

鲁勇:从实践上来看,存算一体架构把大量的存储做到芯片内部之后,存在的问题是成本会比较高。这也是为什么一般把大容量存储放在芯片外面的原因,东芝、三星还有国内的兆易都会采用跟普通芯片不一样的工艺大批量生产存储芯片,以降低成本。

另一方面,存算一体架构的局限性在于它只能支持很少量的神经网络,对于复杂的神经网络的支持乏力,适用性较窄。

探境语音芯片自研的NPU的架构,能够在实现低成本低功耗的情况下,满足自身算法的性能需求。探境之所以能采用HONN这些更复杂、效果更好的算法,也是因为SFA架构的AI芯片能够提供足够的算力支撑。

爱分析:芯片代工是跟哪家公司合作的?

鲁勇:我们是跟台积电合作的。

芯片+算法整体解决方案凸显竞争优势

爱分析:为什么选择同时做AI芯片和AI算法?

鲁勇:主要是由这个AI芯片的行业特性决定的。例如语音识别芯片,想要在市场有足够的竞争力,即要有深厚的全链路音频处理能力、语音识别AI算法能力、小型化离线NLP网络模型的能力,还要有很强的AI芯片设计能力以及芯片产品应用落地能力。

爱分析:与其他AI芯片公司相比,探境的竞争优势主要体现在哪些方面?

鲁勇:首先, AIoT市场对语音嵌入式芯片产品的主要需求是效果好且便宜。只有具有超有超高性价比的产品才能实现AI普惠,进入千家万户。

以智能家居行业为例,家电厂家希望采用价格低且简单的语音方案:如单麦克风,最多采用双麦克风,不希望采用麦克风阵列较昂贵复杂的解决方案,并且语音唤醒和识别效果能达到基本预期,能解决普通话不标准等口音问题,他们不希望付额外算法license费用。

芯片公司大多需要找算法公司合作,每个芯片还要额外收费,在线方案算法部分的收费更高。所以我们看到,智能家居这个概念喊了很多年,但仍然没有进入到普通大众的生活中去。

探境在芯片设计和架构上是比较领先的。我们有非常成熟的团队和经验。 从测试数据来讲,SFA芯片架构在全球属于领先水平。

和很多芯片设计公司相比,我们又有非常强大的AI算法团队,相当于我们是“两条腿”走路,把芯片和算法深度融合,让用户的体验更好。同时,客户也省去了既要找芯片公司又要找算法公司的麻烦,成本也更低。只有芯片设计、算法、解决方案、成本各个方面均衡发展,并能有机的结合起来,才能获得市场的认可。

爱分析:探境科技的收费方式是怎样的?

鲁勇:基本上是按照芯片或者模组收费,我们不再收额外的算法开发费。

爱分析:芯片是以直销的方式售卖吗?

鲁勇:芯片需要走量,芯片行业都是通过代理商去出货,代理商有终端厂商的关系和资源,会在中间成为融合各家资源的桥梁。

从智能家居切入,向其他领域延伸

爱分析:为什么选择智能家居作为目标市场?

鲁勇:智能家居只是我们第一个目标市场,我们面向所有的AI的终端市场,包括语音和图像。在语音方向探境首先进入的是智能家居市场。

我们定义的智能家居跟过去讲的智能家居不一样,过去的智能家居其实是家电联网,就是给家电加WiFi、加模块,通过联网的方式做智能家居,这条路会越走越窄。

我们看到的是一个真正的家电智能化的市场,就是让每台家电都能变得更加智能,更加智能就体现在交互手段、自主判断等方面,这些都有对AI的需求,语音交互实际上也是其中之一。

我们先通过语音让家电具备最初步的 AI能力,之后就会给他嵌入更多的 AI图像或多传感器融合的能力,增加家电的自主智能。

爱分析:从家电联网向智能化转变过程中,里面的芯片会有几个固定的方向吗,还是说是一个整合的过程?

鲁勇:其实就是一个整合的过程,从控制角度来讲只有一个MCU,我们现在提供的语音芯片可以理解为带AI语音功能的MCU。该MCU满足大多数家电的逻辑控制需求。

爱分析:在需求层面,您提到未来几年核心是智能化的需求,从探境的角度如何规划新产品满足市场的需求?

鲁勇:核心在于抓住客户的痛点。首先要与客户进行大量的沟通,建立比较深入的关系,去了解客户的需求痛点是什么。但是客户通常也不太会知道技术的发展前沿,而我们手里掌握了技术发展的最新轨迹,我们就会用最新的技术和客户之间的需求进行碰撞,从而确定新产品的规划和定位。

爱分析:现在的需求可能更多的是语音交互,随着智能化的深入,未来的需求会在哪?

鲁勇:每个产品不一样,以空调来讲,语音交互是一个很大的需求,语音交互可以代替遥控器,再往下就会有更多的主动智能的需求,比如说它可以根据摄像头判断家里有没有人,是不是需要进入节能模式,或者说不把风直接吹到老人的身上,它将会有一些智能的处理,这需要结合传感器、摄像头一起做处理。

爱分析:刚才举的空调自主智能的例子,是家居厂商下一步要重点推的产品,还是说我们预测的未来的发展方向?

鲁勇:还处于非常前期的研究阶段,离最终的落地还有相当长的距离。客户对这方面的需求也还并不强烈。但不发生不代表不重要,如果一个企业对于行业发展方向判断失误,就会导致现在的战略布局发生错误。

爱分析:平均做一个方案大概需要多长时间?

鲁勇:在消费电子里面是比较快的,大概需要六到九个月。如果在比较专用的场景,包括一些特别专业设备,或者是工业场景,可能需要一两年,如果是在汽车领域,大概四五年。

爱分析:不同行业差距这么大,主要是出于什么原因?

鲁勇:因为像汽车里面有很多安全检测,电子设备也要参与整车的安全性认证,所以周期比较长。

消费类电子是里面最快的部分,不涉及各种各样的认证,只要符合国家基础的三c就可以了。

爱分析:除了家电领域,探境目前还做了哪些比较成熟的解决方案?

鲁勇:目前还只是在做家电这个领域。因为这个行业周期很长,我们设计一款芯片需要一两年,芯片到量产又得经过大半年,再跟客户做磨合又需要大半年。我们公司成立到现在还不到三年,所以还没有机会去做太多的场景。

爱分析:在家电领域,解决方案在不同的客户之间的可复制性如何?

鲁勇:80~90%是可复制的,只有10~20%需要调整。

爱分析:AI语音芯片市场空间有多大?

鲁勇:我们对每种家电分别做过测算,最终得到的总额差不多是接近100亿人民币的市场空间。

爱分析:未来3~5年战略规划是怎样的?

鲁勇:立足智能家居,向AI的其他场景包括边缘计算、安防、工业、零售、机自动驾驶等领域延伸。目前探境在音频前端传统算法和AI算法的结合方面,已有相当的技术储备。离线NLP业已实现模型小型化,只需占用极少的存储空间,使得离线NLP的低成本嵌入式方案成为现实。

另外,SFA芯片架构继续向前演进,高度吻合语音识别模型和NLP模型的需要,进一步在降低功耗和成本的同时保证性能。

未来,芯片架构及运算单元的整体设计适应于音频前端算法的要求,进一步提升耦合度,达到PPA优化的新高度。

联系我们