人工智能

以需求为导向,才是AI技术公司商业化的正解?

既要会赚钱,也要懂得构建壁垒。

2017年03月31日
调研 | 凯文 京京 撰写 | 京京
  • 人工智能
  • 疲劳驾驶检测
  • 视频检测
  • 图像识别
  • 智能语音

人工智能领域经历了2016年的热炒,如今无论是投资人还是创业者都逐渐趋于冷静,大家的关注点也开始从一些公司高大上的技术转向各家的商业化进程。

2014年开始运营的极限元在AI领域并不高调,但却是同时期AI创业公司中商业化能力较强的典型代表。

以需求为导向,而非技术研发为导向,是极限元对自身的定位。这样的定位也决定了极限元能用两年多时间,将语音和视觉等一系列技术应用于教育、电信、电力、娱乐、视频、驾驶等众多领域。

当然,不以技术研发为导向,并不意味着极限元缺乏技术实力。

这家公司的技术团队包括来自中科院、清华、华为、雅虎、搜狗、360等一些科研机构和大公司的精兵强将,联合创始人马骥曾是华为网络安全专家,创始人兼CEO雷臻也曾在华为工作,而后联合创立了全球最大的比特币交易平台——OKCoin,另外一位技术合伙人康利强来有着近20年的架构设计经验,负责公司核心技术研发。

此外,极限元还与中科院自动化所联合成立了智能交互联合实验室,双方将在语音、图像相关技术上进行产学研深度合作。一方面,极限元为科研机构提供产业界最新的技术需求动向,另一方面,科研机构为极限元提供全面的技术和人才储备支持。

目前,极限元已经积累了近50人团队,其中包括6人专门负责商务工作,挖掘客户需求,研发人员占比超过60%。

近日,爱分析对极限元创始人兼CEO雷臻、联合创始人马骥进行了调研访谈。

图:极限元创始人兼CEO雷臻

语音应用:口语评测、语音检索、个性化定制

语音是极限元起步时做的第一个方向。一方面,2012年左右,深度学习技术的突破引发了语音技术的新变革,尤其是识别率和合成效果得到了大幅提升,行业中也出现了一些新增需求;另一方面,极限元的创始团队中也有来自中科院以及清华大学的语音技术人才。

前期的产品化和工程化工作大概用了半年时间,2015年下半年,极限元开始交付一些语音技术项目,和语文出版社的合作是最具代表性的一例。

教育口语评测

当时,语文出版社想要为其发行的中小学语文教材,开发一款配套古诗词诵读学习APP,需要对语音诵读的字词准确性、韵律标准性等进行测评,同时还要有一些自主学习功能。这里面不仅要用到语音合成、语音识别、口语评测技术,还要用到笔顺、笔划的图像识别技术。

极限元通过招标拿到了这一项目。由于口语评测需要大量数据训练,因此极限元还专门开发了一款录音采集APP,通过语文出版社的资源对接,在一些中小学进行了语音采集,前后花了半年时间对模型进行不断训练和优化,从而提升识别和评测效果。

整个项目以SDK接入和私有化部署方式提供技术服务,采用一次性收费,后期还可通过一些模型更新收取增值服务费。

反电信诈骗

除了教育,极限元还和地方公安部门以及电信部门合作,把语音技术用在了反电信诈骗领域。通过对疑似诈骗电话的音频数据进行语音关键词检索,判断其是否涉嫌诈骗信息。该技术的成功应用,有效的减轻了监管部门的人工审核工作量,大大提升了工作效率。截至目前,该解决方案已在全国13个省有推广应用。

个性化音库定制

在语音合成技术方面,极限元不仅为腾讯、搜狗、360等大型互联网公司提供多平台的语音合成技术解决方案,还能为车载导航系统、读书软件、儿童智能硬件提供个性化音色的音库定制服务,包括录音人的选型、录音采集、语料标注、模型训练、韵律节奏优化、合成引擎定制化开发等全套方案。

图像应用:音视频有害信息监测、疲劳驾驶检测

对语音技术需求的挖掘也让极限元看到了图像的应用机会。除了语文出版社的笔顺笔划识别,在为网络监管部门提供音视频监测的过程中,极限元也在计算机视觉领域进行了一些技术积累,从而打开了图像技术应用的大门。

由于计算机视觉领域,做人脸识别和证照识别的公司很多,相关市场已经基本趋于饱和,因此极限元避开了一些热门应用领域,通过挖掘市场需求,将计算机视觉技术应用到了音视频监测、疲劳驾驶检测两大方向。

音视频有害信息监测

极限元在为网络监管部门提供音视频检测技术服务的过程中,积累了一套音视频有害信息监测分析系统,他们随后将这套系统升级优化,运用到了一些直播平台的涉黄、涉恐、涉暴内容监测上。

目前,极限元已经和数家在线直播平台和视频网站合作,通过公有云方式为他们提供实时音视频监测服务。

除了泛娱乐领域直播平台的敏感信息检测,极限元还为一些电商直播平台提供智能广告检测技术服务,识别视频中有无二维码或个人QQ/微信/手机号信息等。

疲劳驾驶检测

去年下半年,在计算机视觉领域有了一定积累以后,极限元看到了疲劳驾驶检测的机会。由于疲劳驾驶检测需要用到人脸定位跟踪、器官、表情、语音识别等技术,极限元在前期通过一些客货运公司、同事朋友的协助,采集了约50万名司机在驾驶室的45度角影像。

经过四个多月的数据采集、模型训练,2016年12月,极限元的疲劳驾驶检测仪全面成型,在PC端的功能和安卓上的SDK也已成熟,但由于生产环节的工艺设计需要花费较长时间,因此样机要等到三月底才能出来。

据马骥介绍,为了兼顾效果和用户体验,疲劳驾驶检测仪需要在误报率和准确率中间寻找一个平衡,在功能方面,它可以对驾驶员打电话、打瞌睡、声音、表情等大/小、细微动作进行监测,并适时予以报警。

而后,还会将当时的车况、路况、以及危险行为以影响或文字形式传送到后台,进行大数据分析,帮助危险品运输公司、客/货运输公司、交通监管部门以及网约车公司等进行一些绩效考核,并生成相关评估报告。

由于目前市场上已有公司做类似硬件产品,并且硬件本身毛利空间有限,因此极限元会把重心放在后台分析系统,软件以SDK方式授权给行车记录仪公司,而硬件则可能会以免费或低成本方式提供给客户,或者让客户根据需求灵活选择。

商业化能力决定能否活着,壁垒决定能长多大、活多久

由于AI在过去一两年的持续火热,大公司、创业公司以及资本的涌入,加上媒体的热炒,很大程度上抬高了人才价格,给创业公司带来了沉重负担。

高人力成本、计算资源和设备的投入对创业公司来说都是不小的开支。由于需求端尚未大规模应用普及,因此当前AI领域还处于高投入、低回报阶段,能否找到合适的商业化落地点以及明确的商业模式,是所有AI技术公司生死存亡的关键。

据马骥介绍,2016年,极限元已实现千万级营收。由于图像技术起步较晚,因此营收大都来自语音业务。不过,从其布局来看,语音领域市场需求较为分散,尤其是教育等领域,大小玩家很多,加上一些教育类公司也开始自己做语音,因此要找到有强需求和付费能力的大客户并不容易。

相比之下,图像领域无论是针对视频直播平台的音视频检测,还是面向车辆运营公司的疲劳驾驶检测系统,都属于强需求,并且存在很大市场空间。当然,音、视频监控和疲劳驾驶检测领域同样存在较强竞争对手,极限元还须应对来自技术和BD层面的双重PK。

不过,极限元CEO雷臻认为,AI技术在垂直领域集中度并不会很高,各行各业需求千差万别,同行业大中小客户需求和关注点也存在较多差异,有的对技术敏感,有的对价格敏感,所以市场足够大,各家都有机会。

有机会就能活着,不过,能长多大、活多久,也是创业公司同样需要思考的问题。

从短期看来,极限元以需求为导向的市场策略的确能够帮助公司快速实现商业化落地。不过,服务对象以企业为主的创业公司,要想成长壮大并实现长远发展,还需要在特定垂直领域做大做强、构建壁垒,无论是品牌、数据、还是解决各类需求的能力。

以下是部分精彩访谈内容,与您分享。

爱分析:极限元在选择客户时如何考虑?

马骥:极限元在向客户提供技术服务的同时,会仔细分析客户所在的行业是否存在同样的技术需求,以及行业内是否有一些普遍存在的行业性难题亟待解决,有针对性的为整个行业用户提供技术解决方案,由点到面,从服务单一客户过渡到服务于整个行业。

爱分析:计算资源方面公司每年投入大概多少?行业整体情况如何?

马骥:计算资源建设方面我们去年下半年投入了200多万,行业情况要看计算量,如果只是对一个点去做一些训练,计算量没那么大,自己买台服务器,用传统的方法就可以搞定。但一旦涉及到大量数据,尤其要对用户开放SaaS服务的话,除了计算机资源,还有带宽、存储等,也是很大的成本。

爱分析:服务方式是主推公有云还是私有云?

雷臻:我们主推都是公有云,因为这样我们维护成本也会更低,用户规模增长也会更好,但有些用户不希望他们的数据在公有云上跑,比如网信办这种,所以就必须部署私有云,其实私有云成本也并不高,因为就是把公有云那套东西再复制给他,更多的可能是一些维护成本而已。

爱分析:公有云方面,类似阿里云这类服务商会不会抢夺市场?

雷臻:大型互联网公司比如阿里云更多的还是提供基础云服务,AI技术一般开放给我们这些AI公司去做。就像腾讯游戏的开放平台一样,把生态开放出去才能实现互补,而且还能增加他们的用户粘性和停留时间。

爱分析:如何看待讯飞这类巨头和创业公司在整个市场中的角色?

雷臻:讯飞是这个领域的老大哥,也是我们的榜样,但是他们在通用领域做的话,想象空间更大,如果往垂直领域延伸,他们作为一家上市公司,还是需要看投入产出比,所以垂直领域交给我们这些小弟去做就好了。

爱分析:如何看待当前AI在各行各业的渗透情况?

雷臻:传统行业里面一些有规则可循的工作都会逐渐被机器取代,但是很多AI公司进入各行各业的速度并没有想象中那么快,比如安防领域有海康威视做得特别大,医疗领域一方面很难进入,另一方面技术上也困难重重,所以这些我们也不会碰。

相比之下,娱乐、金融、教育等一些行业渗透起来就会比较快,AI发挥的作用也越来越大。所以我们也会选择这样的领域去切入。

爱分析:如何推动AI技术在各行业的大规模普及?

马骥:一方面需要各行各业加深对AI技术的理解,把自己的需求跟新兴技术做整合,另一方面AI技术公司也不能高高在上,不仅要不断学习运用新技术,还要深入各个行业帮助他们做需求分析。

爱分析:您之前曾表示,AI领域在接下来一两年会进入寒冬,一两年之后会逐渐回暖,背后有哪些逻辑?

马骥:进入寒冬是因为一些没有技术、滥竽充数的公司,或者有技术,但找不到很好的商业模式的公司,会陆续死掉。而回暖是因为,随着全社会人才储备逐渐跟上,加上一些公司倒掉后释放出的人才资源,会让整个市场人才供给充分起来,价格也回归理性,就能带动市场回暖。