摘要:上工治未病,AI带来眼底影像筛查普及

调研|魏伯乐 晴空

撰写|晴空

上工治未病,预测疾病,防患于未然,向来是杏林圣手所为。如今,随着AI在医疗领域的渗透,对于患者来说,稀缺的“上工”有望触手可及。

通过深度学习算法,专注于眼底疾病的上工医信,已能够从眼底影像筛查出糖网病变、青光眼、白内障、以及各类慢病等近十种疾病。目前,上工医信AI眼底影像产品已进入500多家医院日常使用,其中1/3是三甲医院。

好的产品需要数据和算法双重积累

AI应用于医学影像,似乎已从一级市场的“风口”,进化至商业战场的“红海”。但眼底这个领域,能够真正深耕的企业并不多见。

上工医信副总经理兼技术总监康宏表示,虽然人脸识别、车牌识别、放射影像识别、眼底影像识别,底层都是以深度学习为代表的计算机视觉技术,但是眼底影像识别属于细小物体识别,技术积累没有显著物体识别那么深厚,需要公司投入更多精力研发。

而且,眼底影像数据的持续积累和高质量标注,都是公司核心竞争优势。

上工医信和中国微循环学会、全国防盲技术指导组一起建立了中国糖网筛查工程,引导26个省300多家医院内分泌科,独立开展糖网筛查。同时也承接了政府其他眼底筛查项目。

在康宏看来,通用计算机视觉领域的企业进入医学影像,技术上门槛不高,但是数据以及市场方面的门槛并不低。经过多年数据、算法积累,以及市场推广,先发优势依然具备一定的竞争壁垒。

不断扩展疾病覆盖,走向疾病综合管理

从一张眼底影像,能够反应出眼科、内分泌科、各类慢病等多种病变。目前,上工医信产品主要部署在医院内分泌科,帮助内分泌科医生筛查糖网。

今后,上工医信将继续推出其他疾病筛查。比如,11月即将上线针对医院眼科的白内障、青光眼筛查功能。眼科界专家表示,全国能够通过单张眼底影像准确识别青光眼的眼科医生不超过1500名,但青光眼的发病率并不低。

今后,上工医信将基于多年积累,不断扩展眼底疾病覆盖,并不断探索AI眼底影像识别应用的落地场景。

比如,以中国糖网筛查工程为入口,筛查出糖网病患者,为相关企业提供后续多项治疗服务的综合平台。

糖尿病属于典型的长病程疾病,慢病管理是刚需也是难题,基于眼底影像筛查这个入口,上工医信也会结合患者病历数据,介入患者慢病诊断、治疗过程,通过AI模型给出建议,向慢病管理进发。

从眼底筛查到慢病管理,上工医信践行早筛早治 | 爱分析访谈-ifenxi

近期,爱分析对刚刚征战MICCAI(Medical Image Computing and
Computer-Assisted Intervention)大赛归来的上工医信技术总监康宏进行了访谈,MICCAI是计算机影像处理计算(MIC)以及计算机辅助介入(CAI)两个领域的综合性会议。经过与众多国内、国际参与方角逐,上工医信摘得视盘分割第三,总评第四的佳绩。

爱分析与上工医信副总经理兼技术总监康宏,就眼底影像识别的技术、应用场景等进行了深入交流,现将部分精彩内容与读者共享。

一张眼底影像覆盖多种疾病筛查

爱分析:从2014年成立到现在,上工医信经历了哪些发展阶段?

康宏:第一个层面,从糖网这个单一病种的技术发展路线来讲,经历了从2014年成立之初的传统影像分析技术,到2016年应用深度学习方法进行糖网预测的过程。

2017年开始,进行基于深度学习算法的不断迭代和优化。

第二个层面,从疾病类型来看,2014年开始做的是DR(糖尿病视网膜病变)。到2016年,开始做白内障和青光眼的识别和诊断,目前已经完成了测试,预计2018年11月上线。

2019年开始,将发力慢病筛查,推出包括高血压、冠心病、脑卒中等预测性产品。。

后面还会推出肾病、风湿等相关的预测、诊断类产品。

爱分析:从DR扩展到白内障、青光眼、慢病,病变选择的内在逻辑是什么?

康宏:首先,我们所有产品的研发方向不是由我们来定的,而是来自医疗专家的建议,或者是来自医疗界的最新进展,产品研发不能闭门造车。

我们与国内的同仁医院,以及新加坡的医院都有很深的合作关系,专家会将最新的进展和需求反馈给我们,我们去考虑如何用AI实现。

爱分析:未来会继续向眼底影像的更多疾病、病灶扩展吗?

康宏:是的,这一定是我们的发展目标,眼底能够反映出来的疾病很多,基于不断积累的数据,我们会不断扩大疾病范围,目前布局大致是七八个,最后能够扩展到20个左右。

深度学习是主方向,但眼底影像识别技术有自身特点

爱分析:应用于眼底影像识别的技术跟通用计算机视觉技术有什么区别?

康宏:这个问题从两个角度去分析,首先是技术方面,如何用技术去解决实际的影像分析问题,早期是传统的影像分析技术,处于初级阶段。

之后,以机器学习,特别是深度学习为代表的AI技术,在影像分析领域发挥着越来越重要的作用。不管是哪种类型的影像数据,目前大家都走的都是深度学习这条路线,这是一个大的方向。

第二,眼底影像分析有其独特之处。最主要的一个区别在于,相比于血管、视盘的组织,眼底的病变点很小,基本上都是几个像素,十几个像素,最大也就是几十个像素因此小物体的识别和分割对于眼底影像分析就是非常重要的,而目前深度学习在细小物体识别和分割方面的积累还比较薄弱。

人脸识别、肺结节识别有大的目标,将这类算法用于眼底识别,大方向是可以的,但是也存在门槛。

首先是眼底数据,上工医信的数据是来自于临床,并且是专家高质量标注过的数据。用于模型训练的数据,经过多位眼底医学专家成立的标注小组确认。根据不同的阶段,基本上需要3-7位专家标注同一张数据,之后投票选出对于一个图像的定性以及定量结果。经过这样的严格标注,上工医信有质量很高的数据集。

其次,我们有专门针对小物体识别和分割的深度学习网络模型,开源的算法在眼底影像分析方面无用武之地,因为一般的算法都是针对显著性物体分析。

爱分析:如何看待计算机视觉领域的通用技术服务商,进入医疗影像领域?

康宏:从公司的角度,他们一定会追求利润率,目前人脸识别监控、自动驾驶都是更有商机的领域,这些领域对投资方的吸引力也更大。

但是当这些领域偏向于饱和之后,智慧医疗也是一个热点,这是国家支持的方向,他们可能也会向这个方向延伸。

但是除了技术方面,医疗影像行业也有其他进入壁垒。

首先是数据源以及高质量数据的标注,早期参与者会在一定程度上与医院合作,形成垄断之势,而出于职业特点,医生、医院客户的替换成本很高,这就造成市场推广也会面临挑战。

小数据集训练处于学术论证阶段,尚不适于商用

爱分析:如何看待小数据集训练的应用?

康宏:业内之所以尝试小数据集训练,是因为数据量不够,希望通过这种方法得到比较好的预测结果。

现在用的比较多的是对抗网络,生成一些数据会做深度学习网络训练,但我认为小数据集训练目前依然停留在科研阶段。

只有在并列分割方面,可以应用,但是对于疾病的分类和预测,如果数据量不够,结果必然不准确。

不管用何种方法生成出训练集,首先它是生成出来的,不是真正的东西,与真实数据一定有很大的差别。确认模拟程度好坏的标准在人,模拟的成果是否符合专家的标准,目前是存疑的。

小数据集训练仅仅是在技术方面提出了一种新的思路,还不能够真正应用到临床。上工医信的数据一定是来自于临床的,经过专家精标注的数据,只有这样,才能获得临床的认可。

影像和病历文本数据综合分析

爱分析:长期来看,从眼底影像向放射科影像延伸是否存在较大跨度?

康宏:大方向都是用深度学习来进行诊断和筛查,目前都是主流的模型,没有特别创新性的内容出现,所以技术层面不存在较大的跨度。

爱分析:文本数据处理技术和影像数据分析之间是否存在相通性?

康宏:这两者是用不同的深度学习模型来处理的。NLP是另外一种模型,两者其实是完全可以融合在一起的。

我们也会根据我们之前海量的眼底影像数据,加上对诊断信息的分析,综合起来给出更好的诊断结果。

爱分析:上工医信也会去处理一些病例文本数据?

康宏:是的,有可能要从医生的处方,或者病历档案中去发现信息,除了DR、慢病预测等产品之外,上工医信也在布局慢病综合管理,就是对筛查出的慢病人群进行更好的管理。

从检查结果、开具处方到用药的数据都会在我们的慢病综合管理系统沉淀,我们也用通过AI推荐诊断建议以及合适的治疗方案,并全程追踪患者的情况。

文本数据的处理实际上是一个很成熟的技术,以深度学习为基础的眼底影像分析现在则是刚刚兴起,但是效果很好。所以通过深度学习为基础的眼底影像分析,再加上病历文本数据的分析,一定能够提供更好的应用,我觉得这是很好的方向。