从筛查到病灶管理，图玛深维打造全流程AI影像产品-爱分析

从筛查到病灶管理，图玛深维打造全流程AI影像产品

在近两年的人工智能+影像识别浪潮下，拥有过硬的技术储备、精准的数据储备以及到位的诊疗理解能力的公司，将有机会做好产品并最终成为行业的佼佼者。图玛深维在技术、数据、产品落地方面都投入良多，保证了图玛深维能向市场推出实用性产品。

当前，科技在医疗领域的应用思路已从移动医疗转移到AI+医疗层面。在这个过程中，创业公司的思路也从将医生与患者连接起来的层面，转换到提升医生工作效率、从而为患者提供更优质医疗服务层面。

2015年图玛深维创始团队在美国圣地亚哥开始收集肺部影像数据，同时储备肺结节识别技术，并于2016年3月回国开始了肺癌影像识别、诊断、疾病管理产品的研发。

图玛深维从肺结节影像识别切入AI+医疗领域，从肺结节的筛选、良恶性判断、给出诊断分析报告，一直到患者随访与管理，图玛深维产品贯穿肺癌或者肺病患者从检出到治疗的全过程，在AI医疗影像领域是技术产品和市场应用都较为突出的医疗科技公司。

图玛深维目前有三大产品线，其中σ-Discover Lung系列产品在识别准确度、假阳性、模型可靠性等方面已处于行业领先水平。

从筛查到病灶管理，图玛深维打造全流程AI影像产品

深度智能诊断涵盖疾病筛查、诊断、报告、病患管理全流程，产品性能优越

图玛深维拥有三大产品线，其中σ-Discover Lung系列产品涵盖了影像科医生工作全流程，即从影像识别到给出诊疗建议。在医院影像工作流中，放射科医生会将诊断结果和诊疗建议提供给临床医生参考做最后的治疗方案。

运用人工智能技术进行影像识别，要真正做到辅助医生给出诊断报告和建议，需要先做到结节检出、病灶分割、良恶性判断这三步，其中结节检出部分的准确性和假阳性率，取决于训练数据集和测试数据集的数量、质量以及差异性。

从筛查到病灶管理，图玛深维打造全流程AI影像产品

图玛深维在进行肺结节筛查模型训练时，没有刻意挑选同质化的数据，为了提高产品的扩展性能，图玛深维的训练数据来自于全国各地的医院，充分考虑了不同人群的差异化，以保证数据多元性，产品的覆盖人群更广。

由于产品延展性较好，对于不同的医院，图玛深维提供的核心技术是一样的，无需对每个医院重新制作模型，只要针对不同医院的需求进行功能调整即可。

检出病灶后需要进行病灶分割和良恶性判断，其中良恶性判断是图玛深维在跟医院合作时医生提出的需求，对于技术有比较高的要求，因为不同的设备、参数以及影像的质量都会对良恶性判断产生影响。

图玛深维的良恶性判断阳性检出率能达到90%，能够非常好的辅助医生做病灶良恶性诊断，降低漏诊率，提高基层医院诊断效率。

目前σ-Discover Lung系列产品已经在国内60多家医院试用，其中绝大部分为三甲医院、三级医院，意味着产品开始正式启用的第一批用户是国内头部医院，对于以后的市场推广有良好的示范效应。

云端产品辐射基层，“AI+影像识别“助力优质医疗资源下沉

无论是头部医院还是基层医疗机构，辅助诊疗、提升诊断效率都是医院的迫切需求。而人工智能与影像识别技术的发展正在助力国家推进优质医疗资源下沉的号召。

图玛深维在攻克AI影像诊断产品技术的同时，搭建云端CAD产品，一方面使院内不同科室之间可以顺畅地共享影像，另一方面可以使基层医疗机构的影像上传云端，云端软件产品可以给出初步诊断意见，对于需要专家判断的情况，云端产品提供连接三甲医院的影像传输通道，智能诊断和专家诊断双管齐下，实现优质医疗资源的下沉。

当前将AI应用到影像识别领域的公司主要可以分为两类，第一类是以汇医慧影、医众影像等为代表的影像胶片电子化、影像云平台，进而转入AI影像识别领域的公司；另一类是以图玛深维、雅森科技、推想科技、DeepCare等为代表的新兴AI影像识别的公司。

不论是先做云平台打通三甲医院与基层医疗机构之间的影像传输路径，还是先钻研影像识别技术提升阅片效率，最终的场景都是在机器提升效率、优质医疗资源下沉渠道畅通的前提下，改善国内放射科阅片医生资源紧缺、工作压力大，并提升医生诊断效率，有效降低漏诊率。这一愿景也契合国家在医疗层面大力提倡的分级诊疗制度，有着广阔的发展前景。

高效的影像传输和高效的智能诊断相辅相成，是医院、患者以及当前医疗科技领域创业公司都乐见的未来。

“AI+影像识别“应用病种不断扩展，AI和大数据试水病理图像和基因分析

图玛深维智能诊断产品和云端CAD产品目前涉及到的是产品趋于成熟的肺病以及正在研发中的肝病，今后，AI在影像领域的应用将陆续扩展到胃癌、心血管疾病等可以有标准化影像的疾病领域。

同时，团队多年积累的AI技术在医疗领域的应用，除了影像领域，还扩展应用到病理图像领域和基因数据分析领域。

虽然病理图像数量远不能跟影像数据相比，但是病理图像一般都是疾病确诊的重要依据，有很大的研究和发掘价值，病理科医生的紧缺现象在国内也很严重，同样是有医疗价值和商业价值的方向。

另一个方向是基因大数据，基因测序市场近年高速增长，在有足够多的标准化基因数据的情况下，通过深度学习与医疗大数据的结合，图玛深维的智能医疗数据分析平台可以准确并及时的对多种病症进行预测与诊断。

目前图玛深维正在积极地研发病理学分析和基因大数据分析类产品，争取早日实现产品落地。

助力头部医院科研，同时获取优质精标注数据

在AI医疗影像领域，好的产品背后是好的系统模型，对于影像智能诊断系统的训练，数据和算法同样重要。在算法方面，图玛深维有顶级科学家和富有人工智能算法经验的工程师；在数据方面，图玛深维的精标注数据来源于国内三甲医院主任医生及其带领的医生团队。

国内医生除了临床工作，还有一定要求的科研工作，而大部分医生精于医学，对于算法与模型层面了解有限，图玛深维的算法工程师在研发产品的同时兼顾医生科研算法协助的工作。

有这种科研合作的医院医生在使用图玛深维影像诊断产品的同时，会源源不断的提供精标注的数据，供图玛深维团队进行算法迭代和产品升级。性能越好和准确性越高的产品，对于基层医院和其他使用影像产品的机构越具有吸引力。

筛查是应用大场景，体检机构是重要需求市场

影像识别的最基础应用就是疾病筛查，这一需求在体检中最常见，体检产生的影像，大部分都是健康体影像。

人工智能筛查产品的假阴性率极低，在体检中，医生只需对筛查软件检出的阳性案例进行筛选，剔除假阳性，找出真正的病历。这个过程可以极大的降低读片医生的重复性工作，在医院体检以及第三方体检机构有着巨大的市场空间。

除了医院和体检机构是直接目标客户，图玛深维也与GE合作，进一步扩宽产品的商业化渠道。

用心打磨产品，才能被市场认可

医学是知识壁垒很高的学科，医疗是知识含量和技术含量很高的行业，在近两年的人工智能+影像识别浪潮下，拥有过硬的技术储备、精准的数据储备以及到位的诊疗理解能力的公司，才有机会做好产品并最终成为行业的佼佼者。

总体来看，技术产品与市场应用的完美结合是图玛深维的重要优势，潜心产品研发也保证了图玛深维能向市场推出实用性产品。

从筛查到病灶管理，图玛深维打造全流程AI影像产品

近期，爱分析对图玛深维创始人兼CEO钟昕进行了访谈，现将精彩内容分享如下：

算法研发与数据获取并行，志在将AI技术应用于中国医疗

爱分析：图玛深维从成立到现在大概经历了哪几个阶段？

钟昕：最开始一年（2015年3月-2016年3月）是早期的算法研发阶段；2016年3月-2016年6月是快速产品开发阶段，主要是契合医生使用的专业看图软件开发；2016年6月-2016年9月进行产品迭代和软件开发；到2017年初软件开发完成。

2017年是产品的试用和推广时期，开始向医院推送产品，准备商业化。

爱分析：相比于国内，美国的医疗数据会比较容易获取吗？

钟昕：其实不是这么回事，美国的医疗数据，大量的公开数据集是很容易获取的，但是医院、病人的数据几乎是拿不到的。我们的工作如果是为了服务欧美人群，仅限于公开数据集就够了，或者跟美国的大医院合作可以在美国开展工作。

但是我们的产品和市场都是针对中国人群，所以从2016年回国就开始获取有规模的中国数据，软件开发也是在中国数据的基础上做的。

爱分析：中国的数据最开始是怎么获取的？通过跟医院的合作吗？

钟昕：最开始是跟医院以科研方式的合作。医院有自己的医学领域科研需求，我们既帮助医院做科研，同时也完成自己的科研要求，是一个互利互惠的过程。

爱分析：影像领域需要大量精标注的数据，是否需要医院投入很多精力？

钟昕：是，所以我们只跟最顶尖的医院合作，首先我们对医院的数据和数据标注有要求，其次医院做科研的愿望要非常强烈，才会投入很多的精力。现在很多医院是一两位主任医师带着几个年轻医生来做这项工作。

爱分析：所有数据标注的工作完全是由医生完成的？

钟昕：是的，有时候一套数据还需要一两个医生对账式的标注。

标准化影像和数据是影像识别基础，高发性疾病有大市场

爱分析：很多公司从肺结节识别切入影像识别领域，是因为有公开的数据集吗？

钟昕：公开数据集是其中的一个原因。还有一个原因是肺结节主要在CT图像上进行识别，CT图像是相对比较标准化的图像，不同型号的机器以及不同医院拍出的片子差别不会很大，比如核磁图像不同型号、不同医院、不同品牌的序列差异性非常大，所以就比较难做。这是大家选择肺部CT来做的很重要的原因，标准化程度高。

另外因为肺癌和肺结节本身是高发性疾病，恶性度也非常高，大家选这个方向也是出于市场的考虑。

爱分析：后来又做了肝病方面的研究，这方面的数据是怎么收集的？切入肝病是怎么考虑的？

钟昕：数据收集也是一样的，包括公开数据集和与医院合作两部分来源，目前与好几家医院在进行肝脏方面的合作。

癌症病种占比最大的是肺癌，占20%；接下来是胃癌和肝癌，占10%左右；再往下就是乳腺癌、结肠癌、食道癌，这些都是高发性癌症。选择切入病种肯定会选择常见的癌症，其次是有足够数据的病种，另外图像要是标准化的。

我们会选择在中国既高发，又有比较大的市场的方向，这样才会产生市场价值和医学价值。

诊断功能是筛查功能的进阶，高难度高要求

爱分析：诊断功能的难点主要是在数据层面吗？

钟昕：是的，其实这个功能挺有难度，到现在诊断功能已经做了好几次迭代。针对不同的设备、不同的参数设定，要给出不同的模型。找出结节不太受设备的影响，但是判断良恶性的时候做的比较谨慎。要让医生信任给出的结果，准确性就要非常高。

爱分析：跟设备有关系指的是采集到的数据的质量方面？

钟昕：是的。判断良恶性，如果图像很模糊，或者有伪影，对良恶性判断的影响会非常大。

爱分析：在做第一层检测的时候设备影响没有那么大？

钟昕：是的。发现用很多不同设备、不同参数产出的数据，包括10个不同厂商的40多款产品，测试的效果是差不多的。

算法类似人脸识别，技术积累与研发投入决定产品性能

爱分析：影像识别这个领域在技术方面是不是跟人脸识别类似，都是通过提取特征点、特征值来做比对？

钟昕：基本算法可以说是一样的，人脸是二维的图像，一般也是先在一张照片中将人脸找出来（检测），再去认识是谁。通常这两个核心问题跟影像识别是一样的。

影像识别是先把可疑病灶找出来，然后再确定到底是不是病灶，再来判断良恶性，思路是一样的，用的方法也是deep learning。毕竟人脸是一个二维的数据，它提取特征的方法也是人工智能的方式，已经很少用人为定义的方式，我们也是一样，但是我们对应的三维数据居多。

爱分析：以之前的经验，只是做检测功能的算法，大概需要多少基础的数据量？

钟昕：几千例数据可以做一个初步的产品，可以说是产品原型。现在我们看了一些论文，数据量每增加一个数量级，检出率会不断地提高。我们也感觉到，数据持续不断获取的过程中检出率在不断的提高，目前每两个月迭代一次。

爱分析：最开始几千例的数据大概要求什么质量水平？

钟昕：我们没有很挑数据质量，我们的算法是很领先的。产品没有专门针对某一家医院或者某一种设备（GE、西门子或者联影），我们做的时候什么样的数据都有，有很厚的5mm的，也有超薄的西门子0.5mm的，所以数据质量当时是比较差的。

我们是在比较差的数据上做了前期的准备工作，最后真正应用到医院里发现表现会更好。自己测出来97%的检出率，到了一家配有最新标准设备的医院，效果超过97%。

如果到一家医院需要做一次算法的调整，专门针对当前医院的设备去做调整，这样产品会做得比较痛苦，推广到100家医院就做不下去了。

爱分析：这是什么原因造成的？是因为刚开始做算法的数据不是那么多维度，所以拿到新的数据需要重新去做吗？

钟昕：是因为公司选用不同的方式，最开始可能集中于一家或者两家合作医院，数据的变异性或者差异性就比较小，所以最开始的结果非常好，96%、97%的检出率都可以实现，算法也不是很费劲，换了一家医院发现结果不是很好。

所以比较成熟的医院都有很多台CT，老的新的都有，而且是不同厂商不同参数设置的，医院会测试算法，测试过程中就会发现大家的产品性能是有差异的。

爱分析：相当于是模型过拟合？

钟昕：可能是模型过拟合，也可能是模型过于简单，都有可能。

随访打造数据闭环，医院信息互联互通是行业痛点

爱分析：疾病跟踪或者叫随访，是帮医生作出院之后的跟踪随访吗？

钟昕：出院后续的随访不包括在内。实际上，对于重大疾病，医生建议六个月或者多长时间回来做随访，病人基本都会来，不难跟踪管理。

最重要的是数据回到医院以后会在医院自己的数据库里，需要把数据找出来，做自动对比，这个工作并不是很困难。

爱分析：但比如说病人换了一家医院做检查，而且是跟我们没有合作关系的医院呢？

钟昕：这个问题是到现在为止，中国以及国外都是不太好解决的，这是医院之间数据互通的问题，非常重要的问题。

还有一个问题是病历号管理，有些大医院甚至还存在同一个病人看两次病有两个病历号的情况。但是医生对于病人的情况是非常了解的，当病人跟医生沟通说之前在这个医生这里做过CT，医生可以通过姓名把病历找出来，用我们的软件做一些自动分析。

现在医院数据互通还有标准化的工都没有做好，甚至是大的三甲医院这方面的工作也没有完全做好。

提供给临床医生是产品的未来

爱分析：现在的产品主要是影像医生在用，临床医生那边会有类似的产品吗？

钟昕：已经有一些临床医生在用，包括内科医生、外科医生，但使用最多的是影像医生，影像医生忙不过来。

让临床医生使用很重要，毕竟在医院里面临床医生是最终见到病人的，了解病人的所有信息，影像医生毕竟隔了一层，只看到结构影像的信息，还有病人的一些基本信息，不是所有的医院的影像科大夫都能够看到完整的病人检测报告，所以最终产品希望是临床医生使用。

爱分析：临床医生使用主要是解决什么问题呢？

钟昕：外科医生要开刀的时候，如果病人身上有10个结节，甚至更多，影像科医生会提示多发结节以及位置，里面最重要的结节会圈出来，或者有截图。

外科医生开刀的时候要做良恶性判断，需要知道全部信息。比如说有些结节看上起很小，但是可能在一个肺段里面跟特别大的恶性结节在一起，很有可能就是恶性的，需要全部切除。

再比如一个结节定位在肺部的一个亚段，外科医生开刀的时候需要考虑是局部切还是全切，血管的走势是什么样的，外科医生需要做出对人体伤害最小的判断。我们的产品有三维重构的功能，会把病灶还有周围血管、气管的结构都重建在医生面前。

因为外科大夫的空间想象力不如病理科大夫和影像科大夫，影像科医生天天看图像，外科医生喜欢直观的呈现，所以需求的出发点会不一样。

内科大夫更多的是判断结节的良恶性，最终要把病人推给外科医生，如果是普通的病人就要考虑保守治疗、或者跟踪随访以及介入的方式治疗，因此内科医生对于结节也非常关心。

还有放疗科，放疗科要做规划，所以对结节的数量以及大小特征的掌握都很感兴趣。最后希望我们的产品只要是医院胸科的医生都能够使用。

蓄势待发，CFDA申请今年落定

爱分析：医院现在使用产品是付费的吗？

钟昕：还没有，CFDA认证还没有拿到，今年拿到以后应该是可以付费的。现在相当于是试用期，签了协议。

爱分析：CFDA认证归类是属于传统影像软件吗？还是影像辅助诊断软件？

钟昕：影像辅助诊断软件。

爱分析：这种辅助诊断必须要经过认证吗？

钟昕：不仅仅是辅助诊断，就算是辅助测量，测量肺结节的直径大小的软件，功能也是要经过CFDA认证的。

存量市场有限，助医院创收是市场发力点

爱分析：像医院影像科、信息科，每年在辅助诊断影像软件上的预算大概在多少？

钟昕：不同医院的差别很大，大的三甲医院可能会有上百万，向院长打个报告就可以，甚至在一定预算范围内主任就可以批。有些的小的二级医院一年可能只有几十万的软件费用。

但是大家都会有一些预算，现在国家也会扶持，信息科都有自己的年度预算，一般来说2018年产品要卖给医院，2017年就要跟医院建立联系，然后包括在购买预算中。

爱分析：这么看来纯软件投入的潜在规模不是特别大？

钟昕：如果只有一款产品的话收入就这么多了，不过买了以后会有后续15%的服务费，主要是产品线要丰富，因为要帮助医院创收，带来一些筛查的项目。

比如说医院每年做1万例体检筛查，加了肺结节的专科门诊，一个病人一次CT检查的平均价格是300，就是300万的收入，那么投入50-100万买产品还是可能的。

以前做不了这一项是因为医生没有时间，现在有了这个软件可以帮助医院创收，而且对医生几乎没有额外的要求。

现在可以帮很多医院做体检项目的筛查，体检公司就更不用说了，像爱康国宾每年都有很多体检病历，有这方面需求。