医疗

当NLP遇到医疗数据,会擦出什么火花?

森亿智能为什么选择专病CDSS?

2019年06月28日
调研 | 张扬 晴空 撰写 | 洪军
  • 医疗
当NLP遇到医疗数据,会擦出什么火花?

医疗大数据是医疗前沿重要的发展方向,大数据与医疗结合,不仅会提升临床诊疗效果,还会对保险、药品研发等多个医疗健康领域产生深远影响。

但医疗大数据面临严重的质量问题,主要体现在数据统一性、完整度、准确性三个方面。因此,要想将大数据与医疗深度结合,底层数据和上层应用能力都必不可少,而森亿智能是能同时提供这两种能力的典型企业。

当NLP遇到医疗数据,会擦出什么火花?

提供从数据中台建设到上层应用整体解决方案

森亿智能是一家以NLP技术为核心,为医院提供医学数据治理和上层医院管理、科研、智能辅助诊疗等解决方案的医疗大数据公司。

森亿智能通过对三级医院的HIS系统、LIS系统、PACS系统等系统数据进行清洗、治理,形成具有统一、标准输出接口的数据中台。

在数据中台之上,提供精益医院管理、智能化临床研究、以及智能辅助诊疗与临床精益管理三大解决方案。

当NLP遇到医疗数据,会擦出什么火花?

精益医院管理解决方案依托医院信息平台积累的海量数据和AI技术,对临床质量、不良事件进行精准管控,实现数据驱动的精益管理。

智能化临床研究解决方案能够自动化解决医院海量临床数据与科研数据结构化以及标准化问题,帮助医院实现高价值数据资产累积的同时,建设特色学科、提升医院整体影响力。包含临床科研无缝对接、智能秒级语义检索、端对端科研一体化等服务。

智能辅助诊疗与临床精益管理即专病辅助诊疗(专科类CDSS),基于过往专病诊疗数据和医学知识图谱,打造深静脉血栓、败血症等对医院诊疗质量评价影响较为明显的疾病解决方案。

数据中台建设为上层应用奠定基础

在森亿智能整体解决方案中,数据治理能力和数据中台建设既是医疗大数据企业的核心竞争力,也是打造上层解决方案不可或缺的一步。

由于医院信息化系统往往源自多家供应商(例如HIS系统采购卫宁健康,LIS系统采购东软集团,手术麻痹系统采购麦迪科技),导致各个系统的时间戳可能都不相同,医院内整体数据混乱不堪。因此,需要搭建统一的数据中台为专科辅助诊疗提供数据基础。

森亿智能在建设数据中台的过程时,会输出标准化、统一化的接口,以便为不同医院进行上层应用建设时减少定制化开发。

可以毫不夸张的说,坚实的数据中台建设和数据治理能力,是森亿智能上层AI应用解决方案的地基。

专科辅助诊疗更易于实现商业化落地,多维度选择病种

从NLP技术在医院诊疗领域的应用来看,智能辅助诊疗大体可以分为全科辅助诊疗和专科辅助诊疗(也是新一代CDSS的两个主要方向)。森亿智能创始人张少典表示,之所以选择主攻专科方向,其中一个重要的原因就是,专科辅助诊疗更易于实现商业化落地。

全科辅助诊疗很大的需求方是基层医疗机构和民营医院,这类机构付费能力低。而付费能力较高的三甲医院,由于医生水平较高,对于一些常见病是不需要辅助诊疗,因此三甲医院的需求点在于专科辅助诊疗。

既有需求,又有付费能力和意愿,同时也跟团队的初心和基因协同,专科类的智能辅助诊疗成为森亿智能重点攻克的方向。在具体的病种选择层面,主要有一下几点考虑。

第一,具备CDSS可行性。如果有一些病种太难,或者需要的处方在国内并没有获得上市资格认证,那么该病种辅助诊疗就不具备可行性。

第二,具备足够多的数据。基于AI或者NLP进行建模时,需要大量的数据,因此足够多的数据是保证稳定性和准确度必不可少的基础。

第三,尽可能选择对医院诊疗质量评价影响较为明显的疾病解决方案。医院对于能够快速影响医院诊疗质量的疾病(例如血栓、冠心病)的辅助诊疗需求相比于慢性病(例如肿瘤)更迫切。

目前,森亿智能主要客群是三级医院,已经在研十多种专科病种,其中深静脉血栓和败血症专科产品已有医院正式采购。

当NLP遇到医疗数据,会擦出什么火花?

近期,爱分析对森亿智能创始人张少典进行调研访谈,对森亿智能的业务模式、医疗大数据的行业现状与趋势进行阐述,现将精彩内容分享如下。

张少典,森亿智能创始人、CEO,毕业于美国哥伦比亚大学医学信息学专业并获取博士学位。曾在微软研究院、微软亚洲研究院、以及纽约长老会医院等从事医疗数据挖掘研究。

从技术解决方案到产品解决方案,推动医院智能化升级

爱分析:森亿智能的发展历程是怎样的?

张少典:我个人是技术出身,主要研究NLP在医学的应用,重点分析病历和医疗文本。刚创立森亿智能时,主要想法是基于自身能力提供服务。当时公司定位为医学文本处理和医学自然语言处理技术供应商,也就是将技术形成API卖给中间商或者医院,很多医疗大数据公司都是我们的客户。

在A轮之后我们开始做战略转型,不再只是单纯的技术供应商,而是要做产品和解决方案,并将医院作为最终用户。

做这个战略转型的主要原因:一是,在中国,单纯的技术供应商很难成为大体量的公司,尤其数据和客户源都不属于我们;二是,商业化变现很难实现。

总体而言,我们基于自然语言处理、知识图谱、数据挖掘能力和机器学习等技术去帮助医院做整体数据的汇集、处理、清洗、治理、分析,完成数据中台建设。再在数据平台基础上,去构建科研、诊疗的人工智能应用,为医院提供整体的数据化、智能化解决方案。

爱分析:从应用场景来看,专科诊疗解决方案和智能化临床研究对于数据清洗颗粒度的要求有何差异?

张少典:智能化临床研究对数据清洗精度要求比较低,它的要求是对所有数据进行治理,方便查询和分析。比如说研究人员想筛选过去4-5年医院所有二型糖尿病患者,筛选的结果里即使有些不是二型糖尿病患者,但还可以经过人工再核查一遍。

但是专科诊疗解决方案不一样,它的要求是哪怕不是百分之百准确,但校验系统也要知道哪些地方可能会犯错。比如构建一个深静脉血栓辅助诊疗模型,虽然需要的字段并不要特别多,但是这几个字段必须是百分之百准确的。

数据中台建设是上层应用基础

爱分析:数据中台建设是要将医院内所有数据都进行接通吗?

张少典:是的。但不同医院开放程度不一样,理想情况下是将医院所有的诊疗数据都进行数据治理、纠偏补全。

医院有很多系统供应商,来自不同厂商,这会导致医院数据非常混乱。比如:医院两个系统用的时间戳不一样,一个是服务器的时间戳、另一个是工作站的时间戳,导致时间都对不上,甚至可能会出现医生报告出来的时间早于医生检查的时间。

所以第一步是要建立数据中台,然后在数据中台基础之上,去建立人工智能的应用。

爱分析:医院是先做数据中台再去做应用,还是从某个具体应用切入去做数据中台?

张少典:都有。有的医院直接采购数据中台,但主要还是从某一个应用为抓手去做上层应用,进一步建立数据中台。

我们一般对接的是医院的信息科,但一般来说我们做的项目标的都是百万以上,不是职能科室可以完全决定的,需要院领导同意,但信息科是主导的执行部门。

爱分析:数据中台部署时是否需要针对每家医院提供定制化解决方案?

张少典:需要,因为各个医院系统不一样,在进行数据治理、数据清洗时就会不一样,建数据中台就是为了进行标准化、统一化。

医院的input数据全都是个性化的,建数据中台的目的就是为了让output是统一标准的。不管医院的HIS系统、LIS系统、PACS系统、超声系统、手麻系统是哪个供应商,经过我们数据处理之后就会形成统一的一套数据标准。

这样做带来的好处是,后续为这些医院提供上层智能化AI系统时,可以提供标准化的产品,减少定制化开发。

专注于专科辅助诊断,多维度选择病种深耕

爱分析:森亿智能提供的是专科辅助诊断还是全科辅助诊断?

张少典:我们主要提供专科辅助诊断。

全科辅助诊断的应用需求方是基层和民营医院。这类机构没有很强的付费能力,而且对于民营医院,全科辅助诊断也不是刚需,他们有很多降本增效的方法。

虽然全科辅助诊断具有很好的医疗意义,但是商业化落地很难,此外,数据、技术实现上也有很大的挑战。

但对于三级医院来说,他们对全科CDSS没有诉求,医生水平很高,一些常见病根本不需要辅诊,但是在一些专病复杂的情况下质量管理做的不是特别理想。比如说院内感染、血栓、心房颤动、突发冠心病等,这种情况下才需要辅助,所以三级医院更多的需求是在专科辅助诊断。

爱分析:森亿智能决定做哪些专科病种是由客户的需求决定的吗?

张少典:选择做什么病种要看几个维度。

第一,这个病本身是否具有CDSS可行性,如果专病对于CDSS太难了,那么就无法完成;第二,要看数据量是否充足,如果数据不够,就会导致训练的模型不准确;第三,尽可能选择对医院诊疗质量评价影响较为明显的疾病解决方案。

医院对于能够快速影响医院诊疗质量的疾病(例如血栓、冠心病)的辅助诊疗需求相比于慢性病(例如肿瘤)更迫切。

爱分析:森亿智能现在诊疗做了多少个病种?

张少典:我们自己内部做了十多种,真正投放市场发布的就1-2种,今年会发布5-6种。因为即使有了模型之后,还要将模型进行优化,再生产出产品,最后进行产品迭代,样板点实验,这需要一段很长的时间。

现在发布的是深静脉血栓、败血症,这两个都有医院在采购。

爱分析:森亿智能的产品与友商有何差别?

张少典:我们主要是专病深入,非常纵深。例如我们提供的深静脉血栓辅助诊断,是从血栓的预防、筛查、诊断、治疗方案的选择、治疗后的全套解决方案。

另外未来我们更多的是作为平台型公司。可以让第三方研发人员在我们的数据中台基础之上做应用开发。

爱分析:森亿智能怎么看待IBM的Waston?

张少典:Watson远远不止是众所周知的Watson for肿瘤医生,其实Watson两年前就有127个产品,Watson for 肿瘤医生只是IBM对外进行宣传的一个工具,不是收入来源。

收入真正的来源是提供给药企、CRO、医院的分析工具,患者招募工具,临床实验工具。这也意味着Waston对于肿瘤落地本身就没有报太高期望。只是一个品牌打造。

其次,Watson for 肿瘤医生这个产品做的是不错的。但在商业化落地角度来说,一直没有很好的落地,因为IBM没有真正把他当做一个商品。

我认为Watson这里犯的错误一是过于把这个品牌贴在自己身上。例如,我们和医院或专家研究一个病种的时候,都会把这个招牌贴在医院或者专家的身上,不会说是森亿的功劳。这样会让医生和医院和你站在一起,维持良好的关系,毕竟他们是知识的提供方,而且这样也会有权威性背书。

但是Watson都是品牌自揽,这也是为什么MD安德森癌症中心、凯特琳癌症中心两大数据源与Watson终止合作。另外,他在中国落地最大的问题还是本地化问题。比如,按照他的诊疗处方进行诊治,但是有些处方却没有在中国上市。