医疗

曜立科技医疗总监韩潇:构建医疗标准字典,医疗大数据必经之路

构建医疗标准字典,能否成为医疗数据服务商的核心竞争力?

2017年11月06日
调研 | 李喆 关蕾 撰写 | 关蕾
  • 医疗
  • 医疗大数据
  • 医疗标准字典
  • 数据分析管理平台

医疗大数据应用场景众多,但苦于数据处理和分析积累不足,整体市场仍处于早期探索阶段。从众多场景应用中,为医院科室解决数据处理、科研和管理需求,目前看是较好的突破口之一。

曜立科技成立于2015年,创始人来自临床医学、通信、计算机、移动医疗等多个领域,在垂直领域和跨行业资源层面积累较深。

创立之初,曜立科技便致力于通过大数据技术为医生高效智能的分析和处理数据,以单病种数据切入,为医生提供智能软件工具,解决医生科研和管理需求。

经过两年发展,曜立科技在数据源获取、数据平台搭建、应用场景、产品打磨、客群获取等环节,形成一定的商业闭环,目前已在30余家医院等落地。

曜立科技发布了Willow®平台应用软件模块,为医疗人员、医疗机构、医药企业、医疗保险等客群,定制数据集成处理平台,将大数据算法、人工智能技术与医疗信息相融合,帮助客户便捷地获得最有价值、可直接应用于实际场景的医疗数据。

Willow®的四个软件模块既可单独使用针对某种数据处理需求,又可融合成完整解决方案。曜立将根据客户需求和应用场景,为其安装适合的单个或组合应用模块,帮助其高效、可视化地完成工作。

曜立科技医疗总监韩潇医生认为,用户需求是做产品的根基。曜立科技由需求引导研发,所切的应用场景与医生工作流程结合紧密,产品以工具集的形式呈现,满足多元化的应用。

客群层面,有临床、科研、管理应用需求的医疗机构是其种子客群。随着经验体系的积累、算法和结论的逐渐丰富,更深层次的分析应用将被触及,例如临床辅助决策、药物调查、精准医疗等需求。客群也由单一的头部医院客群,拓展至私立医院、药企、保险公司等客群,进一步释放市场空间。

在美国市场,医疗领域的数据结构化环境较好,法律法规建立较早,数据分析成果丰硕,市场更加广阔。相比之下,中国医疗体系数据结构化程度低、数据标准不统一、数据孤岛较多,在当前阶段,建立优质的数据环境是行业焦点,获客将是业内的主要竞争力。

纵观当前市场格局,入场大部分创新公司主攻收集数据、清洗数据等单一步骤,理解分析需求不够充分,盲目构建“医疗大数据平台”,在应用时有断层性和局限性的问题。能够完成数据分析,后端数据处理,最后走到前端应用,目前能实现几步完整的走下来的公司较少,需要具有丰富经验的跨专业人员组成的团队来完成。

由此判断,数据处理和分析仍是行业内未来一段时间的发展重点。中国市场优势在于良好的新技术环境、政策的积极信号、以及未来市场大环境需求充分等因素,在数据积累相对充分后,医疗大数据公司有望迎来快速崛起的机会。

韩潇认为,曜立科技聚焦在单病种的知识体系构建,当前的业务模式获取了市场的初步验证,曜立科技的未来目标在于实现“医疗+”的理念,以医疗为基础在这之上植入技术以及嫁接其他领域应用,为医疗相关各领域提供数据决策依据。

近日,爱分析对曜立科技医疗总监韩潇进行专访,现将访谈部分内容分享如下。

数据源高度集中,以科研需求介入优质客群

爱分析:医疗大数据中,曜立科技选择哪个需求点切入?如何考虑?

韩潇:我们了解医生需要在临床、科研、教学中对应用数据有迫切需求,现有的医疗数据处理方案无法有效的解决,不能深度结构化、标准化数据,且转化效率低。医生仍然需要耗费大量的人工时间完成数据收集整理等工作,同时数据的准确性仍不能得到保证。

我们希望改变医疗数据不能被充分利用的弊端,以医生的需求为最主要切入点。

爱分析:数据源层面,除了医院是否需要接入第三方数据?

韩潇:我们可以处理以病人为核心的各种数据,包含医院的相关文本,如病历记录、检查记录、医嘱等;也包含病人在非医院场景产生的数据,如体检报告、基因检测结果、智能穿戴设备记录等。同时我们也可以在非医疗机构有需要时提供数据处理分析服务,例如帮助药厂临床研究项目数据处理分析。

爱分析:在对接不同数据源时有哪些难点?

韩潇:在医疗领域,医疗信息内容存在专业壁垒,医疗数据的复杂度高导致产生庞大的非结构化数据。由于缺乏规范数据没有统一格式并且数据会被分散储存在多个地方,给每次的数据寻找收集使用都带来很大的困难。当然我们在对接数据的同时也要充分的理解需求,真正做到针对不同难点采取不同解方案。

爱分析:目前合作的有哪些科室?

韩潇:我们按病种对接科室,目前主要集中在心血管类系统疾病、肿瘤、慢性病以及非传染性疾病的科室。

构建医疗标准字典,数据基础造就中美差异

爱分析:在改良数据收集方式的过程中,会用到哪些新兴技术?

韩潇:我们认为,我们所做的事情不是以应用前沿技术为导向,而是基于之前对需求的深入了解,在明确问题后选择合适的技术去解决。目前采用的技术为了更好的处理这些非结构化、格式不统一、医疗专业性极高的数据,我们尝试将大数据、AI、统计学方面的技术进行融合,探索出曜立的核心技术。

我们使用NLP技术(自然语言处理技术)、医学本体论等适合我们的前沿技术来创建曜立特有的MSOL本体医学通用字典,成果也经历了市场验证。

爱分析:怎么理解这个字典?

韩潇:字典的目的是对构建数据库起到纲领性的作用,完成索引关键数据完成数据清洗,所以我们将字典分类做的很细致。字典的特点是数据是非线性的,每个疾病会有多种症状,多种症状又会对应多个疾病,它们之间的关系是多维度的,可能存在同一层面,也可能是不同层面但存在隐含的逻辑关系。

字典是根据医生的逻辑建立的,所以引导着我们最后给出的产品也是从医生的角度出发的,只有理解并符合医疗上逻辑关系来搭建字典架构,才能让字典在应用层面能够真正的被使用。

爱分析:在数据处理过程中,需要有人工介入?涉及哪些环节?

韩潇:我们目前需要使用算法教计算机按照一定逻辑进行数据处理,之后根据结果再对算法进行调试。参与者不仅有计算机工程师还有AI、统计等领域的专业人员,与医生共同参与完成整个过程。这也体现了曜立人员横跨多个学科的特色。

我们最终需要让计算机实现自动化的采集和整理越来越多的内容,逐步减少人工的部分。

爱分析:做文本结构化有哪些难点?

韩潇:文本结构化是在处理句子,句子有语法,有单词,还需要正确的理解。例如:你不知道我在哪里吗?这句话可以用NLP识别语法并切词自动放入我们建立好的字典,但这时需要用经验判断这句话是询问对方知不知道我在哪里,还是在责备对方竟然不知道我在哪里。这在中文中是两个意思,在医疗文本的处理中也会经常出现这种情况,所以需要使用医生的经验来做出判断。

爱分析:语音识别类AI公司也在做医疗行业字典归类,业内能否共享这些成果?

韩潇:两者的字典构建方式以及结构存在差异,语音识别的字典是为了更好地实现语音转换成文本,我们做的字典是需要理解文本之后进行切词,字典共享相互帮助意义不大。两者存在上下游的关系,我们可以考虑进行合作。

爱分析:人工审核难点有哪些?

韩潇:在每个环节都需要找到合适背景的人,需要他们是在某个相关学科的专业人员。因为审核工作是连续的工作,没有现成工具可以替代这项工作。

爱分析:人工审核的业务能否外包?

韩潇:因为我们比较注重质量所以目前没有选择业务外包,上面也提到了这是一个有连贯性的工作,自己团队的人员方便交流与管理更能保证完成的质量。我们有五位来自国内顶尖三甲医院的医生,心血管和肿瘤背景,主导研发,还有一些长期的签约医生。

曜立最核心的两个资源,第一,医生团队资源,第二,有一个团队负责医生与工程师之间的翻译对接,这群人有医学背景又学习过编程,是我们整个链条中关键的过渡角色。

爱分析:在医疗大数据领域,中美市场有哪些差异?

韩潇:宏观来看,中美两国的大环境不同,导致了管理制度,医疗相关的规范都存在不同,数据来源也不也一样,数据结构化存在差异。国外做字典起步较早,像SNOMED,已经做了20余年的医学术语字典。国内缺乏这样专业的术语标准体系。

这也造成了中美同类别公司的差距,美国数据底层结构化程度较高,在此基础上,分析和应用工具发展较快。中国数据的结构化发展时间较短,基础相对薄弱,数据清洗工作量大,工具研发的速度相对较慢。

两国医疗大数据的商业市场发展也有差距,国外的医疗商业链上下游比较成熟,比如健全的商业保险体系、投资巨大的药厂研发体系等,使得医疗大数据公司的第三方变现相对容易。国内目前医疗大数据的商业市场仍处于起步阶段,但未来也会迎来较好的前景。

医疗大数据的五大应用,直击业务需求的四种产品

爱分析:数据应用是如何去体现的?

韩潇:应用主要包括科研、医院管理、临床辅助决策、辅助药厂运营(安全与追踪)、协助优化医疗保险系统等。科研、医院管理是我们现在在做的。随着积累,后面的几个会逐步涉及。

临床辅助决策,需要大规模数据统计分析的支撑,像临床决策支持系统CDSS,是一个知识性或结论性的输出。当我们在单病种领域有了完整数据算法之后,形成完整的知识结构,就能很好的服务基层医生,或年轻医生。

医院管理是用统计的方式为科室管理做依据,产品已经具备,客群以科室和专科医院为主。

爱分析:对接客户时,Willow系统可否理解为大数据平台?

韩潇:可以这样理解。我们的产品是数据分析管理平台,包括BaaS和SaaS,提供后端算法和软件服务。将我们的产品视为一个平台,在平台上嵌入不同功能的软件模块,通过模块的单独或协同工作可以实现数据收集检索、数据自动上报、高效撰写报告、数据结构化、数据分析及可视化等工作,为医生提供一站式服务。

从医院赋能,目标是医疗周边客群

爱分析:长远来看,下一步战略是什么?

韩潇:目前阶段,我们希望通过与医院合作,然后将服务对象发散到医疗健康行业的其他参与者、非医疗机构等,如政府、健检、保险机构等。

从长远来看,我们将致力于实现“医疗+”的理念,在医疗领域植入AI、大数据等技术或者嫁接其他领域的应用,改善与优化医疗数据处理与使用方式。并非单纯依靠技术引导完成医疗数据的分析处理,希望站在整个医疗行业的层面以及医疗真实需要的角度来解决整个问题。

我们将持续地保持曜立的企业活力,不断的迭代技术进行创新发展,提供更优质的算法与解决方案。

爱分析:从这个角度来看,它的医疗属性越来越淡化,社会属性在变强?

韩潇:我们希望能够借助我们的核心优势协助社会与政府进行慢病、传染病和肿瘤的有效预警与监控。我们将致力于使用标准算法让医疗信息成为符合标准、结构清晰的数据,让医疗数据发挥潜在价值,促进医疗大数据的创新应用与医疗健康行业的快速发展,更好体现社会属性。

爱分析:服务大客户时,定制化需求比例有多少?

韩潇:基于前期我们对行业的分析,挖掘理解到的是不同客户群共同存在的相同痛点。我们产品也已经得到验证可以在多种需求场景被广泛使用。因此可复制性较强,成本最高的通用部分已经完全模块化。可定制的部分也是基于我们成熟的产品模块进行多种组合、优化调整,这样来看前端定制化的成本相对较低。

爱分析:在医疗领域,国外对标公司发展很慢,中国公司发展会有哪些不同?

韩潇:未来中国医疗大数据将会进入快速的发展时期,政策的积极信号,专业人才的不断涌现以及技术进步都是促进中国公司发展的优势因素。中国公司将在医疗大数据的应用上将实现更多的创新突破,不仅可为大众带来更好的医疗健康服务,同时利用大数据方法可不断发现新的知识内容,促进医学知识和医学技术的进步。