企业服务

溪流数据赵贝尔:医疗领域,数据和专家资源是第一门槛

医疗大数据,如何释放数据价值?

2017年12月27日
调研 | 李喆 关蕾 撰写 | 关蕾
  • 企业服务
  • 医疗大数据
  • 大数据行业应用
  • 医疗人工智能

在医疗科技领域,一类供应商聚焦在利用AI技术做辅助诊断,如医疗影像学习,是当前相对常见的一类应用;另一类供应商侧重于使用大数据、AI做治疗方案分析,如病例文本分析,是呼声较高的另一类应用。

成立于2014年的溪流数据,属于第二类。溪流数据创始团队早期为电信、电商提供大数据处理,数据分析挖掘服务。2014年,接触医疗大数据,从研究课题起步,经过三年发展,逐渐深入到数据平台建设、数据分析、场景应用等业务方向,为医生、患者两大群体提供数据服务。

基于行业资源,溪流数据合作了301医院、朝阳医院、佑安医院、儿童医院等几十家优质客群,参与多项国家级医疗大数据科研项目。依托顶级医疗机构的客群优势,溪流数据希望将优质的数据资源及专家诊疗逻辑进行结构化处理、深度学习,通过智能模型,辅助医疗经验的传承和传播。

在医疗领域,优质的数据资源积累在医院,尤其是头部公立医疗机构。对于创新公司来说,寻找稳定付费客群、探索更规模化的盈利模式,是当前创新公司面临的重要挑战。

在国内,大多数三甲医院信息化已相对完善,建设云化的数据平台(或数据中心)是下一个需求点,主要的场景应用在临床研究、临床决策支持、数据化运营管理等方面。

溪流数据定位于数据应用层面,未来战略是在平台上构建应用体系,通过提供一站式医疗数据解决方案的方式服务客户。赵贝尔认为,溪流数据未来将逐步回到技术领域,做标杆性的行业应用,以通用技术的方式输出能力。

近日,爱分析对溪流数据创始人兼CEO赵贝尔进行专访,现将部分内容分享如下。

转型医疗大数据三年,四大应用服务医生、患者两类群体

爱分析:溪流数据经历了哪些发展历程?

赵贝尔:溪流数据创始团队从2007年开始做数据分析,客群是电信、电商行业。2014年,进入医疗健康领域,核心产品是帮助医疗机构进行数据治理,提供数据应用产品及数据分析服务。

爱分析:转到医疗领域是什么契机?

赵贝尔:因为我家人都是在医疗机构工作,一直对这个领域比较感兴趣,而且公司合伙人也有较深的行业积累。2014年底,拿到种子客户,是总后的一个大数据方向课题,切入的第一家医院是301医院。

爱分析:医疗大数据的数据分析有哪些特点?

赵贝尔:做数据分析首先要做数据治理,医疗数据目前存在数据分散、非结构化、描述标准不统一等问题。举个标准不统一的例子,ICD-10标准有2万种疾病,但实际上一个医院的一个科室,医生对疾病的写法就有4万多种,最简单的数据统计工作很难开展。

我们构建了一条涵盖数据集中化、串行化、结构化、标准化、标签化等多道工序的数据治理生产线,其中部分关键环节使用了自主研发的机器学习算法。

医疗数据分析除了数据分析挖掘算法、人工智能模型外,还需要专门的知识库体系,在医学本体之上构建知识图谱、在图谱之上构建数据分析模型、在模型之上构建应用产品,层层递进。

爱分析:发布的产品有哪些?针对哪些应用场景?

赵贝尔:我们核心产品有四块方向:临床研究、临床决策支持、智能健康管理、数据化运营。第一,临床研究。以前的科研项目收集数据困难,可行性研究前期的数据准备需要1年时间以上。我们把数据进行结构化处理,形成数据集市,同时将科研过程进行智能化支撑,使客户能够一站式灵活实现数据分析,把整个科研周期缩短到3周。

第二,临床决策支持,包括智能综合诊断,个体化治疗等,自动监测患者信息,给出治疗建议,辅助医生决策。

第三,智能健康管理,包括健康画像、智能报告、疾病预测、个性化健康方案等,通过这种方式将服务从B端延伸到C端。

第四,数据化运营管理,延伸BI,结合DRG,解决医疗机构的精细化管理、数据化运营需求,给管理者使用。

我们核心产品底层是分布式混合云架构、实时分析引擎、几十类分析挖掘模型组件、医学知识库体系构建等,支持每天40亿条用户记录处理。

爱分析:决策支持的有哪些重要支撑,是依赖专家标注还是机器学习?

赵贝尔:专家的诊疗思维都记录在病历里,我们从中可以提炼学习模型,针对不同患者做个体化治疗方案,主要面向诊疗经验较少的医生及基层医生。

决策支持主要依靠两大体系,一是文献指南,二是真实数据。医疗AI产品要有好的模型算法及好的业务体系支撑,我们的个体化治疗AI产品,将指南文献和真实数据结合,将医学规则融入机器学习模型,前期专家标注较多,逐步以机器自学习自适应为主。

爱分析:决策支持类的算法模型,大概需要多少病历数据?

赵贝尔:不同的AI应用(算法模型)需要的数据量不同,单病种的决策支持,大概10万病例,必须非常完整,包括每个治疗环节、检查结论、医嘱等记录。

爱分析:在患者层面,溪流数据的健康管理有哪些特点,业务进展如何?

赵贝尔:我们的健康管理更侧重于疾病的精准管理和专业服务,四个特点:第一,以用户全生命周期数据为中心;第二,个体化指导干预方案;第三,自动化服务;第四,基于顶级医疗机构专家经验。

我们目前以2B2C的方式间接向用户开放,在用户的移动端上,每天进行智能提示,定期采集相关数据,目前301医院、友谊医院、世纪坛医院在使用,武汉市卫计委在做试点,后续会通过省市区域平台面向用户提供服务。

爱分析:溪流数据有哪些核心技术壁垒?产品中有哪些通用部分?

赵贝尔:数据和专家资源是第一门槛,算法模型和知识库是第二门槛,第三是AI产品的自动化生产线。

我们所有产品背后底层东西是一样的,核心是医疗智库平台,包括系统架构、数据统一视图、知识库、机器学习工具等,知识库会随着业务的开展越来越完善、越来越智能。

爱分析:距您推测,知识图谱建设需要多久?

赵贝尔:目前已经形成了一套比较完善的知识图谱体系,现在我们非结构化的识别率平均在95%左右,但这项工作没有终点,还需要不断提升。

服务优质医疗客群,沉淀专家经验

爱分析:有哪些重点客群?

赵贝尔:主要客群是三甲医院,像301医院、朝阳医院、宣武医院、北京儿童医院、佑安医院等。

爱分析:数据源层面,对接了哪些医院系统?

赵贝尔:主要对接的医院系统包括HIS、LIS、PACS、电子病历,另外还包括护理系统等,以及部分科室自建的系统。

爱分析:医院对数据的开放状态如何?

赵贝尔:目前还比较慎重,我们的产品也有公有云和私有云两种形态,根据客户要求来选择。

爱分析:HIS系统的数据质量如何?

赵贝尔:现阶段,各医疗机构的信息化程度较高,业务信息系统比较完善,以HIS系统为代表,数据能够满足分析需要,但实际中,也存在一些问题,如数据分散、非结构化等,需要做加工和处理。

爱分析:服务客户时,是否有侧重的细分领域?

赵贝尔:不同产品,覆盖范围不同,像运营管理、精准健康管理可以覆盖全院科室,临床研究产品目前覆盖15个科室,决策支持产品则聚焦到科室甚至病种,目前集中在内科。

爱分析:通常情况下,部署周期需要多久?

赵贝尔:分两个方面,技术实施方面和流程制度方面,技术实施很快,1个月内,流程制度较慢,大概需要两个月。

爱分析:团队有多少人?由哪几类人才构成?

赵贝尔:60人左右,绝大多数是研发和医学人员,医学团队包括医学顾问、医学分析师、医学编辑;研发团队包括:平台架构师、算法工程师、数据架构师、可视化设计师等。

大数据投入从科室转向医院,市场空间逐步放大

爱分析:通常情况下,三甲医院每年大数据建设预算是什么量级?

赵贝尔:医疗大数据,以前是临床科室参与度较高,在近两年,医疗大数据在政策支持和认识加深的双重促进下发展迅速,今年很多医院设立了单独的经费预算,用于搭建数据平台、科研系统建设等。

2016年,美国麻省总医院用7亿美金建自己的数据平台,相当于年收入的20%。国内市场处于早期,预算在逐渐增加,我们能看到的至少在百万及以上量级。

爱分析:医疗大数据,您看到有哪些明显的市场趋势?

赵贝尔:数据治理和智能应用是必然趋势,整体行业还较早,目前市场不是一个充分竞争和开放性的市场,供应商相对分散。

随着数据应用价值的释放,会促进商业模式的成熟和数据规范的完善,未来数据应用市场将是开放性的,在各细分领域会形成优秀的独角兽企业。

爱分析:传统软件系统厂商切的话,有哪些难点?

赵贝尔:数据和软件是两类不同的业务,数据公司更像是有自身技术产品的咨询公司,而不是软件公司。从技术体系、业务流程、人员结构到思维方式、经营理念都与软件公司有较大差别,信息化系统厂商切入难度较大。