医疗

隐私安全计算技术助力医保打好“节流开源”组合拳

隐私安全计算使医保数据“可用不可见”,开放应用实现医保基金“节流”和“开源”。

2021年01月26日
调研 | 文奕 刘洋洋 撰写 | 刘洋洋
  • 医疗
  • 数据智能

面对医保基金的筹资增速慢、开支压力大等问题,医保局急需进行医保风控,做好“节流”和“开源”工作。不管是“节流”还是“开源”,医保数据的开放应用至关重要,但医保数据目前存在质量参差不齐以及数据难共享计算的难题,医保风控极具挑战。翼方健数的隐私安全计算平台帮助解决医保数据质量和共享难题,助力医保局有效识别欺诈骗保行为、完善多层次医疗保障体系建设,打好“节流开源”组合拳。

1、医保基金如何利用数据打好“节流开源”组合拳?

中国人口老龄化加速,医疗费用快速上涨,医保基金筹资增幅难以满足医疗费用迅速增长的需求,医保基金运行压力大。实现“节流”和“开源”是医保局当前最大的需求。

“节流”的目的是降低医保基金“穿底“风险。从制度上能想到简单直接的方法包括由财政压缩其他开支;降低划入个人账户比例、降低医保待遇。但究其根本,应查询医保“缺口”的来源。据华数康2017年统计,我国医保基金的历年不合理支出约占总支出的10%,涉及金额近1000亿元。如何遏制医保基金流失、有效发挥医保基金的保障作用,已成为医保局关注的重点。通过数据全局分析,帮助医疗管理体系打击欺诈骗保,降低医保基金的不合理支出。医保基金的“节流”工作迫在眉睫。

近年来,骗保行为形式多样且复杂,患者端的冒名顶替,医生端的串换收费、分解住院等行为比较容易识别,而过度医疗、套高结算、挂床住院等欺诈骗保行为依靠简单的人工方式很难进行有效的识别和防控。为做好“节流”工作,医保局需加强医保基金监控和稽查,围绕真实医保数据挖掘可疑行为。

“开源”除了通过增加税收予以补足或提高在职人员的缴费以外,还可以选择在不增加病人负担的前提下,建设多层次医疗保障体系,通过商业保险代替部分医保功能。例如当下备受关注的惠民保,被称为我国第一个真正意义上覆盖非标体的商业健康保险。惠民保的诞生可以让政府、患病人群、保险企业三方受益。但因没有完整数据支撑,惠民保是否能够持续“惠民”仍受社会争议。

无论是“节流”还是“开源”,医保局都依赖“数据”进行结算,但数据质量参差不齐、数据难共享计算的问题,限制了医保局打好“节流开源”组合拳。

在数据质量方面,医保数据的产生仅从医保结算角度出发,要求数据可以支撑医保支付即可,没有考虑到后续的应用,并且数据产生后即被堆放在医保系统内,缺乏管理,存在数据不完整、非标准化等问题。

在数据共享方面,医保的真实数据在医保局内部流转时面临泄露和篡改等安全风险,因此共享难度较大。不同地区、不同人群的医保数据分别储存在不同的信息系统中,人社、卫计、药监、民政等多部门的信息系统也是由各地自行组织开发,数据分散在近2000个系统中,数据呈现“信息孤岛“现象。即使面对数据计算可产生的巨大价值,出于安全性和隐私保护的考虑,数据仍难实现开放共享。

2、隐私安全计算技术赋能医保数据的开放应用

医保数据治理是医保数据应用的前提,而实现安全共享则是医保数据开放应用的必要条件。

以往,大部分医疗数据的共享方式是通过签订协议,脱敏后授权给厂商应用。但是,脱敏后的数据授权使用存在两个问题。首先,即使经过脱敏处理,原始数据流出也有安全隐患,数据流向无法得到有效地监管和控制。其次,一经脱敏,数据即损失了一部分价值,再用来做医保风控,将影响计算效果。

随着数据共享的需求增加,隐私安全计算技术应运而生,且应用价值日益凸显。

隐私安全计算包含了一系列加密计算技术,如同态加密、多方安全计算、沙箱计算、联邦学习等技术,实现数据“可用而不可见”,有效整合医疗数据资源,消除“信息孤岛”现象,实现不同机构之间数据的安全共享。

相比使用脱敏的方式,隐私安全计算技术更符合医保数据开放应用的需求。第一,原始数据不出平台,确保原始数据安全。第二,基于隐私安全计算平台,医保局可以使用完整的原始数据,数据不因脱敏处理损失数据计算价值。第三,多来源数据实现多点触发,即数据的联合计算模式不局限于人的计算逻辑。真正实现风险控制的自动化、智能化、全局化。

3、隐私安全计算使医保数据“可用而不可见”,实现不同业务场景探索

翼方健数的隐私安全计算平台通过数据归集、数据治理、数据探查、数据授权、数据应用的一整套解决方案,可有效解决数据质量差和共享难题,确保数据安全应用。

数据治理是提高数据质量、实现数据挖掘的关键。面对质量参差不齐的医保数据,翼方健数可以对数据进行清洗、归一,最终形成知识图谱,通过诊疗合理性模型进行医保风险识别和医保基金的智能审核和监控。

翼方健数的诊疗合理性模型基于自主研发的病历结构化技术,模型标注准确率高达97.5%,归一比例为99.1%。其产品已完成城市级基层医疗机构的覆盖,在多个三甲医院落地应用。同时翼方健数正积极探索临床数据与医保数据之间的互联互通,使医保数据更接近病患的真实数据,经过计算可应用于多种业务场景,而非仅仅用于医保结算。

翼方健数的隐私安全计算平台XDP翼数坊,以数据应用开放平台的形式建立了一个数据生态。

对医保数据来说,XDP平台可以将分散在不同信息系统的数据进行整合,通过自主研发的XFS(XDP File System高可用分布式文件系统)实现文件级加密,每个文件拥有独立的“保护壳”密钥,且使用过程可溯源,密钥使用后即销毁,实现对文件权限的安全管理。

同时,数据生态中的各个参与方(数据所有者、数据服务方和数据需求方)在使用相关数据时受权限制约,必须经过授权方可进行数据计算,且平台只输出数据的计算结果。

在隐私安全计算的基础上,多来源数据在数据应用开放平台上可以经过更安全的计算,最终服务于多种业务场景。

翼方健数利用诊疗合理性模型可以实现数据模型探查,通过聚类的方式识别异常数据,并且进行动态的风险洞察,及时预警。在数据模型探查方面,通过机器学习技术可以判断疾病诊断是否合理、通过不同药品的离散分析识别不合理用药的行为。在结算过程中的风险洞察方面,通过训练决策树分类模型可以找到DRGs编码及诊断异常的情况,基于全面的“数据”自动发现异常,实现医保“节流”。

基于隐私安全计算平台,翼方健数实现对真实医保数据的深入挖掘,查出不合理医疗行为,如患者单次住院产生了20次血型检查费用、单次住院消耗1万根吸痰管、每日吸氧收费超过24小时、手术患者药占比为零等,阻止了医保基金的不合理支出,降低医保基金的“穿底”风险。

4、赋能惠民保做好精算定价、预警风控、创新运营等,实现收支平衡

除了应用于“节流”的医保风控场景,隐私安全计算也可以广泛用于医保“开源”的工作,如惠民保的精细化运营。“惠民保”之初衷恰如其名,但即使有政府背书、有第三方保险公司合力托举,“惠民保”仍有不足。

遵循“收支平衡、略有结余”的基本原则,“城市定制型商业医疗保险”惠民保的精细化运营离不开地方医保大数据的计算支撑。

惠民保的门槛较低,带病可保、无需健康告知等都成为了“惠民”的优势,但为了风险控制,目前惠民保具有赔付门槛高、报销比例低的现况。

要发挥惠民保的实用,对其进行精细化管理,只有使用当地医保真实数据,才可能进行精算定价、预警风控,达到精确的收支平衡,真正通过保险惠及民生。

隐私安全计算可以解决惠民保所需的医保数据应用开放问题。

医保局和商保公司进行惠民保的精算定价时,首先需要进行保险调查,了解参保人是否有既往症,以确认是否有资格参保。传统的保险调查方式是契约调查,调查人员通过介绍信和授权书到医院调取病历,过程存在数据隐私安全隐患且效率低下。基于隐私安全计算平台,保险调查工作可以转移至线上,所有的授权电子化,医保、医院、人社、卫计等部门可进行数据价值的共享,不但可以保护参保人的个人隐私,效率也更高。

通过真实医保数据统计分析,保险投保初期便可预测投保人群构成(带病人群、健康人群、亚健康人群),销售期可同步预测赔付情况,医保局和商业保险公司可以做好精算定价和实时的预警风控,形成相应的长效机制,对风险进行动态监控和管理,达到精确的收支平衡。

近期,爱分析对翼方健数医保事业部总经理邓振进行了访谈,就隐私安全计算技术在医保领域的应用及价值进行了深入交流,现将部分内容分享如下。

医保数据赋能医保、商保、医药等领域,可实现低成本精细化管理

爱分析:医保数据的应用有哪些?

邓振:根据医保以及行业的具体需求,医保数据的应用可以分成两大类。第一,数据对于医保自身有很多帮助。第二,数据可以服务于商业保险、医药等其他非医保的业务需求。

爱分析:医保数据在医保领域有哪些应用?

邓振:一方面,通过开放医保数据,使用人工智能技术,实现低成本的精细化管理,实现一大两平四方共赢的结果。“一大”,参保规模要大,大部分人都参与;“两平”,收支要平衡,社会效益和经济效益同时兼顾。

另一方面,依赖医保的真实数据开展具体工作,利用大数据、人工智能等技术进行数据挖掘,可以打击欺诈骗保、与医疗机构进行价格谈判。

爱分析:医保数据如何服务于商业保险?

邓振:商业保险公司测算保险的险种,做好保险的精细化管理,做好“两核”的服务,做好保险的二次营销、交叉销售,都依赖数据。在中国,真正意义上能够为全人群分析健康情况的数据,只有医保数据。基于医保数据,可以进行流行病学分析、疾病谱的变化分析等。

爱分析:医保数据在医药领域有哪些应用?

邓振:比如,要测算药品研发的预期回报,需要了解病人规模,病人可负担费用的情况。医药企业要和商业保险公司协同起来,一旦投放某个特效药上市,需确保有足够的支付方购买药品。医药企业需要医保的真实数据,从商业行为角度进行测算。

确保数据安全共享,隐私安全计算技术获得认可

爱分析:翼方健数如何实现医保数据的应用?

邓振:翼方健数的数据应用分为5步,分别是数据归集、数据治理、数据安全、数据开放、数据应用。翼方健数的核心能力是数据治理,在大量经验积累的基础上,有能力实现整个城市的数据清洗、归一,形成资源目录,最终形成相应的知识图谱。

爱分析:隐私安全计算的价值是什么?

邓振:首先,隐私安全计算可以提高数据安全性。数据可用依赖于权限管理,但是医院内部的数据保密级别非常高,避免泄露风险。隐私安全计算可以保证数据“可用不可见”,无需流转,方便数据资源安全管理。

其次,允许医疗机构之间进行数据安全共享。如果多个医疗机构都建立了隐私安全计算平台,那么机构之间可以进行协作,可以方便地进行交互。

爱分析:医保局对于隐私安全计算的接受程度如何?

邓振:目前医保局对于隐私安全计算技术,总的来讲是欢迎的态度,原因有三方面。

第一,技术本身是基于科学界探索出的公认的结果发展而来的。第二,使用隐私安全计算的技术符合业务要求。第三,翼方健数的隐私安全计算平台通过了信通院的评审,有官方的背书,有城市级项目案例的落地。

基于以上三点,医保局的领导大多都是认可隐私安全计算技术的。

翼方健数提供针对医疗保险基于隐私安全计算和人工智能的多种解决方案

爱分析:翼方健数目前可以为医保局提供什么样的解决方案?

邓振:目前翼方健数和医保局的合作有四个方面。第一,多层次医疗保障体系的建设,包括惠民保等新型保险;第二,医保风控,帮助医保控费,打击欺诈骗保;第三,为医保局搭建大数据实验室或科研平台;第四,搭建AI靶场,帮助医保局遴选供应商,开展医保竞赛等。

爱分析:隐私安全计算是如何赋能惠民保的?

邓振:目前大部分保险业务的精算和日常管理没有使用真实数据。隐私安全计算平台可以让惠民保业务基于真实数据进行精算定价和预警风控,实现收支平衡、提高业务管理水平。

爱分析:在已落地的惠民保项目中,翼方健数的价值是什么?

邓振:翼方健数和医保局、商业保险公司、TPA公司等都是合作关系,运用隐私安全计算和其他技术为其赋能。基于大数据分析,翼方健数可以帮助保险公司进行收支测算、风险评估等,辅助保险公司进行决策。

爱分析:隐私安全计算如何在事前、事中、事后进行医保风控?

邓振:在事前、事中、事后进行医保风控,本质上是没有差异的,区别只是把干预点放在哪。当确定某个规则是有效的,则放在事前提醒,事中干预,还是放在事后处罚,逻辑上都可以。

关键在于,在事前、事中进行提醒的时候,需要确定提醒是有效的,相关提示是经过验证、评估和授权的。在没有确定规则有效性之前,放在事前、事中、事后都不合适。

另外,规则的干预点位置不同,影响的是与系统对接的接口,技术本身是没有难度的。

爱分析:翼方健数为医保局提供的大数据实验室主要服务于哪些场景?

邓振:主要是科研,服务企业或者服务高校都可以。从大的角度来讲,都是基于隐私安全计算的开放平台,确保原始数据安全的情况下进行数据应用。

爱分析:翼方健数为医保局提供的AI靶场方案是什么?

邓振:翼方健数和医保局联合举办医保竞赛,医保局提供一部分医保的真实数据,翼方健数把隐私安全计算平台提供给厂商使用。基于平台提供的“原材料”和“工具”,厂商只需要测试自己的算法和模型,验证算法和模型的有效性即可。

爱分析:AI靶场未来是否会引入供应商?

邓振:如果未来有特别复杂的应用,翼方健数搭建的平台上需要增加非开源的工具,就需要引入供应商或者购买服务放在平台上。

爱分析:翼方健数的隐私安全计算在DRG管理方面的应用是什么?

邓振:医保局凭借DRG业务已经获取了医保结算的原始数据。隐私安全计算平台协助医保局在平台上使用数据价值,而不需要把数据导出去。

面向医院的DRG解决方案涉及到接口对接、DRG合理分组和绩效分配三方面的问题,使用到的数据来源于电子病历、HIS等多个系统。翼方健数在数据仓库的基础上进行数据治理,形成患者主索引,形成资源目录。医院直接在数据仓库的基础上使用数据,在资源目录的基础上调用,不需要开发接口,确保在数据不出院的情况下进行安全使用。

爱分析:翼方健数在DRG付费领域,为医保局提供的隐私安全计算解决方案有什么价值?

邓振:翼方健数主要服务医保基金不足的问题,通过新型支付方式提高医保局对于医疗机构的谈判能力。和反欺诈逻辑是一样的,需要使用到医保的真实数据,帮助医保完善政策。

爱分析:翼方健数给不同地区医保局提供的解决方案定制化程度高吗?

邓振:定制化较少。医保数据的标准本来就相对统一,在具体应用的时候需要注意差别。在搭平台阶段,医保的数据质量不错,经过主数据治理之后可以直接应用。

爱分析:翼方健数为不同地区搭建隐私安全计算平台是否通用?

邓振:通用性比较高。数据结构、数据内容、清洗的路径都类似。政策是国家层面制定的,不同地区仅在报销比例、人群、目录、收费价格上有差别,但是目录数、结构没有真正意义上的不同。

以医疗为切入点,翼方健数关注生态建设

爱分析:翼方健数在医保领域未来的战略方向是什么?

邓振:在2-3年内,医保数据的业务是公司的工作重点。基于医保数据的价值高、标准统一、门槛高等特点,翼方健数会触达医保局,运用医保数据服务于医保局,也服务于其他相关企业。

翼方健数的初衷是解决民生问题,选择以医疗为切入点,与翼方健数的愿景和宗旨相关。

一方面,翼方健数要建立数据和计算的互联网(IoDC,Internet of Data and Computing)。以医疗为切入点,布局医疗、生物信息、医药、医保等相关细分领域。

在医保领域,翼方健数通过隐私安全计算为医保数据应用开放赋能;在医疗领域,翼方健数为医疗机构的数据资产建设“数据中台+隐私安全计算”的模式;在医药领域,翼方健数可将临床数据进行联合应用,赋能药物研发;在生物信息领域,翼方健数的XDP-BIP(翼数坊-生物信息平台)是一款搭建在公有云上的自助式生物信息分析数据平台,为企业和科研用户提供生信和临床等多维度、多组学数据的处理和挖掘流程,并让数据在隐私安全、所有权得到严格保护之下的共享和授权使用,释放数据价值。

另一方面,翼方健数关注如何形成产业数字生态。核心聚焦在隐私安全计算平台在整个医疗大健康领域内的应用,重点关注协同效果。翼方健数也提供端到端的应用,在垂直领域深耕,从生态的角度进行更多探索。