近日,上海数据交易所宣布上线了全国医疗体系首批合规、可交易的数据产品,本次挂牌数据来自上海市第一人民医院眼科、内分泌科、放射科等10个科室及上海申康医院发展中心行政管理部门,包括20个重大疾病数据产品和1个医疗行政数据产品。
医疗数据具有巨大价值,能被应用于疾病研究、新药研发、医疗保险开发等诸多领域,在业界一度被誉为“沉睡中的金矿”。但是过去多年来,医疗数据一直走不出医院机房,存在着数据确权、数据标准化程度低、数据质量不高、使用监管等诸多问题,数据要素的巨大生产力未能释放。
在医院、监管方、产业界等多方的共同探索下,医疗数据的应用有望迎来加速发展。
价值倒挂
医疗数据究竟有多大的价值?
早在2019年,国际四大会计师事务所之一的安永曾针对英国的国民健康系统(NHS)做过一次商业化测算。彼时的NHS拥有英国从出生到死亡的所有人口的5500万份病历。安永测算后的结果是,NHS的这些数据集经过管理每年可以产生96亿英镑价值,接近900亿人民币。
5年后的中国,不管是医疗数据的体量规模,还是商业世界的转化空间都要远超当年的NHS,足以支撑起一个千亿级市场。在这个市场中,药企、商保公司、医疗AI企业都是潜在的买单方。
具体来看,药企看重的是药品在临床世界的使用情况,并以此来倒推前端的研发;商保关注医疗费用结算和诊疗行为之间的关联,目的是建立更准确的精算体系;医疗AI企业则希望获取更多的高质量数据,来提升AI产品的性能,尤其是在大模型时代,这种需求被无限放大,甚至可以决定一家企业的存亡。
至此,我们谈的都是理想,真实的情况远没有那么乐观——根据国家卫健委统计信息中心的数据,2020年,国内三级医院的医疗数据应用数量占比不足20%。德勤的最新报告则显示,全球范围内,医院生成数据的使用率仅为3%。
“原因就是目前的医疗数据,使用起来难度极高,专业度极强,而且投入极大,它的清洗治理成本要远远大于它能产生的价值。”医疗大数据行业的资深从业者易明告诉《健闻咨询》,他曾经参与过多个医疗数据服务项目的落地执行,大多数时候,医院提供的原始数据和企业所预期的,都相去甚远。
他向《健闻咨询》讲述了一个案例,他曾经承接过东部某家三甲医院的专病项目,需要就某个肿瘤的某个指标,对特定人群进行数据分析。这个项目的第一个步骤就是要从医院的LIS(实验室信息系统)中导出这些患者历年的检查检验结果,但在操作过程中,他发现这些化验单的信息和诊断对不上,最后他只能按照这些化验单号,去医院的HIS里捞诊断信息,“一来二去,一个本来想自动化解决的问题,变成了纯人工服务,到最后项目的成本远远超出了公司的预期。”
易明碰到的并不是个例。对于大多数医院来说,几十甚至上百个信息系统,都是常规配置,这些系统的搭建时间各异,供应商不同,所以往往不能相互连通。更让数据服务商抓狂的是,这些系统的数据甚至会自相矛盾。
另一位医疗信息化企业的产品负责人刘栋分享了这样一个经历。几年前,他在为某家医院做数据产品研发时,发现连门诊量、出院人次、手术量这样的核心数据,从不同系统中统计出来的值都不一样,最后只能找医院的相关领导选定某一个值,项目才得以推进。
“说到底,医院做了那么多系统,做电子病历,都只是为了把这些数据存储下来,或者是应付评级的需要。所以它不太会去考虑数据质量,这从根本上导致了医疗机构所提供的数据和企业需求是错位的。”
确权之殇
正如刘栋所说,医疗数据来自医疗机构,医疗数据质量不高,和医疗机构对数据的认知有直接关系。在医院信息科的传统认知里,医疗数据除了应付信息化评级,供内部人员调取外,并没有其它的落地场景,和商业运作更是毫不沾边。
但事实显然并非如此。
从大体上来看,医疗数据可以分为两类,一类是具有可识别特征的患者个人信息,这类信息涉及患者个人隐私,如果想要开放使用,必须征求患者的同意。另一类是不可识别的信息,也就是脱敏后的患者数据,常用于疾病研究、新药研发等领域。目前,多数医院和商业机构的合作就是基于这一类数据。
基于某个科研项目或临床产品的合作是商业机构获取医疗机构数据最常见的途径。以刘栋所在的企业为例,为了获取高质量的诊疗数据,他们往往会和医院达成共同开发某款大模型应用的协议,并承诺使用保密级别最高的国密算法加密,确保数据全程不可见,不出院。作为条件,开发出来的大模型产品,医院不仅可以免费使用,还能拥有部分知识产权。
“我们之前觉得这个过程可能会不太顺利,但实际沟通下来,要比预想的好很多。尤其是大三甲医院,他们也知道现在的科技进步是能帮医院做很多事情的,所以在风险可控的情况下,它们都愿意接受新鲜事物。”刘栋表示。
而在中国社科院公共政策研究中心特约研究员贺滨看来,即便是这样的合作,也未必能做到完全合规。首先,由于数据确权不清,医院是否有权转让特定数据的使用权,还需要打上一个问号。其次,在项目进行过程中,存在着由于安全保障机制不足导致的数据泄漏风险,另外,即使医院与企业之间达成了某种合规约定,但如何在合作过程中对数据安全进行有效监管,也是一个问题。
这就指向了医疗数据商业化应用的最大瓶颈——产权归属。
理论上来说,医疗数据作为一种资源要素,必须要有产权归属的定性。但根据现有的法律法律,不论是《网络安全法》、《数据安全法》还是《个人信息保护法》,都没有对这一块做出明确界定。而产权归属未定,就无法进入到交易环节,商业化也就无从谈起。
“现在的情况是,因为法律法规在这一块是空白的,所以大家都在尝试和探索。”贺滨告诉《健闻咨询》,医疗数据的确权在全世界都是一个难题,原因是医疗数据所属的主体非常分散,涉及到个人、医院、企业乃至政府,且同一个患者的数据可以被多个主体留存、复用和更新,无法追根溯源。
但从另一方面来说,法无禁止即可为,这也给了行业更多的创新空间。贺滨说,现在常见的数据开放形式有两种,一种是前面提到的,企业和医疗机构之间通过非商业化的项目合作。另一种则是,企业通过参与政府主导的某项医疗相关的民生工程,比如微医承接的天津数字健共体项目。
但这两种模式都只是解决了数据获取的问题,还无法为数据交易提供合法化的依据。
且看长远
随着医疗行业对数据资产化的呼声越来越高,政策层面也陆续释放了不少积极的信号。
2022年12月,中共中央、国务院发布了《关于构建数据基础制度更好发挥数据要素作用的意见》,全文总共二十条,因此也被称为“数据二十条”。
其中一句极为关键的表述为,“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制,推进非公共数据按市场化方式‘共同使用、共享收益’的新模式,为激活数据要素价值创造和价值实现提供基础性制度保障。”这句话从顶层设计上破解了医疗机构数据治理动力不足,不敢开放共享的桎梏。
2023年,国家层面又发布了《“数据要素x”三年行动计划 (2024-2026 年)》,迈出了从宏观政策到具体行动的关键一步。从这一年起,各地先后出台政策试点,基本思路是,由政府或央国企牵头组建地方数据交易平台,授权第三方机构开展数据要素运营。
比如,上海市在2023年提出,在确保信息安全和个人隐私的前提下,依托市大数据中心平台,探索医保数据在个人授权后面向商业保险理赔方面的开放。今年,上海数据交易所又推出首个数据空间——“重大疾病行业创新中心幽门螺杆菌数据空间”,率先推动数据在药物研发领域的应用。
“政府花了大力气来做这件事,目标是多元化的,方便老百姓的就医,支持AI产业的发展,为医疗机构探索出一条数据变现的路子,当然最重要的一点,它想要把医疗数据这种高度敏感的资源掌握在自己手里,把住数据风险的源头。”贺滨表示。
从本质上来说,地方数据中心的设立,为医疗数据交易提供了合理化的可能。它绕过了数据产权归属的争议,以使用权和经营权作为所有权的替代,以政府信用作为背书,搭建了一个医疗数据流通交易的平台。
“最近这一两年,医疗机构的数据质量提升得很快,这是我们在业务一线的明显体会。”刘栋表示,过去单个医院的项目,他们常规要花两个半月左右的时间进行数据清洗,现在对于一些数据管理规范的头部医院,清洗时间减少到了一个月。在他看来,政策层面的风向,已经传导到了医疗机构这一端,并且给企业带来了正向回馈。
但对于医疗数据资产化能否催生出一个千亿级市场,他表现得极为谨慎。“我们现在还处于当中非常原始的阶段,这个过程会非常漫长。”
易明也在采访中表达了类似的观点,他说,这些政策出台后,自己接到了很多企业方的需求,但聊下来发现,大多数企业只是想趁着这波政策红利做一些数据化的产品来包装自己,主要目标不外乎是融资炒作,抬高估值。
“只能说是随着时间推移,等搞噱头骗融资的这阵风过去,才会出现一些踏实做事的人或公司,把这件事再往前推一推,我们才能真正看到它所产生的价值。现在还在风口的上升期,我预估要三五年后见了。”
(文中易明、刘栋皆为化名)
文 / 毛晓琼
编辑 / 庞贝贝 李琳