不仅为构建数据要素赋能医疗健康产业协同生态迈出关键一步,也是国家人工智能应用中试基地(医疗领域)促进医疗数据要素流通利用的重要实践

2025年12月31日,“北京市健康医疗高质量数据集宣介会”在京圆满落幕。本次会议由北京市卫生健康委员会主办、北京医疗健康大模型有限公司承办,京内外近百家机构逾200位代表共聚一堂,共话医疗数据发展的新机遇与新未来。

打开网易新闻 查看更多图片

首发高质量数据集与权威匿名化规范

会上,北京胸科医院与北京医疗健康大模型有限公司联合构建的“肺结核CT影像精标注高质量数据集”北京地坛医院“多中心医疗术语与标准模板数据集”正式首发。同时,北京市卫生健康大数据与政策研究中心正式发布《健康医疗数据匿名化技术规范(试行)》(以下简称《技术规范》)。

打开网易新闻 查看更多图片

《技术规范》由北京市卫生健康委大数据与政策研究中心牵头制定,明确了医疗数据安全流通的技术标准与管理要求,为解除医疗机构和企业参与数据交易的后顾之忧、保障数据合规流转筑牢了制度根基。

北京市卫生健康大数据与政策研究中心郭默宁主任就《技术规范》内容展开解读。她指出,这份规范立足卫生健康行业特点与实际工作需求,着重强调数据价值挖掘与个人信息保护相平衡的核心原则:一是结合行业数据特点,以患者为中心的全生命周期多模态数据关联需要相关标识为保留数据价值,明确由数据持有方对原始数据进行治理和关联后,再匿名化处理;二是依据具体使用场景,选取适宜技术进行匿名化处理确保数据使用方“无法识别特定自然人且不能复原”;三是针对特定场景采取差异化技术手段在保障数据可用性的同时,有效控制数据流通安全风险,实现隐私保护与数据价值的平衡。

《技术规范》共八章:一、适用范围;二、引用文件;三、术语定义;四、总则;五、实施流程;六、处理方法;七、效果评估;八、保障措施。为确保《技术规范》的专业性、科学性和实用性,编制工作广泛吸纳产业界与学术界力量,邀请了行业专家组成起草工作组,系统研究相关法律法规、国家标准及行业实践,结合北京市健康医疗数据开发利用的实际场景,经多轮研讨、实际案例推演,形成草案;在草案基础上,组织清华大学、中国电子技术标准化研究院、蚂蚁集团、腾讯、飞利浦等机构的数据安全、标准化及医疗行业专家开展评审,充分吸纳评审意见并完善定稿。

适用范围:

本规范适用于健康医疗数据开发利用过程中对个人信息的匿名化处理,可为健康医疗数据的匿名化工作提供指引,也可为监管部门进行数据开发利用监督管理提供参考。

相关主体:

  • 数据持有方:履行安全与合规义务,做好多源数据的有效整合,确保原始数据完整、一致。匿名化处理后的数据不属于个人信息,可依法合规安全流通至数据使用方;

  • 数据运营方:依法依规在授权或委托范围内开展数据资源开发、数据产品经营和技术服务

  • 数据使用方:依法合规对数据进行开发利用,确保开发利用环节的安全、合规。

目前,《技术规范》已落地具体项目并完成实践验证,取得良好应用成效。下一步,将结合技术发展与实践反馈,建立动态更新机制,不断完善健康医疗数据匿名化技术标准体系,支撑行业数据高效流通和有序开发利用。

“医院+企业”数据生产协作新模式

会议还重点介绍了经实践验证的“医院+企业”协作模式。依托该模式,北京胸科医院仅用时3个月便高效完成高质量数据集生产全流程,形成了可复制、可推广的行业范式,为降低行业高质量数据生产门槛提供了实用路径。

打开网易新闻 查看更多图片

北京胸科医院“肺结核CT影像精标注高质量数据集”涵盖了2万例精标影像,已完成数据产权登记、匿名化处理等各项认证,具备显著的科研与人工智能研发价值。现场,北京胸科医院向科研单位及相关企业等发出数据集申请使用邀请,并就合作细则作出补充说明:

1、5家将成为首批"创始合作伙伴"

  • 享受数据集打包优惠;

  • 提供AI产品迭代真实应用场景

  • 附赠稀缺权益独家"专家护航":年度技术顾问服务,享受专家团队的优先深度支持。

2、数据交付顺序"队列优先权"

  • 所有数据集的加工、交付与后续更新,将严格按照签约顺序进行;

  • 以具有法律效力的合同签订时间为准。

3、联合署名品牌曝光机会

  • 在数据集相关的学术论文发表(如数据集的规范论文)、行业白皮书发布时,可作为"合作构建单位"联合署名,提升行业影响力。

2026年,北京胸科医院拟完成10万例覆盖全肺部疾病精标注高质量数据集,构建我国全肺部疾病多模态数据集和大模型研发。

打开网易新闻 查看更多图片

由北京地坛医院构建的“多中心医疗术语与标准模板数据集”也在会上亮相。该数据集涵盖海量标准化病历模板与临床术语,兼具数据体量大维度广质量高三大核心优势,其潜在转化方向可分为五大类

1、智能临床辅助系统:作为核心知识库,嵌入更多智能临床决策支持(CDSS)、智能导诊、自动病历质控等系统;

2、医疗信息化解决方案:为医疗软件开发商提供标准化的术语服务和模板组件,提升其产品标准化水平;

3、医学教育与规范化培训:用于医学生、住院医师的病历书写规范化培训及考核;

4、医防融合与院感防控:基于临床输入频次的特定监控,为新发突发传染病、院感防控等提供预警模型;

5、医疗数据服务及AI训练:在严格合规前提下,探索作为标准化数据产品,为保险、医药研发、公共卫生管理等领域提供数据服务。

该数据集已在实际应用中形成成熟的交易案例,打造出医疗行业专属输入解决方案--腾讯搜狗输入法医疗版助力临床文书规范化与效率提升。

为满足多元化合作需求,医院同步推出四类合作模式如下:

  • 联合开发,收益共享;

  • 标准授权,即购即用;

  • 子集授权,按需组合;

  • 定制增强,专属交付。

搭建供需对接 推动产学研融合

打开网易新闻 查看更多图片

活动现场,北京市发改委、市政务服务和数据管理局等政府部门,北京胸科医院、地坛医院等医疗机构,以及腾讯、阿里、百度、华为、国药集团等企业代表,围绕医疗数据应用场景拓展、合作模式创新等议题深入研讨。此次交流有效衔接了医疗机构数据资源供给与科研及产业需求,促成多项初步合作意向,不仅为构建数据要素赋能医疗健康产业协同生态迈出关键一步,也是国家人工智能应用中试基地(医疗领域)促进医疗数据要素流通利用的重要实践,为构建“医疗机构安心供数、企业放心用数”的良性生态奠定了坚实基础。

基于此次建立的政策保障与典型合规实践,国家人工智能应用中试基地(医疗领域)将持续深化高质量医疗数据集的共建共享,全力推进数据开放赋能与产业生态培育。

信息来源:HC3i中数新医

声明:本文著作权属原创者所有,不代表本微信公众号立场。如涉著作权事宜请联系删除。