打开网易新闻 查看更多图片

近日,奥密克戎正在迅速取代其他变异株,已成为全球优势流行株。目前,奥密克戎毒株在我国出现跨省传播,多地报告发现奥密克戎变异株感染病例,引发广泛关注。新冠肺炎病毒不断变异的毒株的系列新特征,给传统的传染病防控方法与公共卫生防控体系带来了巨大的挑战。

本文通过对疫情智慧防控体系构成要素的剖析,揭示联邦学习对建立跨区域、跨部门的智慧疫情防控体系的关键路径作用。并基于跨区域涉疫数据分类及防控工作要点,研究设计了基于联邦学习的跨区域疫情智慧防控技术及其平台应用。该应用已在上海市以及长三角区域的抗疫实践中取得了显著成效。

随着中国的疫情防控模式从应急管控向常态化转变,如何以新技术手段对分布于不同条块的多源大数据进行高效整合利用,同时依法有效保护个人隐私以及涉及到相关主体的敏感信息,是亟待思考与解决的问题,也是构建常态化智慧防控体系、保障社会经济发展和法制治理的关键基础。

上海作为中国最具代表性的超大城市,以及抗击新冠疫情最为成功的城市之一。

研究其在应对新冠肺炎疫情过程中基于数字技术赋能的多学科参与、跨部门、跨区域智慧联防联控技术及模式,对于未来全国各省市有效抵御海外变种病毒侵袭、高效落实常态化防控措施、快速遏制疫情扩散无疑具有十分重要的现实价值启示意义

新冠肺炎疫情

对疫情防控体系的挑战

重大公共卫生风险严重威胁人民生命安全和身体健康,严重影响社会经济系统正常运行。

及时捕捉疫情的发生时间、发生地点和感染人员,进而有效进行干预,是公共卫生体系疫情管理领域的核心职能

预警领域中对数学建模方法的挑战

数学建模是流行病学预警领域中一个重要的既定工具。

在本次新冠肺炎疫情中,以SEIR传播动力学模型及其扩展为代表的数学建模方法,被大量学者广泛应用于疫情传播计算。

然而,数学建模方法的准确性受限于多个先决条件。数据的片面化、碎片化,导致了本次新冠肺炎疫情较难通过传统数据建模方法进行精准预测和分析。

通常更为精准的预测结果,需依赖回顾性的后验参数介入和事后模型拟合。当前国内疾控系统普遍采用的公共卫生统计分析方法多局限于基于本地数据在滞后一段时间后的疫情时空传播过程的切片式静态认知,而无法支持疫情传播的即时性研判

监测领域中对传播链发现方法的挑战

尽早发现快速应对,是避免传染病发展成公共危机的重要关键。

理论上看,生物监测体系是公共卫生安全的重要基础和必要前提,但并非充分条件。庞大的传染病监测数据不会自动给出疫情态势风险,传统的公共卫生统计分析方法也不足以解析不同时空区域异质分化的疫情动态演化过程。

抗疫实践上看,公共卫生系统为应对新冠病毒的独特传播特性进行了针对性调整,在原先依赖各级医疗机构临床化验上报模式的基础上,实施了“关口前移”和“平行检测”等应对策略。

然而从源头上跨地域病患难以追溯、聚集性感染难以第一时间监测等关键手段的欠缺,仍是当前疫情监控中的重大隐患。有效监测手段的缺失,使得公卫系统仍然需要依靠例如公布感染者行程轨迹并向全社会公开征集潜在暴露者的方式,较为低效地进行感染排查。

重大科技热点事件的

传播模式与特征

构建精准的常态化监测预警及智慧防控体系,首先须厘清针对新冠肺炎疫情的智慧防控体系构成要素,并以此为基础确定智慧防控体系的技术路线和应用模式。

数字技术深度参与

在疫情暴发后,数字技术被广泛应用于全球范围的抗疫实践,在包括人口监测、病例识别、接触者追踪、公众沟通、干预措施评估在内的众多领域中,发挥着至关重要的作用。

当前,技术赋能创新正在形成一套以应用为基础的社会问题解决机制,为更精细地疫情监测和防控决策提供可能。

在具体数字抗疫成功案例中,以健康码为代表的一批数字技术的深度参与,标志着数字技术作为常规公共卫生措施的有效补充手段,在长期抗击新冠肺炎疫情,以及应对未来公共卫生挑战中承担的重要作用。

多学科交叉协作

宏观的公共决策领域,多学科交叉探究能够为公共决策找到更科学、可靠的决策依据。

例如,Chari等发现,有针对性的精准检测精准隔离将带来更高的社会福利,而更快锁定感染者将是取得最佳社会福利的关键。

微观和中观的疫情传播态势预警领域,呈现复杂系统特征,难以通过一般的数理模型或基于外部数据拟合的方式进行有效描述及预测。

采用人工社会建模仿真、多源大数据挖掘及知识图谱等多学科交叉协作的方法,可以更好地对真实环境下的疫情传播状况进行分析预测,并对各类干预措施的效果进行综合研判。

在当前全球疫情仍在持续演变,外部环境更趋复杂严峻,国内经济恢复仍然不稳固、不均衡的局面下,推进多学科的交叉协作,对于常态化疫情防控阶段坚持疫情防控和经济社会发展工作“两手抓、两手硬、两手赢”具有重要的现实意义

多部门数据联合

多元主体参与的协同效应离不开有效的信息流动

在疫情监控过程中,及时汇聚疾控、医疗、海关、疫苗、交通等多部门相关信息是有效识别未发现病例、快速完成接触者追踪和隔离的必要条件。

所涉任一主体数据的疏漏或滞后,都可能导致整个防控体系的“破口”,从而造成巨大的社会经济代价。

为应对重大突发的新冠肺炎疫情,当前各部门已通过临时调整应急响应的管理结构与功能以回应抗疫的现实需要。

但从机制上看,政府多部门间协同机制尚处于实践先导、理论与制度滞后的摸索阶段。

技术手段和数据基础上看,各领域部门之间数据也存在采集重复、权限不明、安全及隐私保护不力等亟待解决的问题。

当前持续而严峻的抗疫形势压力,成为各级政府努力探寻基于创新技术手段的全新数据联合机制以满足精细化疫情防控需要的重要动力。

跨区域联防联控

在当前国内抗疫实践中,跨省、跨地区的联防联控仍然缺乏有效的基于底层打通的横向协作机制。

构筑于双方函件往来的信息交互与汇聚模式之上的疫情研判预警和疫情处置决策,势必因数据及时性和完整性的缺失而影响整体防控成效,为突发急性传染病疫情的防控工作埋下重大隐患,且这种隐患和缺陷难以依靠上级单位协调指令进行弥补。

从造成原因来说,数据的隐私使用属地化管理要求、以及跨地域数据的信任及权限问题都是当前较为核心的客观限制。

在相关立法短期内无法快速跟进完善的背景下,实现跨区域数据层面的横向互通,进而进行联合监测预警的实践案例在国内仍十分鲜见。

通过智慧化疫情监测预警,实现跨区域涉疫数据的统合分析,显示出十分迫切的现实需要。

在国家加强区域高质量一体化发展的大趋势下,基于疫情联防联控的“强需求”,探索数字赋能跨区域事件态势集中研判的全新机制与创新方案也具有十分重大的战略意义。

隐私计算与联邦学习概述

隐私计算发源于隐私增强技术(PETs),是一项在网络传输中隐藏个人身份及可识别个人信息的技术。

当前,隐私计算主要分为基于密码学技术的多方安全计算、基于可信硬件的可信执行环境、以及联邦学习3个主要分支。

具有更高跨组织通用性、以及扁平化去中心化特点的联邦学习,能更贴近须多部门联合、跨区域协同的新冠肺炎疫情防控场景的应用需要。

联邦学习作为一种加密分布式机器学习技术,能使各参与的数据拥有方在不转移各自数据前提下,完成数据使用和机器学习建模,以满足用户隐私保护、数据安全和政策法规的要求。

联邦学习基本流程

联邦学习通过虚拟模型有效解决了不同数据拥有方在不交换数据情况下的协作问题,将联邦学习引入新冠肺炎疫情智慧防控体系,通过技术赋能模式创新突破数据共享瓶颈,从而提高重大传染病跨区域的集中研判和精细化防控能力,是本文的重要贡献之一。

基于联邦学习的跨区域

疫情智慧防控技术的上海实践

上海是中国最具标志性的超大城市,上海所处的长三角区域也是中国经济发展最活跃、城镇集聚程度最高、人口和交通网络最密集的地区。

上海作为长三角区域的龙头和区域最重要的国际枢纽,还承接着区域内最为密集频繁的人流、物流往来。

人口基数大国内外商贸往来频繁疫情传播多样社会形态复杂多元等特征,都使上海疫情的防控工作面临着举世公认的难度和无比巨大的压力。

跨区域不可共享类数据应用要求

在上海的疫情防控中,跨区域涉疫数据的综合利用是建立精准防控体系的关键。跨区域涉疫数据具有多样权属多样权限多样结构等特性。

从信息共享角度区分可分为可共享的涉疫信息(包含地区确诊人数、地区疑似病例数、地区确诊人员姓名、暴露场所等信息)及不可共享涉疫信息(主要包含确诊人员、疑似、密接人员个人隐私数据)。

受限的不可共享类数据更为完整、精确、具有更高的数据分析价值,在当前涉疫数据的管理规范中,不可共享类数据应用须满足:确保隐私数据的可用不可见,跨区域不可共享类数据的隐私保护是实现区域智慧化联防联控的先决条件和模式基础;确保数据高实时动态可用,常态化防控阶段,须抢抓第一时间进行疫情的综合研判,为及时采取有效管控措施提供决策基础。

跨区域疫情智慧防控的联邦学习平台架构

自2014年起,上海市疾控中心便建立了与苏浙皖三省疾控中心基于流感病毒的联防联控工作机制

2020年,为应对来势汹汹的新冠肺炎疫情,上海市疾控中心专题开展“长三角区域重大公共卫生风险联合研判、预警和处置体系研究”,同时针对新冠肺炎疫情的精准化、智能化防控需要,研究设计了一个适用于跨区域疫情联防联控特性和满足于跨区域涉疫数据应用要求的疫情智慧防控的联邦学习平台,并正式投入使用。

打开网易新闻 查看更多图片

面向跨区域疫情智慧防控的联邦学习平台架构

基于联邦学习技术,通过分布式节点部署本地模型,确保“数据不出库、模型多跑路”,从而有效解决数据隐私和数据关联分析之间的矛盾;同时实现了较高的计算性能,满足了常态化疫情精准防控综合风险研判的实战需要。

跨区域疫情智慧防控分析算法框架

基于联邦学习技术架构,构建跨区域疫情智慧防控分析算法框架

按联邦学习平台架构,分析算法框架主要分为数据准备、数据清洗与抽取、样本数据预处理、联合建模、联合预测5个部分。

跨区域疫情智慧防控分析算法框架

在上海的实际抗疫过程中,基于此框架进行调整,最终实现基于长三角整体疫情发展态势对上海市疫情风险的精准研判

跨区域疫情智慧防控平台实践成效

基于融合长三角整体疫情传播态势和疫情传播多空间耦合关联分析,实现了全面精准的常态化疫情研判和监测,充分发挥了数字技术在抗疫过程中的关键赋能价值,有力支撑了上海市精准化疫情防控各项工作的开展。

基于联邦学习平台的隐私数据保障,使长三角区域开展跨区域的风险综合评估得以实现。

在上海的实际应用中,基于此智慧防控技术能有效将疫情风险研判缩短至2 d以内,为上海市从严从实落实外防输入切实提升疫情防范和早期发现能力起到了重要作用。

同时,在长三角多个主要城市的疫情防控实战中,跨区域智慧防控技术也为各地公卫决策部门提高疫情传播链分析的精度和速度缩短零号病例发现时间、科学研判不同区域的疫情风险和变化趋势提供了有力的技术支撑。

上海疫情智慧防控技术的应用启示

自新冠肺炎疫情暴发以来,上海克服了自身作为超大城市及长三角区域中心在应对突发重大公共卫生事件中的种种不利因素,不管在疫情防控和经济社会发展领域,还是在防控模式与机制优化创新以及城市人文关怀方面,上海都交出了全国领先的优异答卷。

诸如全国首创的确诊病例流调信息通报不披露个人信息及详细行动轨迹等多项措施,均赢得了全国舆论的广泛赞誉。

从上海的成功经验中不难发现:综合研判、主动发现、精准流调、快速应对对于城市疫情防控的关键作用。

其背后是基于数字技术支撑下的灵敏高效、科学精准、联防联控的智慧化公共卫生防控体系对于持续高效抵御来自于境外、本土双向疫情波及的关键助力。

可见,大力发展数字技术赋能下的主动化、快速化、精准化的防控体制和防控模式,是以最小成本获得最大防控成效的关键方式,也是平衡城市疫情防控和经济社会发展最为经济、有效的治理手段。

上海构建基于联邦学习技术的智慧疫情防控体系,带来了兼顾数据联合分析和数据隐私防护的全新思路,打破了当前跨条块数据无法有效共享的数字应用桎梏。

通过跨区域数据联邦学习、协同运算,显著提升了公共决策的研判精度优化了决策措施效力

更进一步,其提供了一种以新技术创新应用解决当前治理领域区域协同难点,同时推动区域数据业务深度应用,进而形成区域高质量一体化协同的珍贵案例。

结论

眼下数字化进程已成为城市现代化的必然选择,“有无完备的信息化技术与应用体系”已是评估一个国家或一座城市整体竞争力的重要标准之一。

遭遇新冠肺炎疫情冲击之后,使全球各国更加明确了稳健、高质量的健康公卫体系是城市发展与城市繁荣的关键支撑要素。

在当前上海市全面推进城市数字化转型的大背景下,数字技术对于城市重大突发公共卫生事件的新应用和新价值还在被不断探索和发掘。

目前上海已正式提出:至2025年重大疫情和突发公共卫生事件的应对能力达到国际一流水准

基于疫情防控的成功经验,上海将力争率先形成国内首个区域性公共卫生风险研判预警和处置信息平台的示范模板,对全国卫生应急信息平台的总体推进起到重要的示范作用,并持续激励上海向全球公共卫生最安全城市之一的目标加速前进。

本文作者:钱学胜,吴寰宇,陈诚,黄晓燕,童庆,戴伟辉作者简介:钱学胜,复旦大学智慧城市研究中心、复旦大学管理学院、澳门系统工程研究所,高级研究员,研究方向为数据智能与融合应用;吴寰宇(通信作者),上海市疾病预防控制中心,主任医师,研究方向为传染病防治与公共卫生管理。

论文全文发表于《科技导报》2021年第24期,原标题为《基于联邦学习的新冠肺炎疫情跨区域智慧防控技术——以上海市实践为例》,本文有删减,欢迎订阅查看。

内容为【科技导报】公众号原创,欢迎转载

白名单回复后台「转载」

《科技导报》创刊于1980年,中国科协学术会刊,主要刊登科学前沿和技术热点领域突破性的成果报道、权威性的科学评论、引领性的高端综述,发表促进经济社会发展、完善科技管理、优化科研环境、培育科学文化、促进科技创新和科技成果转化的决策咨询建议。常设栏目有院士卷首语、智库观点、科技评论、热点专题、综述、论文、学术聚焦、科学人文等。