AI for Science(简称AI4S)是当前AI应用发展的一个重点方向。2024年4月29日,美国总统科学技术顾问委员会(PCAST)组织美国领域内权威专家,发布了《赋能研究:利用人工智能应对全球挑战》报告(简称《报告》)。该报告提出AI4S发展的“三角”模型,详细分析了AI4S的发展潜力、重点领域和具体需求,并为美国总统提供了清晰的建议,是一份高质量的AI4S政策咨询报告。本文对该报告核心内容进行解读。

PCAST《报告》的背景情况

1.《报告》是美国总统《关于安全、可靠和可信地开发和使用的人工智能的行政令》中的一项研究任务。

美国白宫围绕人工智能发展的重点方向,不定期发布重要文件,包括:《人工智能权利法案蓝图:让自动化系统服务于美国人民》、《美国国家人工智能研发战略计划》、《关于安全、可靠和可信地开发和使用人工智能的行政令》。《报告》作为《关于安全、可靠且可信赖的开发和使用人工智能的行政令》的指定任务,在美国的人工智能政策文件中占有重要地位。

2.《报告》是首份呈送美国总统的AI4S专案报告。

美国能源部、国防部、卫生部等部门近年来已陆续发布本领域的AI4S报告。PCAST作为总统最高级别的科学政策顾问团,《报告》内容统筹协调各部门的研究成果和政策建议,从更宏观、更综合的角度对AI4S的发展机遇和挑战做出了回应。

3.《报告》预计将成为未来美国AI4S政策的基本依据。

依据《行政令》中的要求,《报告》立足于解决重大社会与全球挑战,解决当前科学研究过程中人工智能技术的应用障碍。《报告》的出台,为总统提供了新的科研组织模式和科研流程规范建议,将为美国政府在AI4S领域的下一步决策提供有力支撑。

PCAST《报告》的基本内容

《报告》的主体内容包括三部分:即AI4S的发展逻辑,发展方向和发展需求。

1.AI4S发展逻辑与前景

(1)报告逻辑总纲——AI4S发展“三角”模型

《报告》提出人工智能支持科学(AI4S)发展的三大关键要素:提升能力、共享资源和规范科研。三大要素在AI4S领域形成了一个互相作用、互相促进的良性循环,为科学研究的快速发展提供了强有力的支持。

“提升能力”,指科学家使用人工智能提升科研能力与效率。科学家基于AI4S产生的创新成果能够进一步促进“AI的资源共享”和“科研活动的规范”。

“共享资源”,指分享算力、数据、模型等AI4S基础资源。推动AI4S资源的广泛使用,一方面能加快“规范科研活动”的普及速度,同时也能助力更多科研团队“提升能力”,提升整体科研水平。

“规范制度”,指科研全流程负责任使用人工智能工具。规范科研活动,有助于保证“AI资源共享”的质量,也在“提升科学家能力”过程中加速高质量成果产出。

“三角”模型解析了AI4S范式中的技术要素,以及三要素在提升科研效率中的协同作用,为评判AI4S科研工作流程提供了基础的分析框架。

提升能力、规范科研和共享资源的三角模型

打开网易新闻 查看更多图片

(2)AI4S未来发展前景

基于三角模型,AI4S的发展前景(如下表1)主要分为三方面:一是科研能力提升,AI能够协助科学家决策、处理日常任务、自动化实验流程、承担高通量计算模拟、复杂数据分析等任务;二是基础资源共享,多模态科学模型能够进行学科融合、降低科研成本、促进科研机构合作、使AI4S大科学计划成为可能。三是规范科研制度,AI4S需要负责任的科研制度,这些科研制度将整合到科研工作全流程中。

AI辅助科研的10大发展趋势

打开网易新闻 查看更多图片

2.AI4S重大机遇:7大核心领域布局

目前来看,AI并非在所有的科学领域都能够高效应用。《报告》综合评估AI4S对社会经济发展、公共安全、环境保护等关键领域的深远影响,确定了七大典型领域。在生命科学领域推动疾病治疗进展,在气象科学领域减轻极端天气事件的影响,在物理学和宇宙学领域探索新的规律,在集成电路领域增强半导体自动化设计能力,在材料科学研究领域开发超导体技术,在农业和药物设计领域的创新应用,以及在社会科学领域利用数据驱动政策制定。虽然AI4S能够发挥作用的领域不仅限于此7大领域,但是《报告》撰写组认为,这7个领域的科学研究与AI4S范式适配度高,在应对社会与全球挑战方面具有先发优势,预计可获得较大收益。

3.AI4S发展需求与行动建议

《报告》深入调研美国AI4S科研现状,提出当前发展阶段的重点需求,并给出相应行动建议。

打开网易新闻 查看更多图片

鉴于以上重点需求,《报告》提出了5条建议,其中2条是关于资源共享,2条关于制度规范,1条关于能力提升。

资源共享方面,《报告》考察了当前美国国会主导的国家人工智能研究资源(NAIRR)项目,该项目在2023至2025年期间的预算高达24亿美元,涉及多个政府机构,如国防高级研究计划局(DARPA)、美国宇航局(NASA)等共同为获批研究项目分享计算资源、内部AI模型和数据集。《报告》强调,为了支持尖端研究,需要高质量数据和最先进的AI模型。因此,该报告建议在NAIRR的基础上,一是扩大共享人工智能模型评测基准和计算资源,二是进一步对研究项目开放联邦数据集、以促进科研创新和进步。

规范制度方面,《报告》指出,人工智能系统在缺乏适当基准指标、验证程序和负责任使用的情况下,可能产生不可靠的输出结果,对科学领域造成潜在危害。为此,《报告》建议:一是制定评估AI模型准确性、可重复性和可解释性的标准,并开发识别数据偏见以及区分合成数据与真实数据的工具;二是在科研全阶段采用负责任、透明和可信的AI使用原则,以管理潜在风险。

提升科学家研究能力方面,《报告》强调应新增相关科研项目,激励科研人员完善AI4S的科研基础设施。建议将科学数据标注、科学模型训练等关键环节纳入科研基金项目的支持范围,以激励科研人员积极参与AI4S模型配套系统设施的开发研究工作。

借鉴与建议

随着AI4S领域的迅猛发展,建议参考AI4S发展“三角”模型,以重点领域为基础,以新增科研项目为引领,以健全科研管理体系为抓手,全面提升科研效率。

1.在AI4S研究布局方面,关注材料、生命科学等重点领域

基于《报告》提出的七大AI4S优先发展领域,结合本市基础,建议在两方面率先发力。一是在生物医药领域,开展新药创制、基因研究、生物育种研究。二是在新材料领域,开展量子、超导、热电、软材料等新型材料开发、性能预测与合成路径设计。

2.在AI4S项目指南方面,增加AI相关基础建设项目

在科研基金项目的支持范围中,建议增加专门针对AI4S基础建设的研究项目。一是将科学数据标注和科学模型训练等关键活动纳入科研基金项目的资助范围。二是研究评估科学模型的基准数据集,以建立评估和比较不同AI4S模型性能的标准化方法。

3.在AI4S制度建设方面,健全智能科研管理体系

在科研管理规范方面,需要根据AI4S范式特征进行相应调整。一是在科研项目规则要求中实施全流程管控,以提升科研工作的效率,并防止人工智能辅助过程中可能出现的错误。二是应确保AI4S科研实践符合伦理标准与安全要求,以促进科研的可持续发展。

4.在AI4S资源共享方面,增加科研设施共享项目

建议参考NAIRR机制,在重点学科与研究方向设立AI4S科研设施共享项目。推动国家学科数据库之间以及与其他数据库进行科研数据、科研模型等资源共享。推动科研云平台、算力云服务平台、数字孪生软件平台等基础设施加强联合,以打破AI4S科研资源壁垒,保证AI4S科研数据成果安全集中,提升AI4S研究生态纵深。

吴琪,上海市科学学研究所科技与社会研究室博士后。李辉,上海市科学学研究所科技与社会研究室研究员。文章观点不代表主办机构立场。

◆ ◆ ◆

编辑邮箱:sciencepie@126.com