撰文丨王聪
编辑丨王多鱼
排版丨水成文
人工智能(AI)已经彻底改变了分子的结构预测和设计,然而当前的 AI 模型通常依赖于针对特定任务定制的专门算法。
所有分子任务本质上都遵循原子间相互作用的通用物理规律。这自然引出一个关键问题——能否借鉴自然语言、视觉等领域的基础模型范式,通过大规模数据训练构建统一的原子级模型,以捕捉分子相互作用的基本原理?
然而,要想统一分子任务,仍面临着三大挑战:首先,虽然文本提示在大语言模型中效果显著,但用自然语言描述涉及复杂空间关系或多分子片段的分子任务时存在精度不足的缺陷;其次,现有生成式 AI 模型擅长单一任务,但其对任务特定先验分布和采样流程的依赖,阻碍了多任务协同学习的实现;最后,分子表示形式缺乏统一标准,当前模型采用的类型专用格式限制了跨任务与分子类型的迁移能力。
2026 年 2 月 18 日,清华大学马剑竹、首都医科大学宣武医院王子华、北京大学国际癌症研究院韩传辉、清华大学王新泉作为共同通讯作者(北京大学彭新港为论文第一作者),在国际顶尖学术期刊Cell上发表了题为:Unified modeling of 3D molecular generation via atomic interactions with PocketXMol 的研究论文。
该研究推出了一个统一的原子级生成模型——PocketXMol,统一了蛋白质口袋相互作用相关的生成任务,通过使用原子提示作为任务规范,PocketXMol 支持包括小分子和多肽的结构预测以及从头设计,无需针对特定任务进行微调。PocketXMol 在 13 个计算基准中的 11 个上取得了最先进(SOTA)表现,在其余 2 个中也保持了竞争力,超越了 55 个基线模型。研究团队将 PocketXMol 应用于设计 caspase-9 小分子抑制剂,其效力与商业化的泛 caspase 抑制剂相当;研究团队还使用 PocketXMol 生成了 PD-L1 结合多肽,成功率远超文库筛选,结合亲和力达纳摩尔级,可特异性结合 PD-L1 阳性细胞,配体抑制实验和体内肺肿瘤成像验证了其治疗和诊断潜力。
总的来说,PocketXMol像一个精通“原子乐高”的万能设计师, 为 AI 辅助药物发现提供了一个通用平台,有望彻底改变我们发现新药的方式。
该研究的亮点:
原子级 AI 模型 PocketXMol 统一了分子生成任务;
PocketXMol 在 13 项计算任务中的 11 项上达到了最先进(SOTA)性能;
PocketXMol 设计的 caspase-9 小分子抑制剂媲美市售药物;
PocketXMol 设计的多肽表现出对 PD-L1 的高亲和力,并在体内显示出肿瘤靶向性。
新药研发的“老大难”:耗时、烧钱、靠运气
传统药物研发就像大海捞针。科学家们需要从数百万甚至数十亿个化合物中,筛选出能与特定疾病靶点(通常是蛋白质上的一个“口袋”)结合的那一个。这个过程耗时漫长(平均超过 10 年)、耗费巨大(数十亿美元),且失败率极高。
尽管 AI 已广泛用于预测蛋白质结构或筛选化合物库,但大多数模型都是“专才”——有的只擅长把已知分子“对接”到口袋,有的只擅长设计小分子,还有的只擅长设计多肽。想要完成不同的任务,就得切换不同的模型和算法,既繁琐又限制了创新。
PocketXMol:一位“原子级”的万能药物设计师
PocketXMol的核心突破在于统一性。它不再将分子视为氨基酸或化学基团等预制模块,而是直接处理最基础的单元——原子(碳、氮、氧等)和化学键。
统一的“语言”:无论是小分子还是多肽,在 PocketXMol 眼里,都是一套原子和化学键的集合。这种“原子级”的表示方法,让它能无缝处理各种分子类型。
灵活的“任务说明书”:研究团队通过一套“任务提示”(Task Prompt)机制,以原子为单位告诉模型:哪些部分是已知的(比如蛋白质口袋的结构、已有的分子片段),哪些部分是需要生成的,这就像给 AI 一张带有标记的草图,它就能补全整个分子。
“一通百通”的训练:PocketXMol 采用了一种“通用去噪器”架构,在包含近 1200 万个小分子、4 万多个蛋白质-多肽复合物和 8.5 万多个蛋白质-小分子复合物的海量数据上进行了联合训练。它学习的是原子之间相互作用的基本物理规律,因此学会一个任务(例如分子对接),就能举一反三,应用到其他任务(例如药物设计)上,无需针对每个任务重新训练。
简单说,PocketXMol 把药物设计的不同任务,统一成了“在原子层面,根据给定的条件和规则,生成合理的原子和化学键排列”这一件事。
表现如何?在 13 项任务中,11 项达到顶尖水平
研究团队在 13 个关键的计算任务上对 PocketXMol 进行了全面测试,对手是 55 个不同的专业基线模型。结果令人惊叹:
小分子药物设计:在 100 个测试口袋上生成分子,在 13 项任务中的 11 项排名第一。其生成分子在结合亲和力和三维结构合理性上均表现出色。
分子对接:无论是小分子还是多肽对接,其准确率与 AlphaFold 3 模型相当,且在对接含有非标准氨基酸的多肽时优势明显。
多肽设计:设计的 PD-L1 靶向多肽,在实验验证中表现出极高的成功率。从 382 条合成多肽中,筛选出 15 条结合亲和力达到纳摩尔级别(10⁻⁸ M)的候选分子,远超随机肽库筛选的结果。
实用性验证:
设计 caspase-9 抑制剂:针对这个重要的癌症靶点,PocketXMol 设计了 16 个小分子。其中一种(分子 84663)在实验中能有效抑制 caspase-9 及其下游信号,效果与商业化的广谱 caspase 抑制剂相当,经过优化得到的分子 D12,效果更为突出。
设计 PD-L1 靶向多肽:设计出的多肽不仅能高亲和力结合 PD-L1 蛋白,在细胞实验和肺癌小鼠模型中,还能精准定位到肿瘤部位,显示出用于肿瘤成像和免疫疗法的巨大潜力。
超越“拼接”,实现真正的“生成”
与以往许多需要分步进行(先搭骨架、再设计序列、最后填充侧链)的模型不同,PocketXMol 的“原子级”特性带来了独特优势:
直接生成非标准氨基酸:因为它直接“捏”出侧链的每个原子,所以能轻松设计出自然界不存在的、具有特殊功能的非标准氨基酸,极大扩展了多肽药物的设计空间。
精准结合实验验证:生成的多肽的三维结合构象与实验测得的相互作用高度吻合,突显了其预测的准确性。
PocketXMol为代表的技术,标志着 AI 驱动药物研发正从“预测与筛选”迈向“生成与设计”的新阶段。它将复杂的分子设计过程,变成了一个更直接、更统一的 AI 生成问题。未来,随着模型的进一步优化和应用,我们有望看到更多针对“不可成药”靶点的创新疗法被快速设计出来,最终惠及全球患者。
论文链接:
https://www.cell.com/cell/fulltext/S0092-8674(26)00050-4

