AlphaFold2 和 RoseTTAFold 等高精度蛋白质结构预测工具的问世,破解了困扰学界长达五十年之久的“蛋白质折叠”难题,深刻改变了结构生物学,尤其是蛋白质结构的预测和设计。

不过,目前这些深度学习方法主要集中用于蛋白质系统,无法模拟共价修饰以及小分子和非蛋白质分子之间的相互作用等,而这些作用形式在生命活动中发挥着关键作用。

基于此,华盛顿大学蛋白质设计研究所所长David Baker团队发文展示了升级版的深度学习工具 RoseTTAFold All-Atom(RFAA)和 RFdiffusion All-Atom(RFdiffusionAA),新的 AI 工具拓宽了生物分子的范围。其能够预测包含蛋白质、核酸、小分子、金属等完整的生物分子系统,可显著提高科学家模拟和生成各种生物分子的能力。

打开网易新闻 查看更多图片

(来源:Science)

论文中指出,该团队开发的工具从原子水平绘制出了复杂的分子机器,既可以用于预测蛋白质如何与其他分子相互作用,也可以用于设计可结合或检测分子的全新蛋白质。该研究论文现已正式发表在Science上。在概念验证中,当 RFAA 与生成式 AI 配合使用时,该算法设计出了可以与心脏病药物结合的新型蛋白质,还生成了调节血红素和胆碱的蛋白质。

该论文的通讯作者是David Baker,主要作者是在 David Baker 实验室从事博士后研究的 Jue Wang 和研究生 Rohith Krishna 和 Woody Ahern。

(来源:David Baker 实验室官网)

“RFAA 和 RFdiffusionAA 有潜力广泛应用于模拟和设计复杂的生物分子系统。”研究人员说。

可模拟所有生物分子,从头合成高级功能蛋白质,已免费开源

蛋白质是生命活动的物质基础,也是细胞内部的主要功能分子。

公开资料显示,AlphaFold 是 DeepMind 推出的蛋白结构预测工具;RoseTTAFold 是David Baker实验室推出用于预测蛋白质结构的深度神经网络,RFdiffusion 则是该实验室推出用于从头构建全新蛋白质的生成式 AI 工具。这些工具专注于蛋白质的氨基酸构建模块,而非捕获蛋白质如何与其他生物分子相互作用。

“不过,蛋白质不能单独发挥作用,它需要与其他生物分子相互作用发挥功能。现实是 AlphaFold 和 RoseTTAFold 这些工具只能预测蛋白质的结构,而不能预测整个系统中其他部分的结构,这对于理解生命活动是一个很大的限制。”David Baker说。

新模型建立在上述模型成功的经验基础之上。在最新的研究中,研究团队通过扩展实验室的两个早期工具 RoseTTAFold 和 RFdiffusion,推出了“升级版”的深度学习工具。整个模型由两部分组成,即结构预测模型 RFAA 和蛋白质设计模型 RFdiffusionAA,新模型扩展了结构预测和蛋白质设计的范围。

科学家们首先重新训练了蛋白质预测工具 RoseTTAFold,并将升级后的模型命名为 RoseTTAFold All-Atom,意味为基于所有主要类型生物分子数据训练的单一 AI 模型。具体而言,通过在多个数据集上进行训练,其中包含数十万个描述蛋白质、小分子及其相互作用的数据点,以了解小分子的整体特性,可用于构建合理的蛋白质组装体。该团队还添加了一个“置信度衡量标准”来识别高质量的预测,即那些能够产生稳定且功能性的生物组装的预测。

打开网易新闻 查看更多图片

(来源:David Baker 实验室官网)

在论文中,研究人员表明 RoseTTAFold All-Atom 可以精确预测特定蛋白质和 DNA 片段如何相互作用、某些药物分子如何与人类受体结合等完整的生物分子系统,包括 DNA、RNA、金属离子、糖和其他键合原子等几乎所有生物分子。

Rohith Krishna 解释道,“这对于理解生物学非常重要,同时也有利于药物发现研究。我们已经将建模能力扩展到氨基酸之外,这可能会为分子生物学带来更清晰的新视角,有点像从黑白电视切换到了彩色电视。

然后,该团队通过对去噪任务微调创建了新版本的 RFdiffusion——RFdiffusion All-Atom,该模型可以从头合成生成自然界中不存在的新型蛋白质。它围绕小分子构建蛋白质结构,即直接在小分子和其他非蛋白质分子周围构建蛋白质结构产生结合口袋。

实验室测试表明,RFdiffusion All-Atom 可以产生具有高级功能的蛋白质,比方说,产生带有口袋的蛋白质,这些口袋可以与特定小分子化合物结合。通过概念验证,研究团队发现这些设计的蛋白质可以与包括类固醇地高辛、富含铁的血液分子血红素以及植物用来吸收阳光的化学物质结合。这进一步表明,AI 可以产生多种高级的生物功能。

值得一提的是,现在,该软件包括代码在内的所有内容均已开源,任何人都可以下载使用。

“有可能成立一家新公司”

“通过让全球的科学家以高精度生成生物分子,我们正在为突破性的发现和实际应用打开大门,这些发现和实际应用将塑造医学、材料科学及其他领域的未来。”David Baker说。

他在新闻稿中还提到,其实验室已经在使用这些工具来设计新型酶,包括可以分解塑料的酶。他设想制造与强效药物结合的蛋白质,以帮助抵消药物过量的情况。他还认为,基于 AI 设计能够感知小分子药物的蛋白质可以用于控制工程细胞疗法的传感器。

研究主要作者 Woody Ahern 指出,我们改进的蛋白质设计软件有潜力帮助科学家生成出更复杂和具有功能性分子以及疗法。研究人员现在可以设计能够关闭特定致病分子的蛋白质,为精确有效的治疗铺平道路。

(来源:华盛顿大学官网)

可能也正是具备多种应用潜力,在被外媒问及是否有一家初创公司正在开发他的新“All Atom”软件时,David Baker坦言,“很有可能会有的,我们认为转化这项研究是一件相当具有商业意义的事情。”

去年 10 月,该团队将这项研究发布在了预印本平台。发布几周后,Alphabet 旗下子公司 Isomorphic Labs 表示公司可以做与David Baker开发的工具类似或者更多的工作,这家公司正在使用 AlphaFold 及其相关工具进行药物发现。这从一定程度上也表明了这项研究的商业化价值。

事实上,该实验室在研究成果转化方面很有经验,衍生分拆出了许多生物技术初创公司,包括疫苗设计公司 Icosavax,这家公司在今年 2 月份被阿斯利康出资 11 亿美元收购;此前,David Baker还基于实验室开发的从头设计人造荧光素酶的深度学习算法——Family-wide Hallucination 成立了一家初创公司 Monod Bio,这也是首个将蛋白质从头设计用于生物传感器和医疗诊断的公司。该公司于 2022 年 8 月完成 2500 万美元种子轮融资。

素材来源官方媒体/网络新闻

免责声明:本文旨在传递合成生物学最新讯息,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。