蛋白质在我们的身体中扮演着构建结构、催化化学反应、运输物质以及识别和抵御病原体等关键角色。它们在生长发育、新陈代谢和免疫防御中发挥着不可替代的作用。如今,科学家们不仅满足于自然界中的蛋白质,还试图创造全新的蛋白质以满足特定需求,如设计能够精准识别并中和特定病毒的蛋白质用于疾病治疗,或打造高效的生物催化剂以加速工业生产中的化学反应。
机器学习通过学习已知蛋白质功能数据,能够建立蛋白质结构与功能之间的复杂关系模型,为蛋白质的精确设计带来无限可能。
2024 年,蛋白质设计领域迎来了里程碑——蛋白质从头设计的先驱戴维·贝克,以及软件 Alphafold2 的开发者 Demis Hassabis 和 John M. Jumper 被授予诺贝尔化学奖。Alphafold2 的出现极大地提高了蛋白质结构预测的精度,为蛋白质设计带来了革命性的变化。
在此基础上,由慕尼黑工业大学的 Hendrik Dietz 教授和麻省理工学院的 Sergey Ovchinnikov 教授领导的国际研究团队,进一步拓展了蛋白质设计的边界。他们将 Alphafold2 的精确结构预测能力与梯度下降优化方法相结合,开发出了一种创新的蛋白质设计方法。该研究成果发表在顶级学术期刊 Science 上。
梯度下降是模型优化的常用方法,可以逐步识别与目标函数的偏差,并调整参数,直至达到最优结果。在蛋白质设计中应用梯度下降,可以将 AlphaFold2 预测的新蛋白质结构与所需的蛋白质结构进行比较,并使科学家得以进一步优化他们新设计的氨基酸链和由此产生的结构,后者在很大程度上决定了蛋白质的稳定性和功能。
该方法的独特之处在于,它打破了传统设计方法的局限。以往在设计蛋白质时,通常会假设氨基酸链的每个位置只能由 20 种天然氨基酸中的一种占据。而新方法则采用了一种更为灵活的策略,在设计初期,它允许所有可能的氨基酸在每个位置上以一种虚拟叠加的状态存在,为蛋白质的优化提供了丰富的选择。通过多次迭代优化,这些虚拟叠加的氨基酸逐渐“凝聚”成一个最接近目标结构的稳定结构。此时,研究人员就可以根据这个优化后的结构,确定出能够在实验室中实际合成蛋白质的具体氨基酸序列,从而将虚拟的设计转化为现实的蛋白质分子。
目前,研究团队利用新方法在计算机上虚拟设计了 100 多种蛋白质,这些蛋白质各具独特的功能和特性,如模拟酶的催化活性、模拟抗体与抗原的结合特异性等。随后,他们在实验室中成功合成了这些蛋白质,并对其进行了一系列严格的实验测试。
实验结果令人振奋——实际生产出的蛋白质结构与计算机预测的结构高度吻合。研究人员对其中 9 种单体蛋白质进行亲和色谱纯化,通过天然尺寸排阻色谱(SEC)分析,8 种表达良好且在预期分子量分数处有单一主峰;另外 76 种蛋白质采用高通量表达和纯化策略,58% 的蛋白质分子量与 SEC 校准预期相符。
例如,通过X射线衍射和冷冻电镜等技术确定的蛋白质结构,其与设计模型的低 RMSD 值(如 200 个氨基酸的蛋白质 Ca-RMSD 为 0.90 Å、400 个氨基酸的为 1.28 Å、600 个氨基酸的为 0.92 Å 等)表明了其结构的准确性,并有着实现预期功能的潜力。
不仅如此,研究人员还利用新方法设计出由多达 1000 个氨基酸组成的大型蛋白质,这令人工设计的蛋白质在大小上能够更接近天然存在的抗体,意味着我们可以像在抗体中整合多种功能一样,将不同的功能模块巧妙地组合到这些人工蛋白质中。例如,我们可以设计出一种既能精准识别癌细胞,又能携带药物分子并在特定部位释放的蛋白质,为癌症治疗带来新的希望。
总而言之,该研究成果为蛋白质设计领域带来了新的曙光,它将加速我们对蛋白质结构与功能关系的理解,推动蛋白质设计在生物医学、生物工程和材料科学等众多领域的广泛应用。或许在不久的将来,我们将见证更多基于这些人工设计蛋白质的创新疗法和技术的诞生。
参考文献:
1. Frank C, Khoshouei A, Fuβ L, Schiwietz D, Putz D, Weber L, Zhao Z, Hattori M, Feng S, de Stigter Y, Ovchinnikov S, Dietz H. Scalable protein design using optimization in a relaxed sequence space. Science. 2024 Oct 25;386(6720):439-445. doi: 10.1126/science.adq1741. Epub 2024 Oct 24. PMID: 39446959.
免责声明:本文旨在传递生命科学和医疗健康产业最新讯息,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。