在生物制造领域,AI技术已在帮助研究者解决一些重大难题。
例如中国农业科学院深圳农业基因组研究所研究员闫建斌团队,该团队在今年初领衔破解了“紫杉醇生物合成”——这一世界级难题。
成果已发布在《Science》上,通过对紫杉醇生物合成的关键酶的发现,揭示了合成调控的新机制,进而实现了重要生产原料巴卡亭III的异源生物合成。
关键酶的背后 AI功不可没
在媒体采访中,闫建斌谈到了研究中的困难,其中就有关键酶的问题。
紫杉醇生物合成中大约20步反应中有一半都是P450细胞色素酶,这类酶结构和活性复杂,自然界中有20万种P450细胞色素酶,要从中找到紫杉醇合成酶,如同大海捞针。
这一研究过程中,AI技术起到至关重要的作用,尤其是在效率上提升明显。
紫杉烷类分子众多,化学空间巨大,难以分离出所有化合物,团队便做了AI算法模型,用AI预测化学结构;
当细胞里人工加入的酶产生紫杉烷类分子时,在没有标准品的情况下,AI也能判定是否生成了紫杉烷类分子;
紫杉烷氧杂环丁烷合酶的筛选与鉴定
代谢工程中,很多酶的结构也用到AI技术预测和人工改造;
此外,在做基因组及基因组对应的基因表达调控网络分析时,当受原有算法限制而不能得到更精准数据的时候,AI技术也能有所帮助。
在闫建斌的描述中, 此前紫 杉醇合成生物学领域还没有人用过AI辅助。
当AI技术包括AlphaFold出来时,该团队的合作者包括北京大学、复旦大学的合作团队就在探讨基因组学、代谢组学怎样与AI更好地融合。
AI+生物制造 回归数据问题
合成生物学和AI的合作,首先是两者拥有根本上的共通点——数据。
AI与生物技术最大的共性就是都依赖数据,来确定和实现某种功能,其中AI以模型、代码等形式存在于外部,而生物体的数据存储在DNA序列或基因中。
最简单的生物体也有超过100000个碱基对的DNA,人类这样复杂的生命体则有超过30亿个碱基对,这些碱基就像数据点,AI可以使用它来训练、创建和输出。
而且,种类繁多的DNA组合拥有人类大脑难以理解的复杂性和可选性。
但AI擅长发现规律并相互联系,进行足够的训练后,可以从海量的DNA组合中识别出最有希望的候选者。
哪怕是出于成本考虑,实验室的试错过程漫长且昂贵,通过AI实现的虚拟和自动化测试能更快、更便宜的完成测试,反过来使合成生物学具有经济效益。
AI的新发展,尤其是生成式 AI 的出现和改进,其实是为生物制造打开了创造力的大门。
但另一方面来说,目前AI的表现情况仍直接取决于人类给予它学习的数据,现阶段对AI应用来说,最重要的还是由实验人员产生足够的数据。
—The End—