由30亿个碱基对构成的人体基因序列蕴藏着遗传“密码”,决定着人类的生老病死。而基因编辑技术的发展,让人类拥有了改写这些“密码”的工具。

如何让基因编辑更加精准高效,更好地辅助基因功能研究、药物靶点筛选、遗传疾病治疗,这是当下生命科学领域的研究热点,也是智能计算平台研究中心博士后黄诗圣的研究方向。

这个沉浸于基因世界的年轻人刚刚获批了国家自然科学基金青年科学基金项目,也是之江实验室博士后“突出贡献奖”获得者。他正利用智能计算的力量,改进基因编辑工具,在海量基因数据中寻找致使肿瘤耐药的关键位点。

进工具

蛋白质是组成人体一切细胞的重要成分。各类蛋白翻译后修饰对蛋白质功能的正常发挥起着重要的调节作用,磷酸化就是其中一种修饰。

“可以把加磷酸化修饰和去磷酸化修饰想象成蛋白质上面的一个功能开关,当这个开关打开,就可以调控蛋白质活性,影响细胞功能。”黄诗圣解释道。

负责打开这个“开关”的是蛋白激酶。研究表明,各类蛋白激酶驱动的异常信号传导是肿瘤对药物治疗产生耐药性的关键原因之一。

“蛋白激酶打开的是很多个磷酸化位点,究竟哪一个位点对于肿瘤耐药性的产生是最重要的,要进行更加具体的研究。”黄诗圣进一步解释说。

基于CRISPR/Cas系统发展而来的碱基编辑和先导编辑为研究单个磷酸化位点的功能提供了非常好的手段,利用这两种基因编辑工具,可以模拟磷酸化的去除和激活,进而确定磷酸化位点在肿瘤耐药中的作用。

尽管这两种工具实现了在碱基尺度研究基因功能,但它们也存在着一些短板,例如碱基编辑存在脱靶高的问题,先导编辑存在编辑效率低的问题。

打开网易新闻 查看更多图片

针对这些问题,黄诗圣和团队用了多种策略改进碱基编辑和先导编辑工具。例如,基于之江实验室智能计算数字反应堆计算基因平台,构建了xrRNA病毒数据库,挖掘发现和验证了5种新的xrRNA结构用于构建先导编辑工具的pegRNA,大幅提升了先导编辑工具的编辑效率。

利用这些工具,黄诗圣针对肿瘤耐药构建了一系列突变筛选文库,为进一步深化蛋白磷酸化和遗传变异在肿瘤耐药过程中的作用机制研究奠定了坚实基础。相关研究成果也发表在Advanced Science、Nature Communications、Molecular Therapy等权威期刊之上。

“有了这些工具和文库,我们可以揭示新的肿瘤耐药机制,进而开发新型药物来阻断相关耐药信号通路的作用,从而延长患者的生存期。”黄诗圣说道。

智能计算加成

2021年,AlphaFold2对蛋白质结构的精准预测轰动世界,AI for Science加速发展。同年,之江实验室启动智能计算数字反应堆建设,在AI for Science领域做了系统布局。在此背景下加入之江实验室,也给黄诗圣的研究开启了更大的想象空间。

长时间的实验、等待、验证,是黄诗圣过去研究工作的常态。加入之江实验室之后,他开始借助智能计算的力量,通过高通量功能基因组研究策略,解读耐药表型与碱基尺度基因型的关联性。

“传统的遗传变异功能表征严重依赖于大规模的人工操作,耗时长、成本高、易出错。而自动化的高通量基因编辑平台能够实现大规模的内源性目标基因编辑,大大提高研究速度和效率。”黄诗圣表示。

通过工程化、自动化的高通量基因编辑筛选,可以在全基因组范围建立碱基和氨基酸尺度的肿瘤耐药功能关联基因型数据集,打造标准化、集成化的通用主题数据库。在此基础上,建立大数据生成模型,可以进行肿瘤耐药的智能预测,提供肿瘤精准治疗方案。

“借助实验室在智能计算和人工智能领域的优势进行肿瘤耐药机制相关研究,让我非常兴奋,也很有挑战性。”黄诗圣说。

目前,之江实验室已经组建起一支生物、生信、算法、工程多学科背景交叉的计算基因团队,黄诗圣正和团队一道,勾连起庞大的基因数据,破译影响生命活动的关键“密码”。(之江实验室)