撰文丨王聪

编辑丨王多鱼

排版丨水成文

打开网易新闻 查看更多图片

早在 1957 年,英国发育生物学家康拉德·沃丁顿(Conrad Waddington)就曾提出,胚胎的发育过程,就像是无数颗小球从沟壑纵横的山坡上滚滚动,随着发育的进行,这些小球会经过不同的分叉,最终落入各自的谷底,成为神经元、肌肉细胞或免疫细胞等。这就是后来著名的“育景观”概念,奠定了我们理解细胞命运的基本框架。

一直以来,科学家们都希望能够像天气预报一样预测细胞命运。细胞命运的转变由调控回路所驱动,然而,RNA 速率(RNA Velocity)模型,在描述细胞动态时未明确考虑基因调控相互作用,这限制了对机制的理解;而基因调控网络(GRN)推断,则在很大程度上忽略了生物系统的动态特性。这导致了基因调控与细胞动态之间的脱节。

2026 年 5 月 11 日,亥姆霍兹慕尼黑中心计算健康研究中心计算生物学研究所Fabian J. Theis团队与牛津大学Tatjana Sauka-Spengler团队合作(汪伟旭博士及武汉大学胡致远教授为论文共同第一作者),在国际顶尖学术期刊Cell上发表了题为:RegVelo: Gene-regulatory-informed dynamics of single cells 的研究论文。

该研究推出了一个端到端生成式框架——RegVelo(Regulatory Velocity),其作为一个可操作的“虚拟细胞”,能够同时推断基因调控网络与细胞发育动态。研究团队将 RegVelo 应用于斑马鱼神经嵴发育研究,并利用全长 Smart-seq3 以及共享的基因表达和染色质可及性测量数据,描绘了命运决定背后的调控程序。通过计算机模拟扰动,并通过 CRISPR-Cas9 基因敲除和单细胞 Perturb-seq 验证,确定了 tfec 是色素细胞形成的早期驱动因子,而 elf1 是色素细胞命运的调控因子。

这些结果表明,RegVelo构建了一个连接基因调控细胞命运决定的定量框架,对于发育障碍、肿瘤生长及再生医学等具有重要意义。

打开网易新闻 查看更多图片

传统方法的局限:只见树木不见森林

要理解这项研究的价值,我们先来看看当前单细胞生物学研究中面临的挑战。科学家们已经能够通过单细胞 RNA 测序技术观察每个细胞的基因表达状态,就像给每个细胞拍了一张“基因快照”。基于这些快照,他们开发了两种主要方法来推测细胞的发育轨迹:

  • RNA 速率(RNA Velocity)模型:通过比较未剪接和已剪接的 mRNA 比例,预测细胞即将发生的变化。但这种方法需要假设基因之间相互独立(忽略了基因之间的调控关系)且转录速率恒定。

  • 基因调控网络(GRN)推断:分析基因之间的调控关系,但通常不考虑细胞状态的动态变化。

这就好比前者只观察车辆行驶的速度和方向,却不关心交通规则;后者只注重交通规则,却不看车辆实际如何行驶。两者都只能看到问题的一部分。

RegVelo 的突破:打造“数字细胞实验室”

在这项最新研究中,研究团队开发了RegVeloRegulatoryVelocity),其巧妙地将 RNA 速率与基因调控网络这两种视角融合在一起,创建了一个端到端生成式框架,能够同时推断基因调控网络和细胞发育动态。RegVelo 的技术核心相当精妙,它采用贝叶斯深度生成模型,将未剪接的和已剪接的 RNA 读数作为输入,通过神经网络学习细胞的低维表示。更重要的是,它通过一个基因调控网络引导的神经网络,将转录建模为一个受调控和时间依赖的过程,通过建模这种调控关系,RegVelo 能够更真实地反映生物系统的复杂性。

RegVelo 就像在计算机中构建了一个“虚拟细胞”,这个虚拟细胞不仅包含基因表达数据,还内置了基因之间的调控规则。让研究人员能够在这个虚拟环境中进行各种“实验操作”——

  • 模拟基因敲除:关闭某个基因,观察细胞命运如何改变;

  • 预测发育轨迹:基于当前状态,预测细胞未来的分化方向;

  • 识别关键调控因子:找出决定细胞命运的关键基因。

实际应用:从理论到验证

研究团队在多个生物系统中验证了 RegVelo 的有效性。在细胞周期数据集中,RegVelo 不仅准确推断出了细胞周期进展方向,还识别出了关键的调控因子,例如 TGIF1 和 ETV1,以及它们调控的细胞周期相关基因。

最令人印象深刻的是在斑马鱼神经嵴发育研究中的应用,神经嵴细胞是脊椎动物胚胎中的多能干细胞,能够分化为多种细胞类型,包括色素细胞、神经元等。通过 RegVelo 分析,研究团队预测了细胞命运启动:识别出了哪些细胞正在向特定命运“倾斜”;发现了关键驱动基因:确定了 tfec 是色素细胞形成的早期转录驱动因子;识别了新的调控因子:发现 elf1 是色素细胞命运的调控因子。

这些预测随后通过 CRISPR-Cas9 基因敲除和单细胞 Perturb-seq 实验得到了验证,显示出与实验观察的高度一致性。

打开网易新闻 查看更多图片

虚拟细胞的未来:从观察到预测

RegVelo 的推出,标志着单细胞生物学从描述性科学向预测性科学的转变。传统上,科学家们只能观察细胞发生了什么;现在,他们可以在计算机中模拟“如果...会怎样”的场景。

这种计算机上的“虚拟细胞”方法具有多重意义——

  • 加速发现:在湿实验之前进行计算机模拟,可以优先考虑最有希望的实验方向;

  • 降低成本:减少不必要的动物实验和试剂消耗;

  • 深入理解:提供机制性见解,而不仅仅是相关性观察;

  • 个性化医疗:未来可能用于预测患者细胞对治疗的反应。

RegVelo不仅仅是一个新的计算工具,它代表了一种研究范式的转变——将细胞视为一个可编程、可模拟的数字实体,在计算机上测试各种调控假设,再进行湿实验验证,从而大大加速生物学发现速度。该技术的潜力远不止于发育生物学;在癌症研究中,它可以帮助理解肿瘤细胞的异质性和演化路径;在再生医学中,它可以指导细胞重编程;在药物筛选中,它可以预测化合物对细胞状态的影响...

最后,研究团队表示,虚拟细胞领域目前存在两条主流路径:一条是以 scGPT、Geneformer 为代表的单细胞基础模型(foundation model),通过在海量转录组数据上预训练 Transformer,学习基因表达的统计规律,在扰动响应预测等任务上展现出一定的泛化能力;另一条则是以 RegVelo 为代表的动力学建模路线,将生物物理机制显式编码进模型结构,赋予预测以可解释的因果含义。

未来真正意义上的“虚拟细胞”,需要将 AI 的模式识别能力与机制模型的因果严谨性相结合——前者擅长从数据分布中提取规律,后者擅长在反事实干预下给出可信预测。然而,无论模型架构如何精巧,AI for Science 的研究价值最终必须落脚于实验上可稳健证伪的预测: 计算不能只停留预测和简单的下游任务的方法比较,而应当经过严格的体内实验检验,在可证伪的框架下积累对生物学因果机制的理解。

论文链接

https://www.cell.com/cell/fulltext/S0092-8674(26)00457-5