一个细胞要成为血细胞、神经元或色素细胞,其路径的最初步骤是什么?科学家已经开发出越来越强大的工具来追踪这些变化,但有一个挑战一直存在:不仅要了解细胞走向何方,还要了解是哪些调控因子引导它们走向最终的命运。
现在,斯托尔斯医学研究所和亥姆霍兹慕尼黑中心的新研究在《Cell》上发表,开发了一个新的框架来帮助回答这个问题。
这项新技术名为RegVelo,是一个连接单细胞生物学中两个常常彼此分离领域的模型:一是估计细胞随时间变化的方法,二是推断控制这些变化的基因调控网络的方法。通过将这两部分结合起来,RegVelo允许研究人员进行“时间旅行”,预测细胞如何变化,并识别控制这些变化的基因。这一切都可以通过计算机模拟完成,无需在实验室中进行每一次实验。
该研究的共同资深作者、斯托尔斯研究所研究员Tatjana Sauka-Spengler博士说:“那么,了解这一点为什么重要?你可以想象,如果你有一组非常早期的细胞,拥有特定的指令集,你就可以在体外以非常自然的方式重现这些细胞类型中的一些。这些细胞随后可用于再生医学中的细胞疗法。”
斯托尔斯研究所所长兼首席科学官Alejandro Sánchez Alvarado博士说:“Sauka-Spengler和她的合作者开发了一种处理此类数据的全新方法。它使我们能够推断每个组分在空间和时间上的最可能路径,并利用深度学习预测这些动态,然后通过实验进行验证。”
在这项研究中,RegVelo对神经嵴进行了建模。神经嵴是一组早期胚胎细胞,可以分化成身体的许多不同部分。在斑马鱼神经嵴发育中,RegVelo识别出色素细胞形成的早期驱动因子(tfec),并揭示了一个以前未知的色素细胞命运调控因子(elf1)。这些预测随后得到了实验支持,表明该模型不仅能描述发育变化,还能产生可检验的假设。
“在一个最终被定义的生物过程中,总有一个启动的、驱动的要素,”Sauka-Spengler说。“但大多数时候,如果你只分析最终的细胞状态,那个要素就会丢失。发育过程常被描述为一系列细胞状态的静态快照。然而,我们真正想理解的是细胞如何做出决定——它们如何从一个状态过渡到另一个状态。RegVelo模拟了这些命运决定是如何随着时间和空间在基因调控网络中编码的,以及是什么驱动了它们。”
通过帮助将早期调控事件与后期细胞命运联系起来,这项工作还可以改善科学家研究发育障碍的方式,并随着时间的推移指导再生医学和细胞疗法的努力。
Sánchez Alvarado说:“RegVelo的价值远远超出神经嵴细胞。它适用于任何细胞随时间变化的系统,从基础发育生物学到模拟肿瘤轨迹以及可能指导治疗的细胞结局。任何从事细胞动力学研究的人都值得关注它。”
单细胞生物学研究使得构建越来越详细的发育图谱成为可能。RNA速度方法可以帮助研究人员估计细胞如何在发育景观中移动,而基因调控网络方法可以识别基因之间的关系。但这些方法通常并行使用而不是协同使用。RNA速度方法通常不直接模拟转录调控,而调控网络方法通常不捕捉细胞随时间的动态变化。
该研究的共同资深作者、亥姆霍兹慕尼黑中心和慕尼黑工业大学的Fabian J. Theis博士说:“长期以来,细胞动力学和基因调控基本上是分开建模的。RegVelo将这些部分整合在一起,使我们不仅能问细胞如何变化,还能问哪些调控相互作用在推动这些变化。”
该框架联合建模了剪接动力学和基因调控关系,使研究人员能够绘制细胞发育的隐藏时间线,预测细胞如何从一个状态转变到另一个状态,并测试当特定调控因子被扰动时可能发生什么。
实际意义上,这意味着科学家可以提出更具机制性的问题,而不仅仅是“这个细胞要去哪里?”现在他们可以问:“是哪些基因在推动它去那里?”
这项工作也反映了互补团队之间的深度合作。Sauka-Spengler实验室(2022年从牛津大学迁至斯托尔斯研究所)带来了颅神经嵴发育的高分辨率基因调控框架,而慕尼黑的Theis团队带来了建模和定义单细胞发育轨迹以及使用RNA速度分析的计算专业知识。这些方法被整合到一个共享的深度学习模型中,使发育转变具有高度可预测性和可测试性。
Sauka-Spengler说:“让这项工作特别强大的是互补优势的结合……我们实验室的高分辨率基因调控回路和Fabian团队的动态轨迹与网络建模。RegVelo正是从将这两种视角整合到一个框架中而产生的。”
基因调控网络是有序的指令集,帮助引导细胞从一种身份转变为另一种身份。
“它们是一连串的事件,”Sauka-Spengler解释说。“一组基因激活或抑制另一组基因,推动细胞沿着一条路径而非另一条路径前进。这很重要,因为身体里的每个细胞都始于相同的DNA。使皮肤细胞不同于神经元或肌肉细胞的不是基因组本身,而是哪些基因被开启、何时被激活以及以何种组合被激活。”
这个过程可以比作一个电子电路。有些基因像“走”的信号,另一些像“刹车”,它们共同构成科学家试图破译的代码。
研究团队使用RegVelo识别了早期色素驱动因子,并揭示了斑马鱼中一个以前未知的色素细胞命运调控因子。他们将这一框架应用于多个系统,包括细胞周期、胰腺内分泌发生、造血、肌发生、后脑发育和斑马鱼神经嵴发育。在这些场景中,该模型在推断潜在时间、速度、终末状态和谱系相关驱动因子方面,表现与领先方法相当或更优。
最引人注目的例子之一来自神经嵴——这个发育系统产生多种细胞类型,包括色素细胞、颅面组织和周围神经系统的一部分。在那里,RegVelo尤其有用,因为它可以识别在发育轨迹早期起作用的调控因子,即使这些基因在最终细胞状态中不强烈表达。
使用这种方法,研究人员发现tfec似乎是色素细胞发育的早期驱动因子。他们还发现elf1是一个以前未知的色素谱系命运调控因子。后续实验(包括CRISPR/Cas9介导的敲除和单细胞Perturb-seq)支持了这两种预测,表明该模型不仅能描述发育变化,还能产生在活体系统中成立的具有生物学意义的假设。
Sauka-Spengler说:“RegVelo是一个整合了这两种知识的模型,基本上允许我们证明我们发现的有效性。我们能够预测特定细胞命运和细胞承诺的关键驱动因子,然后我们能够模拟这种扰动,并清晰地读出对非常下游结果的影响。”
这种能力之所以重要,部分原因在于规模。研究人员经常要面对成百上千个可能的影响因子。对它们逐个进行实验扰动将是昂贵且不切实际的。RegVelo通过作为预测工具和未来实验的筛选工具,帮助缩小搜索范围。
Sauka-Spengler说:“因为我们谈论的是涉及成百甚至数百个基因的网络,想象我们想要扰动并分析所有它们是不现实的。所以我们可以将RegVelo用作分析和预测及筛选工具,为未来的实验服务。”
研究团队将RegVelo描述为迈向更具预测性的发育生物学的一步,在这种生物学中,计算模型帮助优先安排实验、发现隐藏的调控因子,并预测当基因网络被扰动时细胞命运可能如何变化。RegVelo揭示了细胞如何在状态之间过渡,并识别了驱动其命运决定的基因相互作用。
其影响可能远远超出某一个发育系统。高分辨率的调控理解可以帮助研究人员更好地识别发育缺陷的原因,并随着时间的推移,在细胞疗法和再生医学中更精确地引导细胞——从修复心肌、培养皮肤移植物到开发实验室培养的软骨。颅面疾病、色素细胞缺陷以及引导干细胞或类器官走向所需细胞状态的更广泛努力,都是这种深入理解可能发挥重要作用的领域。
Sauka-Spengler说:“拥有一个完整的基因调控回路,经过预测、模拟、扰动然后验证,给了我们一个非常坚实的工具。我们可以从干细胞或初始细胞开始,开发新方法将它们引导到可用于细胞治疗的细胞类型,以达到治疗的目的。”
该研究表明,未来可以将该框架扩展到包含额外的调控层,包括染色质、蛋白质活性和其他多模式测量。尽管目前存在局限性(包括关于潜在时间、调控相互作用的简化假设以及计算成本),但该研究提供了一个令人信服的概念验证。Sauka-Spengler说:“当动态细胞状态建模直接与基因调控联系起来时,就有可能更接近机制,然后实现发现。”(生物谷Bioon.com)
参考文献:
Hengchi Chen et al, RegVelo: gene-regulatory-informed dynamics of single cells, Cell (2026). DOI: 10.1016/j.cell.2026.04.022.