随着空间多组学技术的出现,对来自不同来源且具有部分重叠模态的多样化数据集进行嵌合整合,能够从异质性资源中构建出全面的多模态空间图谱。
2026年4月24日,中南大学李敏,芝加哥西北大学David Gate和新加坡科学技术研究局陈金妙共同通讯在Nature Genetics 在线发表题为“Mosaic integration of spatial multi-omics with SpaMosaic”的研究论文。该研究介绍SpaMosaic,一种利用对比学习和图神经网络来构建模态无关且经过批次校正的潜在空间,用于空间域识别以及缺失模态插补的工具。作者使用模拟数据和实验获取的数据集(涵盖大脑、胚胎、扁桃体和淋巴结组织中的RNA与蛋白质丰度、染色质可及性及组蛋白修饰),系统地将SpaMosaic与现有的整合方法进行了基准测试。SpaMosaic通过降低噪声和减轻批次效应,在识别连贯的空间域方面始终优于其他方法。
作者进一步使用跨不同技术、发育阶段、分辨率和模态组成的异质性真实世界数据集对SpaMosaic进行挑战,它始终能够解析精细的解剖结构,并实现了全面的小鼠胚胎图谱绘制。除了整合功能,SpaMosaic还能够对缺失模态进行准确插补。在一个嵌合的小鼠大脑数据集中,与实测的染色质可及性数据相比,插补出的组蛋白修饰不仅复现了预期的转录组-表观基因组相关性,还发现了更多区域特异性的调控关联,展示了在没有共检测的情况下推断跨模态关系的能力。在计算层面,SpaMosaic具有高度可扩展性,能够整合超过100个组织切片并处理一个包含超过80万个点的单张切片。总之,SpaMosaic为将快速积累的异质性空间组学数据统一整合到全面的生物学图谱中提供了一个通用框架。
空间组学技术是研究组织内细胞在空间背景下异质性的有力工具。当前空间多组学的发展正拓展其应用范围,使其能够从同一组织切片中同时获取多种组学信息。例如,空间ATAC–RNA-seq可捕获染色质可及性和RNA表达;空间ATAC–RNA–蛋白-seq可实现三组学分析;而空间Mux-seq则能同时分析多达五种不同的模态。通过从同一样本中捕获不同的组学图谱,这些互补的视角可用于构建更为全面的图像,并更好地解析表型微环境。然而,空间组学实验在技术上颇具挑战,需要在分辨率、灵敏度和通量之间进行权衡,而从同一切片中获取多种组学数据则进一步加剧了这些挑战。目前,最常获得的数据来自不同(有时是相邻)切片上的单组学模态实验。因此,具有保守但亦互补组分的空间多组学可通过计算整合,从而产生更连贯、更完整且维度更高的组织生物学图像。这种整合被称为嵌合整合,有助于共识区域识别、增强信噪比、补全不同切片中缺失的检测项目以及解析组学间的交叉联系,这对于构建多组学空间组织图谱至关重要。
本质上,嵌合整合旨在整合具有不同多模态组成的多个批次。然而,与没有共享批次或模态的对角线整合不同,嵌合整合利用跨批次的共享模态组成的嵌合结构作为数据整合的桥梁。因此,嵌合整合既能通过协调同一细胞内模态异质性实现垂直整合,也能通过减少同一模态内跨批次的技术差异实现水平整合。在嵌合整合空间组学数据的背景下,空间背景是一个额外的信息层,应加以利用以实现更连贯、更准确的整合。
图1. SpaMosaic框架概述(摘自Nature Genetics )
目前已有几种可用的单细胞嵌合整合方法,例如Cobolt、scMoMaT、StabMap和MIDAS。由于这些方法专为单细胞嵌合整合设计,它们并未考虑空间背景,因此可能难以处理空间数据。就空间感知方法而言,存在邻域感知聚类方法(如BANKSY)、水平整合方法(如SEDR、GraphST、STAligner和STitch3D)以及垂直整合工具(如SpatialGlue)。由于各自对数据可用性的假设,这些方法均不适用于空间嵌合整合。尽管CellCharter和PRESENT专为垂直和水平空间整合设计,但它们无法处理空间嵌合整合的一般情况。
本文提出了SpaMosaic方法,用于空间嵌合整合。SpaMosaic结合对比学习与图神经网络(GNNs),以空间感知的方式将每个切片投影到模态无关的隐空间中,同时最小化批次变异。具体而言,作者采用加权轻量图卷积网络(WLGCN)来编码斑点间的相似性。输出的隐嵌入可用于数据模态的补全以及下游分析,例如空间区域识别和多切片联合分析。作者首先使用模拟数据集展示SpaMosaic在降低技术噪声和恢复隐藏空间模式的同时进行嵌合整合的能力。随后,作者使用实验获取的人和小鼠组织数据(包含RNA、ATAC、组蛋白修饰和蛋白质模态)对SpaMosaic进行了基准测试。总体而言,SpaMosaic在模态对齐、批次整合和空间区域识别方面均表现出优越性能。此外,作者展示了SpaMosaic在处理不同生物学环境下多种模态配置、分辨率、切片大小和技术方面的多功能性,从而能够对异质性的空间组学数据进行全面且连贯的分析。
参考消息:https://www.nature.com/articles/s41588-026-02573-3