打开网易新闻 查看更多图片

随着染色体构象捕获技术 (Hi-C) 等高通量实验技术的发展,真核生物细胞核内的染色体三维特征 (例如A/B区室 (A/B compartment)、亚区室 (subcompartment)、拓扑关联结构域 (TAD) 和染色质环 (chromatin loop)) 被不断揭示。这些不同尺度的三维基因组特征与重要细胞功能 (譬如基因表达) 紧密相关。然而,在单细胞层面,对于重要的亚区室 (single-cell subcompartment) 的分析仍然是一个巨大挑战。目前尚没有利用单细胞Hi-C来发现亚区室的计算方法。

2024年4月8日,美国卡内基梅隆大学计算机学院的马坚实验室 (共同第一作者为Kyle Xiong和张若弛) 在Nature Methods发表了题为scGHOST: Identifying single-cell 3D genome subcompartments的长文, 开发了三维基因组“单细胞幽灵”机器学习方法。

“单细胞幽灵” scGHOST 是专为分析单细胞层面的三维基因组亚区室设计的机器学习方法。此方法利用基于图的表征学习从单细胞Hi-C数据中精确地注释出细胞核内基因组的三维亚区室结构。scGHOST对于我们理解细胞内基因组的空间组织及其在基因表达上的作用至关重要。

通过将单细胞Hi-C数据视为图,scGHOST利用图嵌入神经网络与限制性随机游走策略来发现单细胞亚区室。这一方法的应用不仅证明了其在多种细胞类型的单细胞Hi-C以及单细胞三维基因组成像数据中准确识别单细胞亚区室的能力,还揭示了染色质在单个细胞中的空间定位对细胞特异性生物功能的重要影响。

值得一提的是,scGHOST的一个重要发现是其能够识别与基因转录过程相关的细胞类型特异性或等位基因特异性亚区室。文中详细讨论了单细胞亚区室在复杂组织如人脑前额叶皮层 (PFC) 、发育中的小鼠大脑以及发育中的小鼠胚胎中的异构性和潜在功能。此外,通过同时分析单细胞Hi-C和单细胞RNA,scGHOST进一步连接了基因组的三维结构变化与基因表达在单细胞层面的动态关系,为更好的理解基因调控提供了新的视角。

总之,scGHOST方法推进了我们对单细胞染色体三维结构及其功能影响的理解。这也是马坚实验室最近几年针对单细胞表冠基因组的又一个很有意义的计算方法。 (参见BioArt文章: )

https://doi.org/10.1038/s41592-024-02230-9