撰文 | 道常

责编 | 奕梵

转录是遗传信息从DNA到RNA传递的关键步骤,也是RNA生物合成的最主要形式。转录是在启动子和特定的转录因子(transcription factors, TFs)以及其他调控蛋白的相互作用下发生的,发生的位点位于基因旁侧序列中,被称为顺式调控元件(cis-regulatory elements, CREs),一般包括启动子、增强子、调控序列和可诱导元件等【1】。致密结构核小体的存在影响了顺式调控元件的调节活动,大多数转录因子与靶标序列结合需要在极少核小体存在状态下的染色质上,这种状态下的染色质被称为开放染色质,其开放程度被称为染色质可及性【2】。绘制不同类型细胞的CREs和TFs分布图谱有利于深入理解细胞的功能,促进生物技术的进步和创新应用。尽管CREs和TFs的功能很重要,但是在植物细胞中的高通量研究存在多种限制,例如细胞壁的存在、特定类型细胞分离的操作要求高、缺少稳定遗传的细胞系、以及CREs调控范围距离较广等【3,4】。随着单细胞测序等技术的发展,给系统探究植物细胞中CREs和TFs的分布和功能带来了机遇。

5月7日,来自美国佐治亚大学等单位的研究人员在Cell杂志发表题为A cis-regulatory atlas in maize at single-cell resolution的研究论文。该研究首次结合ACAT-seq和单细胞测序技术,描述了玉米基因组中单细胞分辨率水平的顺式调控模式,这也是首次在植物细胞中绘制单细胞水平CREs和TFs的分布图谱。

打开网易新闻 查看更多图片

该研究首先利用荧光活化核分选技术和scATAC-seq技术对玉米的六种组织细胞(包括腋芽、雄蕊,雌蕊花序、育秧全苗、胚根尖、胚后冠根)进行单细胞染色质可及性基因图谱绘制,获得了31660个独特的Tn5转座酶作用位点,通过硅片排序,产生了165913个染色质可及性区域(ACRs),覆盖玉米基因组的4%。同时研究人员还开发了灵活性强物种局限性低的R软件包Socrates,随后利用UMAP将原子核间的相似性投影到降维空间,经过分析将10个类似大器官的簇划分为92个可重复的亚簇;研究人员为了注释不同簇与相应的细胞类型,以染色质可及性作为每个基础基因表达的指标,鉴定到群集中52种细胞类型,并成功从分析的器官中捕获到最期望的细胞类型;随后运用RNA原位杂交技术证实了所预测基因表达位点是可信的,通过特异性的基因本位学标记,显示染色质可及性与细胞类型存在相关性。

转录起始位点的染色质可及性是转录发生的先决条件,研究人员进一步评估了细胞核转录活动与染色质可及性的关系。数据显示,在单细胞水平染色质的可及性也是转录的前提条件,保守转录因子抑制复合物的基因沉默活动也需要可及的保守转录因子抑制元件。随后,研究人员评估了定义细胞身份的CRE,研究人员对具有不同细胞类型染色质可及性离散模式的ACRs进行了分类,发现ACRs区域与周围相比明显甲基化偏低,而且ACRs和长末端重复序列 (LTRs) 的共定位与细胞类型的高度特异性相关。研究人员通过量化ACRs中现存的遗传变异,探究了表型变异和细胞型特异性之间的关系,发现现代玉米育种导致了花特异性CREs的等位基因的选择,赋予了农艺上有利的花序结构。

为了建立不同细胞的转录因子(TF)信号图谱,研究人员构建了玉米基因组的TF基序,发现ACRs区域富含TF基序,TF模块的富集模式可以高度预测细胞的状态,进一步整合snRNA-seq和scATAC-seq的数据,在缺乏同源TF表达的细胞类型中寻找富集的TF模块,结果表明,CRE和TF在单个细胞核中存在较强相关性,同时揭示TF动力学影响了细胞的状态。研究人员为了探究不同细胞类型中细胞质构象的贡献,发现每个ACR的共可及性的综合强度与体内染色质相互作用频率相一致,且ACR的交互能力强烈地依赖细胞类型的环境,突出了远端增强子及其靶基因之间不同细胞类型特异性的调控配置,并表明高度交互的远端增强子是细胞身份识别的关键贡献者,研究结果显示具有CTCF类功能独立进化的TF家族能够通过DNA-蛋白相互作用组织染色质结构。

为了定义细胞命运进展的顺式调控目录,研究人员对18个连续发育体的细胞核进行了模拟时间轨迹排序,识别出ACRs、TF位点和TF基序在每个时间轨迹上都有显著变化,作者重点关注了根部韧皮部伴生细胞(PCC)的发育,成功鉴定到PCC发育过程中重要的差异可及性基因,同时发现在PCC发育的背景下,细胞周期和细胞命运的转变伴随着染色质可及性的整体下降。为了研究根发育中的顺式元件调控保守程度,对拟南芥和玉米进行比较分析,结果发现,玉米和拟南芥PCC发育的顺式调控模式具有高度的保守性,为研究进化保守的植物细胞、组织和器官发育所必需的核心转录因子提供了一个框架。

综上所述,该研究构建了单细胞分辨率的顺式调控元件目录,为其应用铺平了道路,增强了作物从头表型变异产生的认识,开发的物种不限软件Socrates可以通过scATAC-seq分析对不同植物细胞类型的顺式调节变异进行精细调查;研究中提供了可操作性强的软件和大量易于重复的数据,促进了生物技术创新的实现,进一步加深了我们对细胞特征和可塑性的理解。

参考文献

【1】Ravasi, T., Suzuki, H., Cannistraci, C.V., Katayama, S., Bajic, V.B., Tan, K., Akalin, A., Schmeier, S., Kanamori-Katayama, M., Bertin, N., et al. (2010). An atlas of combinatorial transcriptional regulation in mouse and man. Cell 140,744–752.

【2】Minnoye, L., Marinov, G.K., Krausgruber, T., Pan, L., Marand, A.P., Secchia, S., Greenleaf, W.J., Furlong, E.E.M., Zhao, K., Schmitz, R.J., et al. (2021). Chromatin accessibility profiling methods. Nat. Rev. Methods Primers 1, 10.

【3】Deal, R.B., and Henikoff, S. (2011). The INTACT method for cell type-specific gene expression and chromatin profiling in Arabidopsis thaliana. Nat. Protoc. 6, 56–68

【4】Phillips, J.E., and Corces, V.G. (2009). CTCF: master weaver of the genome. Cell 137, 1194–1211.

论文链接:

https://www.cell.com/cell/fulltext/S0092-8674(21)00493-1

相关工具链接:

http://epigenome.genetics.uga.edu/PlantEpigenome/index.html

https://github.com/plantformatics/maize_single_cell_cis_regulatory_atlas

https://github.com/plantformatics/Socrates