打开网易新闻 查看更多图片

编辑丨王多鱼

排版丨水成文

甘蔗(Saccharum spp.)是全球重要的糖料和能源作物,提供了全球约 80% 的食糖和 40% 的乙醇。现代甘蔗栽培品种具有极其复杂的基因组,这是由种间杂交、极端且不均等的多倍体、非整倍体以及大量重复序列所塑造的。这些特征模糊了单倍型和等位基因剂量,使遗传研究和育种工作变得复杂。单一线性参考基因组无法适应倍性、染色体数量或渗入背景方面的变异。

被认为是最具发展潜力的可再生能源作物之一。广西是我国最大的甘蔗主产区,甘蔗产业的可持续发展对保障国家食糖安全具有重要意义。

现代栽培甘蔗品种源于高糖的热带种甘蔗与高抗逆的野生甘蔗在百余年前的杂交回交,其基因组呈现倍性高、染色体数量多、结构变异频繁和重复序列高度富集等极端复杂特征。这使得传统单一线性参考基因组难以准确解析甘蔗的遗传结构和等位剂量信息,测序数据在分析过程中普遍存在比对困难和信息丢失。研究表明,传统“单一线性基因组”范式已难以满足甘蔗等复杂多倍体作物的研究需求,亟需建立新的基因组参考和分析体系。

2026 年 2 月 5 日,广西大学张积森教授团队联合福建农林大学唐海宝教授团队(黄育敏张以星张清为论文共同第一作者),在国际顶尖学术期刊 Science 上发表了题为:Multiscale pangenome graphs empower the genomic dissection of mixed-ploidy sugarcane species 的研究论文。

该研究首次提出并实现了多倍体感知的多尺度(基因组-基因-蛋白)图形泛基因组(graph pangenome)分析框架,实现了混合倍体(mixed-ploidy)甘蔗物种的基因组解析,为复杂多倍体作物的遗传解析与分子育种提供了关键技术突破,具有重要的科学意义和产业应用价值。

打开网易新闻 查看更多图片

图形基因组(Graph genome)为替代单倍型和多倍体状态提供了一种紧凑且坐标一致的表示形式,从而能够进行等位基因感知的比对、变异发现以及多倍体间的比较。

在这项最新研究中,研究团队着手构建一个适用于甘蔗的多倍体感知、多尺度图形框架,该框架整合了从基因组到基因或蛋白质水平的信息,并支持下游的多组学和群体分析,其设计明确旨在扩展到其他多倍体。

研究团队构建了一个来自 4 个甘蔗相关物种、涵盖多倍性水平(包括现代栽培种及其祖先种)的 9 个组装体的泛基因组,包含了 47-57 个单倍型以及约 7.4 万至 27.1 万个基因等位基因。该图谱捕获了约 82% 的甘蔗基因组多样性(而单一参考基因组仅捕获约 34%),并能在基因组-基因/蛋白质尺度上无缝运作。这种整合视角提供了具体的生物学见解。

进化比较:进化支水平的比较揭示了野生近缘种中核苷酸结合富亮氨酸重复序列受体(NLR,抗病等位基因的重要来源)显著富集和多样化。

多组学整合:泛基因组指导的多组学分析改善了比对效果,增强了可用信号,发现了更多高置信度的表观基因组特征。例如,在糖转运基因座(例如

SUT1
),图谱解析的可及性特征与蔗糖性状的转录调控相一致。

群体分析:直接在图谱上进行的群体分析弥补了缺失的多样性,减少了单一参考基因组的偏差,并实现了跨倍性比较,揭示了须芒草族内的趋同选择,并突出了受选择影响的碳水化合物和细胞壁模块。

功能验证:通过 CRISPR-Cas9 功能验证,证实了驯化基因

TB1
是甘蔗分蘖的调控因子。

新方法——DosageGWAS:为了定位高倍性背景下的性状,研究团队引入了 DosageGWAS,这种方法考虑不同同源/共线性位点的联合剂量,它对每个位点的连续等位基因剂量进行建模,并汇总跨同源/共线性区域的剂量,从而避免了难以处理的基因型枚举问题。DosageGWAS 提高了遗传力估计值,增强了关联分析的灵敏度和精确度,在

SaIRX10
SaBAK5
附近的糖分和叶角基因座处发现了剂量-表型梯度。

普适性验证:最后,研究团队证明,该图形框架可扩展至其他复杂多倍体泛基因组(例如棉花、小麦和马铃薯),在多样性捕获、同源基因解析以及潜在的性状定位能力方面均能取得类似的提升。

打开网易新闻 查看更多图片
甘蔗复杂多倍体图泛基因组策略提升育种关键基因挖掘

总结来说,这项研究构建了一个强大的、多尺度的甘蔗泛基因组图形框架,它不仅在解析甘蔗复杂基因组方面取得了突破性进展(例如揭示抗病基因分布、关联性状与剂量效应),还提供了可推广至其他多倍体作物的分析工具和方法,为复杂多倍体作物的遗传研究和育种改良奠定了重要基础。

论文链接

https://www.science.org/doi/10.1126/science.adx1616

打开网易新闻 查看更多图片