打开网易新闻 查看更多图片

责编 | 王一

植物基因组中,目标基因与相邻的保守基因以及特异性转位基因之间的排列规律,往往具备重要的生物学意义。这些规律不仅能够揭示基因之间的相互关系,还可能为我们提供有关基因调控、功能协同以及代谢产物合成等方面的潜在线索。例如,生物合成代谢基因簇(BGCs)通常由多个关键的骨架基因与相应的修饰基因组成,协同作用产生特定的生物活性物质。然而,目前缺乏一种系统有效的方法来全面挖掘基因组中相邻基因的形成过程和排列特征。

近日,西北农林科技大学马锋旺/赵涛课题组在New Phytologist在线发表题为Genomic investigation of plant secondary metabolism: insights from synteny network analysis of oxidosqualene cyclase flanking genes的研究论文,开发了一种用于系统分析基因组侧翼基因排列的新工具。

打开网易新闻 查看更多图片

该研究以染色体上位于目标基因两侧的基因(侧翼基因)为研究对象,开发了共线性近邻网络(Synteny Neighbourhoods Network,SNN)分析流程,并以植物三萜代谢关键基因—氧化鲨烯环化酶(OSC)为例,系统分析了OSC不同亚家族基因在122个代表性被子植物基因组中所伴随的独特的侧翼基因。

打开网易新闻 查看更多图片

图1 邻域共线性网络分析流程

研究发现不同谱系植物的OSC侧翼基因替换速率存在差异,相较于十字花科植物,蔷薇科植物OSC侧翼基因具有更低替换速率。通过将OSC邻域共线性网络与系统发育分析相结合,发现被子植物中OSC在新功能化的同时伴随着侧翼基因的改变。通过核心网络的筛选确定了多个与OSC存在保守位置关系的基因家族,其中包括被证明为三萜骨架修饰酶的CYP716家族,进一步的分析显示OSC与CYP716在染色体上邻接的现象发生在基部真双子叶植物的共同祖先中。通过将网络聚类信息转化为特征矩阵进行计算,实现了共线性区块特异性的量化,并发现已报到的BGCs普遍存在于高度特异的共线性区块中。通过对邻域共线性网络的信息进行整合,对葫芦科和十字花目中OSC相关BGCs的组装过程进行了追溯。本研究为植物OSC进化以及生物合成基因簇的组装提供了新的见解,并为比较基因组学的研究提供了新的工具。

打开网易新闻 查看更多图片

图2 共线性区块特异性的量化以及在BGC挖掘中的应用

西北农林在读博士生李昊宸为论文第一作者,马锋旺教授、赵涛教授和孙亚强副教授为论文共同通讯作者,西北农林李鹏民教授、瓦赫宁根大学Eric Schranz教授和中国农业科学院茶叶研究所戴伟东研究员也参与了该项研究。该研究得到了国家重点研发,国家自然科学基金和中央高校基本科研业务费的支持。同时该研究也得到了西北农林科技大学高性能计算平台的支持。

https://doi.org/10.1111/nph.20357
SNN分析流程:

https://github.com/hcli007/SNN_pipeline