责编 | 酶美

遗传因素在许多复杂疾病 (如二型糖尿病、多数肿瘤等) 的发生过程中起了重要的作用。与疾病发生相关的遗传变异可根据其效应大小及频率粗略分为四类 (如下图)。其中,高频强效应 (右上角) 的位点非常少见,低频弱效应 (左下角) 的位点研究意义不大。而低频强效应 (左上角) 以及高频弱效应 (右下区域) 的位点是遗传学、流行病学研究的重点。

打开网易新闻 查看更多图片

显然,相比高频弱效应位点,罕见的高致病性突变更具临床意义。根据目前主流的复杂表型genetic architecture的假设,基因组上的数以万计的SNP都会和疾病存在微弱的联系。对此,研究者们将重审对于单个高频弱效应SNP的研究意义。如何整合这些SNP的信息,探索它们在临床、公共卫生领域的意义成为了近些年的研究热点。Khera, A. V. 和同事们发现,通过将数十万个SNP进行信息整合,得到的多基因风险评分 (Polygenic Risk Score, PRS) 具有和低频强效应位点相似的效应大小。也就是说,经整合后的SNP信息将在临床研究、应用中起到重要的作用,其重要性不亚于已知的低频高致病性突变。

近日, Nature Communications发表了来自Vanderbilt University Medical Center (范德堡大学医学中心) Eric R. GamazonLea K. Davis教授的论文 Contextualizing genetic risk score for disease screening and rare variant discovery(第一作者 周丹)。在上述研究的基础上进一步提出了有趣的问题。低频强效应变异和高频弱效应变异 (以整合后的PRS形式) 在疾病的发生过程中扮演了什么样的角色?在病人中,这两类变异之间是否存在某种关系? 我们可否利用这种关系并应用到临床中?

首先,研究者们假设了疾病发生的模型,即liability-threshold model (LTM)。LTM假设当致病因素 (包括遗传、环境因素和随机效应等) 累计到一定程度就会发生疾病。通过仿真模拟计算,上述两类变异的burden在病人中会呈现负相关的关系 (如下图)。即在病人中存在类似“互相排斥” 的现象。研究者们把这类现象取名为“PB-LEV correlation”。然后,研究者们进一步通过大量的模拟计算,从多个维度 (包括不同的genetic architecture、疾病模型、变异的频率、遗传度、患病率、样本量等) 估计了发现PB-LEV correlation所需的条件。同时,该推论也在实际的数据中得到了验证。

打开网易新闻 查看更多图片

最后,研究者们利用最新的UK Biobank的全外显子组测序数据,试着将PB-LEV correlation的推论结合到临床研究和应用中。其基本的科学问题是,已知低频强效应的致病位点具有直接的临床意义,但其获取成本 (一般通过高通量测序) 远高于高频变异 (通过基因分型芯片),如果这两类变异的burden在病人中存在类似互斥的现象,那我们是否可以通过低成本的高频变异信息来优化选择高通量测序的优先顺序?文中给出的答案是肯定的。举例来说,在每1000个PRS很低的青光眼患者中,大约会有27个人存在MYOC (stop-gain mutation) 基因的罕见高致病性突变,而在每1000个PRS很高的青光眼患者中,仅有约6人携带这种突变。也就是说,通过高频变异信息,我们可以预测病人携带某个或者某些罕见高致病性突变的可能性。研究者们发现,模拟预测与实际观察到的结果高度一致 (下图红色菱形点为实际观测值) 。

该研究通过大规模的仿真计算,模拟探索了低频强效应和高频弱效应变异在病人中的相互关系,提出了PB-LEV correlation的推论,并在实际数据中得到了验证。该推论可通过低成本的高频变异信息推测病人携带罕见高致病性突变的可能性,可用于优化深度测序 (高成本) 的优先顺序,在临床上具有重要的意义。

第一作者Dan Zhou (周丹) 及通讯作者Eric R. Gamazon和Lea K. Davis教授均来自Vanderbilt University Medical Center (范德堡大学医学中心)。合作者来自包括Massachusetts General Hospital, Broad Institute, University of Denver, University of South Australia, University of Florida, University of Illinois at Chicago等院校。

原文链接:

https://www.nature.com/articles/s41467-021-24387-z