作为RNA病毒,新冠病毒在传播中被认为容易发生变异。科学家通过近两个月的追踪发现,截至目前,新冠病毒的S蛋白(刺突糖蛋白)中出现了13个正在积累的突变,其中一种突变病毒株正占据主导优势。S蛋白是新冠病毒进入人类细胞的“钥匙”,也是眼下大多数疫苗策略和以抗体为基础的治疗的靶标。
以上发现来自知名的美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)、杜克人类疫苗研究所和外科系、英国谢菲尔德大学等团队的研究人员于当地时间5月5日发表在预印本平台bioRxiv发上的一项研究:“Spike mutation pipeline reveals the emergence of a more transmissible form of SARS-CoV-2 ”。
研究的通讯作者、第一作者为洛斯阿拉莫斯国家实验室的计算生物学家Bette Korber,主要研究艾滋病病毒的分子生物学和种群遗传学,为获得有效的艾滋病毒疫苗作出了重大贡献,其中一种目前正在非洲进行人体试验。2004年,Korber曾获得欧内斯特·奥兰多·劳伦斯奖(Ernest Orlando Lawrence Award),该奖是是美国能源部颁发的对科学成果最高认可的奖项。

打开网易新闻 查看更多图片
研究团队开发了一种分析软件(analysis pipeline),用以实时跟踪SARS-CoV-2中的突变。他们认为,在更广泛的系统发育背景、地理位置和时间上考虑突变,可以提供一个“早期预警系统”,以揭示突变可能在传播或对干预措施产生抗性方面带来的选择性优势。
论文中写道,研究团队追踪到的其中一种突变病毒株S蛋白D614G突变的研究迫在眉睫,它于2月初开始在欧洲传播,当它出现在一个新的地区后,很快就会成为主要传播毒株。这种或始于欧洲的突变毒株或是全球疫情大流行的重要推手。此外,研究团队证实,毒株之间会发生重组,提示多重毒株感染。这些发现对SARS-CoV-2的传播、发病机制和免疫干预具有重要意义。
不过,也有观点表达了对上述结论的质疑,认为这项尚未经同行评议的研究需谨慎对待。质疑者提出,现在就判断任何一种毒株更具传染性都为时过早。一些人甚至提出,G614(研究后期)突变病毒株之所以传播得如此之深远和广泛,是因为它恰好感染了在大流行最初阶段没有采取措施的地区。或许研究者还需要做更多的工作来确定是否有任何毒株比其他毒株更具传染性,以及确定病毒的变异速度是否可能超过疫苗的研发速度。
“这里有很多猜测,他们没有经过实验验证。”休斯顿德克萨斯儿童医院疫苗开发中心的Peter Hotez博士表示。
哈佛大学陈曾熙公共卫生学院的Bill Hanage博士则认为,单点突变不太可能产生任何影响。Hanage写道,重要的是要记住,任何药物或疫苗都要经过测试,以对抗正在传播的任何一种病毒。“病毒能这么早地在所有这些疫苗上找到逃逸突变,那就太幸运了。”他还认为,由于几乎没有人对该病毒有任何自然免疫,因此几乎没有或根本没有导致逃逸突变的选择压力。
当然,Korber领衔的这支研究团队在论文中强调,鉴于S蛋白在病毒感染性和作为抗体靶标方面的重要性,迫切需要通过“早期预警”来评估S蛋白进化。这项研究的主要目的是识别突变的动态变化模式,此外,基于重组是冠状病毒进化的一个重要方面,研究团队也尝试确定重组是否在SARS-CoV-2疫情演变中发挥作用。
迫切需要通过“早期预警”来评估S蛋白进化
论文提到,尽管目前观察到的SARS-CoV-2序列多样性较低,但它的快速传播为病毒提供足够的机会来进行自然选择,从而产生较少但对其自身有利的突变。这和流感的情况类似,在整个流感季节内病毒都会在血球凝集素蛋白(HA)上缓慢积累突变。“SARS-CoV-2对我们来说是新的,我们还不知道它是否会随着天气变暖和湿度增加而季节性地减弱,但我们缺乏免疫力,以及它相对于流感具有更高的传播能力,这些可能是它不会减弱的原因。”
必须要考虑的一种糟糕情况是,如果疫情未能消退,在第一支疫苗出现之前的一年或更长的时间里,抗原漂移(antigenic drift)和人群中与免疫相关的突变积累会更加恶化疫情大流行。所谓的抗原漂移,指的是病毒通过改变自己的基因,让蛋白的序列和结构改变,从而使得原本有免疫力的人识别不了。
研究团队认为,这种担忧是合理的,现在关注这一风险可能能够抓住病毒的重要进化转变,“如果忽视这一转变,可能最终使得第一批疫苗在临床使用中的有效性打折。”
目前,全球针对SARS-CoV-2的疫苗大多靶向S蛋白,从而获得保护性的中和抗体。S蛋白介导病毒和宿主细胞结合并入侵,它由S1结构域和S2结构域两部分组成,分别介导受体结合和膜融合。而由于疫情持续时间还没有足够长到进行SARS-CoV疫苗的有效性试验,因此我们目前缺乏有助于指导SARS-CoV-2疫苗开发的关键信息。
在过去两个月的时间里, 洛斯阿拉莫斯国家实验室艾滋病毒数据库团队转向了新冠研究,他们将“全球共享流感数据倡议组织”(GISAID)数据库中SARS-CoV-2序列数据作为基准,开发了一项分析软件(analysis pipeline)实时跟踪SARS-CoV-2S蛋白的进化。该分析软件(www.cov.lanl.gov) 由洛斯阿拉莫斯国家实验室与杜克大学中和抗体评估小组合作开发。
值得注意的是,研究团队观察到,SARS-CoV-2序列之间的突变实际上还比较少,这限制了传统的基于序列的方法来检测正向选择的适用性。然而,他们提出可以采用另一种分析框架来确定正向选择,该框架基于GISAID数据库,GISAID提供了与地理信息和采样日期相联系的数千个序列的丰富数据库。这使得通过识别随时间变化的突变频率的变化来跟踪正向选择的早期迹象位点成为可能。在这项研究中,研究团队分析了GISAID数据库中4535个(截至4月13日)完整的S蛋白序列。
由于S蛋白突变仍然是较少的,研究团队设置了位点低阈值,被视作可进一步追踪的“兴趣位点”。因此,当在0.3%的序列中都发现了一种突变时,研究团队开始通过研究其进化轨迹和建模其结构影响来跟踪它,例如,它对抗体结合位点、三聚体稳定性和糖基化模式的潜在影响。

根据上述低阈值标准,研究团队总共追踪到13个位点,以及一个局部突变簇。论文详细讨论了一个特别值得关注的突变D614G,然后简要总结了其他追踪位点。他们最初开始注意到,“D614G的频率正在以惊人的速度增加,这表明与最初的毒株相比,它具有适应性优势,能够更快地传播。”
G614突变病毒株在全球成为主要流行毒株
突变D614G(武汉参考毒株23403位点的G-A碱基变化)是研究团队在3月初的第一次S蛋白突变报告中唯一追踪到的位点突变;在当时可用的183个序列中,它被发现了7次。
打开网易新闻 查看更多图片

这7个首批D614G突变病毒株中的4个在欧洲取样,另外在墨西哥、巴西和武汉各取样1个。其中5个毒株,D614G突变同时还伴有2种其他突变:nsp3基因3037位点的C-T突变,以及14409位点的C-T突变,导致RNA依赖RNA聚合酶(RdRp)氨基酸改变(RdRp P323L)。论文指出,这三种突变的组合形成了很快在欧洲出现的分支的基础。欧洲最早的D614G突变则出现于德国(EPI_ISL_406862),采样时间为1月28日,该病毒株同时在3037处有C-T突变,在14409处没有突变。
在研究团队3月中旬的第二份突变报告中,由于在GISAID出现的高频率,D614G继续被追踪,并被称为“G”分支。值得注意的是,全球29%的样本中都有这种病毒,但几乎只在欧洲发现。
3月中旬可供研究的数据显示,采样和报告之间大约有两周的滞后时间,这与欧洲可能出现的“始祖效应”相一致,整个欧洲大陆随后传播范围扩大,同时GISAID数据库中欧洲采样的数量也增加。
然而,来自4月初GISAID的数据显示,G614突变株的频率在整个3月以惊人的速度增长,而且清楚地看到其地理分布不断扩大。
他们观察到,几乎在每一个有足够采样的地方都观察到一种清晰一致的模式。即在大多数国家和州COVID-19流行开始的时候,也就是3月1日之前采样序列显示,D614突变株占主导地位。但G614一旦在一个地方出现后,其在人群中就会快速快播,大多数情况下它在几周之内就会成为该地区的主导病毒株。
在G614最初开始大面积扩散的欧洲,D614和G614在疫情早期共同传播,不过除了意大利和瑞士,在大多数采样国家中D614更为常见。在整个3月,G614在欧洲变得越来越常见,并在4月形成主导地位。
在北美,最初的感染主要为D614形式,但在3月初,加拿大和美国均出现了G614,并在3月底前成为这两个国家的主要病毒形式。华盛顿州是美国在GISAID数据库中可用SARS-CoV-2序列最多的州,它例证了上述模式,随着时间的推移,其他许多州也明显出现了类似的变化。纽约采样方面比较匮乏,直到3月开始有序列上传,并且G614已经是主要形式。彼时,G614的形式在美国的其他地方也变得突出。
针对欧洲和北美的情况,研究团队认为,目前尚不清楚地方大流行是否是由欧洲接触者“播下种子”,还是由已获得高流行的美国接触者“播下种子”,或者是这两种路径的结合。
澳大利亚也和美国、加拿大一样,从D614主导向G614主导过渡。
冰岛则是唯一的例外,冰岛进行了广泛的检测,疫情流行似乎开始于G614形式,但有一个短暂的D614增加,但随后持续处于恒定的低水平。
打开网易新闻 查看更多图片

亚洲样本完全由武汉最初检测到的D614形式占据主导,但到了3月中旬,G614在中国以外的亚洲国家形式显然建立和扩散了。另外,需要注意的是,由于3月1日之后,随着疫情在中国的逐渐平息,很少有来自中国的序列上传到GISAID,中国的D614G突变状况尚不清楚。
此外,南美洲和非洲的样本仍然很少。
综上所述,研究团队认为,数据显示G614具有选择性优势,在各区域大流行中均出现在几周内发生D614主导向G614主导的转变反映了这一点。
研究团队还提到,G614分支病毒在中国的早期样本中也发现了4次。2月7日采样的一个来自武汉的序列(EPI_ISL_412982)有D614G突变,但没有同时出现其他两种突变,他们推测这一单一的D614G突变可能是独立出现的。
其余三例则可能与德国序列有关。在1月24日采样的一个序列来自浙江(EPI_ISL_422425),它具有与在欧洲扩散的G分支相关的所有三个突变。另外两个样本均来自上海,分别于1月28日和2月6日采样(EPI_ISL_416327, EPI_ISL_416334),和德国的序列一样,它们在14409处没有出现突变。
研究团队认为,考虑到这些早期的来自中国的序列在整个基因组中与德国的序列也高度相关,目前全球大流行的G614可能起源于中国,但也有可能起源于欧洲,因为它在1月底在这两个区域均出现。
另外目前没有来自上海或浙江的近期GISAID序列,所以研究不清楚G614在上海是否有选择优势,但1月和2月初的时候D614在上海流行。
携带G614突变患者具有较高病毒载量,但并没有显著加重病情
D614G适应性增强背后的潜在机制是什么?研究团队提出,有两个不同的概念框架可以解释为什么D614G突变与增加的传播有关。


第一个是基于结构。D614位于S蛋白原聚体的表面,可以与相邻的原聚体接触。冷冻电镜结构表明,D614的侧链可能与相邻原聚体的T859形成氢键。这种原聚体-原聚体氢键可能是至关重要的,它可以将一个原聚体的S1结构域的残基和另一个原聚体的S2结构域结合。而D614G突变减少了S1和S2之间的相互作用,促进了S1和S2分离。这种突变也可能会影响RBD-ACE2的结合。然而,研究团队强调,需要更详细的试验和建模研究来阐明这种突变对RBD转变的影响。
D614G突变可能影响传播的第二种方式是免疫。D614嵌入在原始SARS-CoV S蛋白的免疫显性线性表位中。该肽具有很高的血清学反应活性(64%),并且在2002年SARS-CoV流行期间感染个体的恢复期血清中诱导了长期的b细胞记忆反应。无论是在体外还是在体内,针对这种肽的抗体都通过一个表位序列依赖机制介导了SARS-CoV感染的抗体依赖增强(ADE)。所谓的ADE,即指病毒在相应抗体协助下复制或感染能力显著增强的现象。有研究推测,抗体结合可能介导了S蛋白的构象变化,从而增加了RBD-ACE2的相互作用,产生增强效应。
因此,基于现有的信息,研究团队认为,D614G突变可能通过多种方式影响S的感染性:它可能提高受体结合、融合激活或ADE抗体诱导。另一种机制则可能仅仅通过抗原漂移介导抗体逃逸。
值得注意的是,改变后的S蛋白对早期中和抗体的敏感性可能也降低了,这可能使易感人群受到第二次感染。
研究团队还考虑了另一个问题,如果D614G突变可以增加传播能力,是否也可能影响疾病的严重程度?由于临床结果数据在GISAID中无法获得,研究团队将重点放在一个单一的地理区域,即英格兰的谢菲尔德。谢菲尔德遵循了世界上大部分地区观察到的模式,起初为D614开始,到3月底主要转向G614。他们研究了来自谢菲尔德的453名COVID-19患者。

结果显示,与D614相比,携带G614突变的患者具有较高的病毒载量。但是这并不一定意味着疾病危险的增加,他们提到,虽然G614突变在ICU患者中略有富集,但这在统计学上并不显著。