打开网易新闻 查看更多图片

今天被中国台湾这个节目刷屏了,两位主持人一唱一和,用通俗易懂的段子证明了新冠病毒的五个祖先齐聚美国。所以美国才是新冠病毒的发源地。

△图示:科学家画出了病毒的族谱(图片为论文截图)

打开网易新闻 查看更多图片

再往前找呢,原来是日本新闻的推测,美国流感死亡人员当中就有一部分死于新冠肺炎。

打开网易新闻 查看更多视频
新冠病毒起源自美国?鲁迅:我没说过。

甚至网上还谣传,美国自曝“首例冠状病毒源于美国”。

但实际上,稍微懂点英文的人就能发现这张图的端倪……

打开网易新闻 查看更多图片

加上钟院士也说:疫情首先出现在中国,不一定是发源在中国。让大家不免联想美国会不会真的是病毒起源地呢?

好吧,又是这种专业辟谣,还是要从专业入手,直接分析中国台湾上述节目中提到的这篇论文吧。累就一个字!

0

1

文章标题

Decoding evolution and transmissions of novel pneumonia coronavirus using the whole genomic data

翻译:通过全基因组群体分析方法揭示新冠病毒的演化和传播

说人话:挑一些新冠病毒全基因组(起始也就30000个碱基,人类是30亿对)测一下,看看这些新冠病毒是怎么传播和变异的。

文章链接:http://www.chinaxiv.org/abs/202002.00033#

0

2

2月21日上传到预印本论文网站http://www.chinaxiv.org。未经同行评议,未正式发表。

说人话:又是一篇没经过同行认可的文章,具体参考之前印度理工神文(相关辟谣:),严格意义上,这更像是专业度较高的新闻而不是论文

打开网易新闻 查看更多图片

△此前印度理工发表的神文

0

3

研究数据

从GISAID数据库下载的96个新冠病毒基因组。(其中,中国54个,美国13个,其它国家26个,3个因数据质量存疑被排除)

说人话:只有96个样本,中国湖北只有22个,广东的也有18个,美国的倒是把输入的都查了……这是典型的样本选择偏倚,也是造成后续错误理解的核心原因。

0

4

方法学

本文采用植物系统进化分析算法对新冠病毒的进化进行分析。分析结果的需谨慎解读,并且需要与其它证据相互印证。

专业版讨论(看不懂可以不看):

小伙伴LJH

计算方法上面对于RNA病毒而言,推断最古老毒株的方法比较粗糙,整体上这文章使用做植物叶绿体或者动物线粒体进化的方法来做RNA病毒进化,方法不够严谨。当然单倍型的分析是在ssRNA病毒上使用确实是能满足这方法前提假设要求的。问题就是最后提到拓扑结构的健壮性,是否足够用来推断溯源的结果。在进化分析里面,进化树都能画出来,但是bootsrap值是非常重要的指标,决定了进化树是否可信(稳定、稳健),RNA病毒一般使用beast等考虑了采样时间的进化分析工具进行进化分析时,一定会评估进化树的稳健性,然后才有基于树的后面的推断解读。

小伙伴LX

我个人觉得分析方法上可商榷,用一般用于DNA进化的单倍型分析来分析一个变化很快的单链RNA病毒,是否合理?因为还没有同行评议,所以我要是审稿人我肯定提这个问题。

小伙伴FXD

刚快速看了一下,整体上来说,方法学没有大的问题。尽管新冠是ssRNA病毒,这里的绝大多数分析都是基于单倍体型来进行的,只要测序材料是单一病毒株,理论上来说得到的就是单倍体型了。另就是统计模型和参数的适用性问题,包括Tajima's D之类的统计模型也有针对单链的模型,尽管文章方法学部分没有明确写出来,但推理应该会采用对应模型。这里影响最大的一个参数是μ,即单碱基年突变率,文章里引用之前文献,μ约等于1/1000,个人认为是比较合理的。至于后面的haplotype构树分析采用的方法相对也是比较成熟的,只是没有看到类似于Bootsrap值,即得到的的进化树拓扑结构的可信度和重现性,所以不太清楚这个拓扑结构的健壮性,而溯源部分主要是基于单倍体型来推断的。

说人话:用的分析算法差强人意,但没有给出最后演化树的置信度。也就是图画出来,但是对不对不知道。估计在进入同行评议的时候会要求提出置信度数据。这个数据呢,一般认为至少要高于70%,越高越可信。

0

5

主要发现

(1)96个新冠病毒基因组可以被分为58种单倍体型。这58种单倍体型按照相似度可以分类成A、B、C、D、E这5个类群。作者认为每一个类群繁衍自同一个新冠病毒祖先病毒株。(5个类群被标注上不同颜色,采集时间见下图)

(2)新冠病毒的传播路径。作者认为新冠病毒传播路径复杂,并不是所有输出病例都源自湖北。例如美国的一个病例可能从广东输出。法国的一个病例可能从重庆或者新加坡输出。

(3)文中提供的数据并不支持新冠病毒起源于美国的假说。

说人话:这部分看起来很复杂,其实核心点就是美国的这个病例,也就是中国台湾节目主持人段子的核心发力点:你看啊,只有美国有这个“五毒俱全”的案例,汇集了所有冠状病毒的祖先,中国都没有,所以美国是源头。

要反驳很容易,我们以子之矛,攻子之盾,只要看这个地方就明白了。

广东的病例有三种颜色,也就是三种新冠都有,而湖北却没有其中的黄色和绿色。难道广东的病例不是从湖北传播来的,而是从美国传播来的?很明显违背了常识。

那究竟原因是什么呢?很简单,数据量太小,且取样时间还不一样。因为湖北取样都是1月上旬为主,而广东的取样是1月下旬居多(都是返乡后湖北输入病例),这就形成了因为样本偏倚导致的错误推论。

写到这,可以总结下结论了:

1、这篇文章不能证明新冠病毒起源于美国,当然也不能否认一定不起源于美国。(听着像废话,但所谓严谨既是如此);

2、核心问题是数据量太小,尤其是湖北几万例样本只取了相对早期的22例,可能导致大量的后期病毒序列未被纳入,使结论出现了严重的样本偏倚

3、分析方法虽有争议,但仍可接受。但没有给出分析结果的置信度是硬伤;

4、尚未经过同行评议;

5、美国第一号病人,是华裔,1月左右在武汉,1月中旬回到美国后确诊,算病毒携带的潜伏期和以及中国呆的时间似乎无论如何也不能推出他就是传染源(武汉最早发病推测可能在11月);

6、最要命的是,通读这篇文章作者本身并没这么多想法和推测,还是被各方势力一顿忽悠,造成网友一顿恐慌。这个非常接近于对鲁迅作品每一段中心思想的分析。

要解决这些问题其实很简单,对大量的后期的湖北发病样本做全基因组测序,数据够了,结论自现,相信会有完全不同的结论反转。

昨天,《中国-世界卫生组织新型冠状病毒肺炎(COVID-19) 联合考察报告》发布,在附件4,现有知识局限特别指出了关于传染源的几个核心问题:病毒的动物来源和天然宿主,初始阶段的动物到人的感染过程,以及早期暴露史不详的病例。

是啊,原始病毒和零号病人现在都不清楚,但华南海鲜市场是放大器,这个事实是确定的。所以病毒的起源地虽然还不知道,但疫情的起源地为武汉是清晰的。病毒起源和疫情起源并不是一个定义,而这个时候搞清楚疫情起源地显然更重要。这一点非常像作物的起源与驯化,起源中心远没有驯化中心重要。此外,相信国内有大量的案例也不知道是如何感染的。但不知道不等于没发生,或许,有些问题我们永远没有答案

每个人都有偏见,或多或少。但如果变成公众观点,甚至阴谋论导向,这事情就可怕了。须知:带着结论找证据,会让我们离真相越来越远

比尔·盖茨于昨日给全球敲响警钟:新冠病毒百年一遇,应做充分准备。

而世界卫生组织在同一天宣布“把新冠肺炎全球风险级别从“高”提升到“非常高”。

新冠病毒起源自美国?鲁迅:我没说过。

新冠病毒接近全球大流行,覆巢之下,焉有完卵?在这个时刻,不需要谁对谁道歉,更不应该幸灾乐祸。生物学上人类只有一种,甚至连亚种都没有,我们是命运的共同体,帮助别人就是帮助自己

不愿看文字的,可以看尹哥和项飞的直播剪辑。

新冠病毒起源自美国?鲁迅:我没说过。

昨日收到赞赏920.99元,已全部捐给罕见病公益组织“光基金”,谢谢诸位看官。今天所有的赞赏金额会捐给致力于地中海贫血免费配型的“华基金”,咱们一起公益。

华基金

华基金是深圳市广电公益基金会旗下的专项基金,由深圳市广电公益基金会与深圳华大基因股份有限公司合作发起,用于救助重症地中海贫血、白血病患者,以及进行与罕见病诊断、预防相关的公益和科普活动。华基金的启动资金来自华大高管和股东的捐赠,华基金宣布,为全球的重症地贫血患儿永久免费进行HLA配型。

1.

2.

3.

4.

5.

6.

关注后,

点击菜单栏“文章”,阅读尹哥聊基因精选文章。

点击菜单栏“视频”,观看尹哥演讲视频和科普视频。

发送数字0,即可申请加入尹哥的粉丝圈“尹力场”。

发送数字8,即可通过关键词搜索往期文章。

【声明】生命科学与基因技术正在高速发展,针对同一研究课题,不同团队的研究结果存在差异甚至相悖的可能。另受本人知识结构及参阅资料准确性的局限,文章内容仅供参考。欢迎读者随时纠错并参与讨论。

点击下方“阅读原文”收听天方烨谈基因电台。