[返回生活百态首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
科普+辟谣:Nextstrain的进化树到底表达了什么?
送交者: 千形金砂[☆★独醉梦一场★☆] 于 2020-03-28 17:07 已读 2373 次 5 赞  

千形金砂的个人频道

(注:首发在网际谈兵版)

本来想早点发,但我也是有工作有生活的人,所以帖子发的晚了,抱歉。另外此贴也比较长,有很多图,一半科普,一半辟谣,顺带打脸王某某。既然一半是科普,我就不在正贴里怼了。欢迎回帖怼,但也请拿出干货。 6park.com

最近看见几次某些人贴的那张进化树。转发图的人很多也会说“此图证明COVID-19病毒是武汉来的”。

6park.com

起初我问了图是哪里来的,然而没有收到回应,于是我用谷歌反向搜索此图,也并没有发现任何专业的网站发或转发此图(只有三页搜索结果,所有结果都是四个社交平台来的,包括留园。留园的可信度相信大家也清楚,这个我不多说了),于是我就猜这个图是假的。但是后来经过仔细搜索,发现猜错了。确实是真的,是从一个名叫Nextstrain的专家建立的网站来的,用于汇总一些已知的数据。

既然我的工作与生物科研有关,本着科学的态度,我承认先前确实说错了一半,这图是真的。可能样子不完全相同,但鉴于Nextstrain一直在更新,又不断地有新数据新样本出现,这图又明显不是最近几天才生成的,所以不完全一样也可以理解。

但是,虽然图是真的,Nextstrain却并没有证明COVID-19是武汉来的,甚至没有说过病毒是哪来的。病毒来源目前还是未知。

有些人,比如王某某,看到这就会说“哈!所以你这个五毛狗/共狗/共匪/小粉红/宣传员/战狼/奴才认为病毒是美国来的”。这是个可笑的看法。未知,不是说是某某国或某某地方来的,仅仅是我们现在还不知道。既然提及科学,那我们要尊重现有的事实,所以稍安毋躁,我们慢慢来。

其实几张Nextstrain网站的截图就可以说明问题。以下我会给出链接供大家细读,在截图里划出重点。

比如就在进化树之下的一段声明。这一段,只要你懂英文,就应该明白写的是什么意思:

6park.com

这是Nextstrain给的中文翻译:

再比如建立Nextstrain的专家给的声明,分析,和结论:https://nextstrain.org/narratives/ncov/2020-03-27(此报告是3月27日发出的,目前是最新的,但由于网站有点问题,暂时看不到。以下的截图来自3月20日的报告:https://nextstrain.org/narratives/ncov/sit-rep/zh/2020-03-20)。

再比如Nextstrain的“帮助”页(此页貌似无中文版):https://nextstrain.org/help/coronavirus/SARS-CoV-2

再比如Nextstrain的“如何读懂进化树”:https://nextstrain.org/narratives/trees-background

基于网站上的信息,总结一下重要的几点:

Nextstrain的功能目前只限于假设病毒的传播轨迹,给出扩散范围与各地区的疫情严重性的参考。

Nextstrain的用途基本有三:用于制定应对疫情的措施,用于分析未来疫情发展,用于向大众报告。

Nextstrain生成的所有图表的精确度局限于已提交的样本。

Nextstrain用的样本来源里,有一些地区提交的样本数量在总量里占比偏大。

COVID-19病毒的来源目前未确定。

看完了网站创始专家们对Nextstrain的介绍,再挨个说一下这几点意味着什么:

Nextstrain目前还不能推测病毒来源。

Nextstrain的取样目前有缺陷,只是冰山一小角(全球总共652079病例,Nextstrain却只有2084个病例的数据,是总病例数的0.32%,占比非常小)。

取样的缺陷导致结论也只能供参考(俗语:“看看就好”),不能作为确凿“证据”看待。

对于研究人员,Nextstrain的意义在于汇总当下已有的数据,并给出一些建议性的分析。

对于大众,Nextstrain的意义在于提供当下的科学界意见,让大家能了解当下情况。

但是对大众公开不代表大众就都能看明白网站内容,比如那个进化树图。所以我们有必要解释一下进化树图到底怎么看。

(大家如果还记得高中生物内容,可以直接去看Nextstrain的“如何读进化树图”那页,跳过本帖下面一段:https://nextstrain.org/help/general/how-to-read-a-tree和https://nextstrain.org/narratives/trees-background)

=================================================================

既然进化树图与进化论有密切关联,我们就从这开始。

进化论是描述生物物种为了生存在变化的环境里而表现出的演化。这样的例子随处可见,比如近些年来出现的一些致病抗药菌(俗称“超级细菌”),如MRSA(Methicillin-resistant Staphylococcus aureus/多重抗药金黄色葡萄球菌)。这些抗药菌就是因为人类社会中越来越多地使用抗生素,导致(人为地)筛选出能抗药的细菌存活下来。

可为什么这些菌变得能抗药呢?换句话说,演化到底是怎么实现的?

是由基因变异一点点实现的。

很多人都知道,基因(DNA)是双链的,有一个个含氮碱基组成的碱基对。DNA的含氮碱基有四个:A(Adenine/腺嘌呤),G(Guanine/鸟嘌呤),C(Cytosine/胞嘧啶),和T(Thymine/胸腺嘧啶)。如果是RNA,就会把T换成U(Uracil/尿嘧啶)。其中,A与T或U配对(这要看是DNA还是双链RNA),C与G配对。

但是徒有基因还没什么用处。真正应用起来,必须要把基因携带的信息想办法变成蛋白质。(RNA确实也可以有功能,如rRNA,但鉴于这是基础科普,又与本贴要说的没有太大关系,就不讲太多了)

这个过程就是生物学的“中心法则”(central dogma of molecular biology)。中心法则大致是这样的:DNA 转录(transcription)成 RNA,RNA再转译(translation)到 蛋白质。其中因为细胞需要分裂(繁殖),DNA需要复制。RNA也同样可以复制,并且可以逆转录(reverse-transcription)回到DNA。也就是说,DNA和RNA的信息内容可以是一样的。

中心法则变成图就是这样:

6park.com

所以,想要表现出实质的稳定的蛋白质的变化,就需要改变基因或RNA(取决于某物种用哪一个做基本“蓝图”)。由于组成蛋白质的氨基酸有21个,远大于含氮碱基的数量(DNA有4个,RNA有4个),因此基本上每三个含氮碱基为一个密码子(codon),不同的含氮碱基组合决定某蛋白质某位置是哪个氨基酸(Amino acid,AA)。

6park.com

通常来说,对于基本“蓝图”是DNA的生物来说,在每一次复制DNA的时候,都有可能会出现复制错误,这些复制错误如果不被修复,就会影响到根据DNA做出的蛋白质,这就是基因变异。如果蛋白质的关键部位受到影响,就会有三种结果:功能不受影响,功能受到不好影响乃至功能完全消失,或功能提高甚至增加新功能。在自然环境中,如果环境不变,第一种结果意味着生物还和以前一样,而第二或第三种结果都会影响到个体的生存能力。如果生存不下去,就会被淘汰。但如果中奖了,变异提高了生存能力并传给了下一代,那么这就算是演化了一点点。通过分析每个物种的全基因组,并找到这些突变的地方,就可以了解一个物种是如何演化而来,以及一个物种与其他物种在基因上的关系。

COVID-19病毒显然不太一样,因为是单链RNA病毒,但它也会遵循这个基本规律,并且变异速度会比多细胞生物更快。在全球许多实验室收到并分析病例病毒样本的cDNA基因组(cDNA是由原本的RNA逆转录得来的,因此信息是相同的)之中的不同之处。以出现较早(但不是最早)有样本的病例为标准(Wuhan-Hu-1/2019; "no nucleotide mutations";“标准”不等于“起源”),分析出其他病例中病毒的基因组都有哪些变异。

6park.com

=================================================================

现在再讲进化树图。

其实进化树图并不是放射形的,而是..........树形的。以下是一张艺术化的早期进化树图,由生物学家恩斯特·海克尔(Ernst Haeckel)于1866年绘制(图中内容已经过时,看看样子就好):

6park.com

那么横过来就是这样的:

“根”代表起始,从根开始,随着时间的推移,出现了“变异a”和“变异b”,于是就分出两个枝条,分别指向已知的A和B。

但是如果不知道“根”,怎么办呢?最好的办法就是改成无根进化树,也就是包含假设和推断最少的最基本的进化树。下图中并没有根,但是如果在“A”和“B”之间的线上取一个点假定为“根”,就可以画出之前的图:

以上的两种图实际上都是同样的数据,只是有根树图包含一些推断(如时间,如“根”)。第三种体现方式,也就是放射形进化树图,看着很高大上,但和有根树图是一模一样,只不过以“根”为中心点:

Nextstrain有以上3种进化树图的体现方式,分别在侧面的“Tree Options”之下的“Rectangular”(普通树形),“Unrooted”(无根树形),和“Radial”(放射形)。实际表达的都是同样的数据同样的分析。

由于无根进化树(Unrooted)是最基本的,推断假设最少的体现方式,我们就先看这个。从这个进化树图可以发现,没有一个病例(点)在中心点。这就说明网站上显示的所有病例里没有一个是“0号病人”,而且都是后来才有的。

再来看有根进化树(Rectangular)。实际有根树图就是把无根进化树那个中心点“根”变成最下面的枝。真正的“根”,也就是干,在哪里我们并不知道,因为那个时候的样本数量严重不足。

最后再看放射形进化树。放射形进化树中心的那个“根”,其实是先前的有根进化树上最下面的那个枝从一条线缩成一个点。

所以,Nextstrain的进化树没有一个说明COVID-19是从哪里来的。

有些人会问:可为什么离假设“根”最近的都是武汉的病例呢?这不就说明是病毒是武汉来的吗?

其实原因只是因为最早公布给科学界的病毒基因组是武汉的病例。现在已经有有专家怀疑其他国家其他地区在比武汉病例出现更早的时间就已经出现病例,只是苦于没有样本没有测序,所以在Nextstrain没有显示。就这么简单。

在没有更多数据出现之前,如果有人拿着Nextstrain的进化树图说“病毒是武汉来的”,此人要么是没看懂Nextstrain的进化树,要么就是造谣传谣。

谣言止于智者。在这样谣言满天飞的时候,请诸位(包括我在内)尽量做智者。

评分完成:已经给 千形金砂 加上 500 银元!

6park.com

贴主:千形金砂于2020_03_28 17:17:56编辑
贴主:千形金砂于2020_03_28 18:55:04编辑
楼主设置:谢绝布衣用户参与回复交流
喜欢千形金砂朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ 千形金砂的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回生活百态首页]
千形金砂 已标注本帖为原创内容,若需转载授权请联系网友本人。如果内容违规或侵权,请告知我们。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名:密码:[--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助

手机扫描进入,浏览分享更畅快!

楼主本栏目热帖推荐:

>>>>查看更多楼主社区动态...






[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]