本文节选自《基因彩票》,上一章链接:
《基因彩票:运气、平等与补偿性公正》,作者是凯瑟琳·佩奇·哈登,行为基因学家、临床心理学教授,曾发表100多篇关于遗传对复杂人类行为影响的科学论文。《基因彩票:运气、平等与补偿性公正》提出一个有趣的概念:除却家庭与社会环境的“卵巢彩票”之外,一个人还要经历遗传因素随机匹配机制的“基因彩票”抽奖。作者认为承认“基因彩票”的作用,才能更好地追寻一个在技术和生理上较为平等的社会。
近期我将会在网易号平台将这本书的各个章节分享给大家,感兴趣的网友可以去买一本实体书。
第四章 血统与种族
在我给本科生开设的“心理学入门”课程当中,有一堂课是关于记忆的,我要求学生们记住一串单词,其中包括像“梦”“床”和“休息”这样的词。然后我要求他们写下他们记得的单词。无一例外,他们(错误地)记得听到了“睡眠”这个词,但我并未说过“睡眠”这个词。“睡眠”的概念之所以在大脑中被激活,是因为同一语义网络中的其他词语,即与睡眠相关的词语,通过一再重复也被激活了。“睡眠”这个词因此被检索出来,仿佛他们真的听到了这个词,尽管我并未提起它。
当人们听到“床”时,他们会自动听到“睡眠”。当人们听到“基因”或“智力”时(特别是在美国),他们会自动听到“种族”。因此,刚接触这个话题的读者可能会惊讶地发现,没有任何证据表明基因可以解释不同种族群体之间在教育等结果方面的差异。目前,关于各个种族在现代工业化经济体中跟社会不平等相关的复杂人类特征(如持久性、自觉性、创造性和抽象推理等)方面存在遗传差异的故事,都只是故事而已。
不过,在一本关于遗传学的书中很有必要讨论一下种族和种族主义。从遗传科学发展的早期开始,遗传学研究就被纳入种族主义的观念中,从而为种族主义的行动辩护。种族主义者对遗传学的侵吞和滥用一直持续到21世纪。如果我们避免提及种族,就会留下一个真空,而这个真空会被错误填满,会被解释为对科学种族主义的默许。同时,关于遗传学与阶级结构和资源再分配之关系的讨论,已经被几十年间形成且植根的种族“科学”所毒害,所以用心良好的人们常常觉得,他们必须直截了当地拒绝接受关于遗传学如何影响社会和经济结果的论点及信息,以维护他们的反种族主义立场。因此,关键是要把“遗传对个人的社会经济成就有影响”这样一个经验现实,与关于人类群体间差异的种族主义言论加以分别。
在本章中,我会澄清为什么今天的科学种族主义的遗传学理念在经验上是错误的,在道德上是盲目的。我将首先解释遗传学家所说的血统 (ancestry)的具体定义,以及将血统的概念与种族相联系为什么是错误的。然后我将描述,遗传学研究是如何由以白人为主的科学家使用以白人为主的样本完成的,这种情况为种族群体之间的错误比较创造了条件,并有可能加剧种族群体之间的不平等。我还将解释为什么这种想法是错误的——对人群中个体差异的遗传原因的研究,能让我们了解群体间差异的深层源头。这种统计上的谬误通常受到白人至上的种族主义思想的支持。最后,我将展望即将投入研究的海量的多民族基因组数据,并解释为何我们无需担心任何统计结果会危害我们的立场——反种族主义和追求种族平等。
我们都是世界上每个人的后代
我的祖父母是五旬节派基督徒,他们背诵了基督教《圣经》的大部分内容,并鼓励他们的儿孙也这样做。我一直觉得《圣经》中最难背诵的部分是族谱:约兰生乌西亚,约西亚生耶哥尼雅。我小的时候经常想问,这些长长的人名清单的意义何在?
我现在发觉,《圣经》族谱的作者和使用Ancestry或FamilyTree或MyHeritage等服务的21世纪客户,受到了同一种冲动的驱使。这些服务将基因测试与档案记录相结合,构建人们的族谱。也就是这种冲动,促使摩门教会记录死者姓名,并将其储存在犹他州一个可以抵御核弹攻击的储存库内。知道谁生了谁,就可以掌握身份信息,并将身份合法化。族谱可以促进团结和归属感:“我们是一家人。”
当你想到家庭时,你会想到谁?我想到的是我的孩子和他们的父亲、我的兄弟和母亲、父亲和继母、同父异母的兄弟和继姐妹、我兄弟的妻子和他们将来可能有的孩子、我父亲的三个兄弟姐妹和我在他那边的四个堂兄弟姐妹及其子女、我母亲的三个兄弟姐妹和我在她那边的四个表兄弟姐妹及其子女。我与这些人的情感纽带和遗传关系各不相同,从强有力到不存在。但他们都是我的家人。
随着我们把时间往前追溯,我们的家庭成员名单很快就会变得庞大,因为我们的祖先人数每一代都会增加一倍,如两个父母、四个祖父母、八个曾祖父母,等等。往前追溯三十三代,或大约1000年,得出233=85.89934592亿。
那时地球上甚至没有80亿人同时活着,但有些人是我们多重的祖先。例如,我的叔叔肖恩和婶婶克里斯汀属于“亲上加亲”,因为他们有两个祖辈是兄弟。因此,我的堂兄斯特林并没有24=16个高祖父母,而只有14个,其中一对高祖父母在他的族谱中出现了两次。就这样,我们的血统、我们的族谱树形图中的树冠,开始坍塌了。
人类有时会近亲繁殖,这只是使人类交配变得复杂的众多过程之一。人类在历史上或多或少是保持原地不动的,在离他们父母生儿育女的地方不远的地方求偶生子。在整个人类历史上,迁徙,尤其是长距离的迁徙很少。即使在今天,有了喷气式飞机和州际公路,典型的美国人生活的地方离他/她母亲的住处只有29公里远。人们通常在地理上临近的邻居当中,与拥有相同语言、文化且处于相同社会阶层的人交配。
因为性很复杂,所以需要运用一点复杂的数学手段来估计当前所有人类最近的共同祖先(即出现在今天活着的每个人的族谱上的人)生活在多久以前。答案是,并没有那么久远:在过去几千年内。一个保守的估计是公元前1500年左右,那时赫梯人正在学习如何锻造铁制武器。但也可能晚至公元50年左右,也就是尼禄在罗马燃起大火时弹琴的时候。再往前追溯,在公元前5000年到前2000年之间的某个时候,苏美尔人正在发明一种字母,埃及的第一个王朝正在建立。你会发现一个更显著的问题:当时活着的每个人如果留下后代,那么他们都是今天活着的每个人的共同祖先。而如果我们把自己的族谱追溯到足够古早的时代,我们的族谱会变成同一部族谱。
这看上去似乎不可能,因为我们的大多数近期祖先都生活和死亡在同一个地方,与地球上其他大部分地区都相隔万水千山。为了理解这一发现,我们需要了解,当我们在谈论你一千年前的祖先的数量时,我们在谈论多少人。即使是罕见的事件,如长途迁徙,或语言、文化和阶级不同的人们之间的交配,也必然会在每部族谱中偶尔发生。
而这些罕见的事件,将你与全球其他地区联系在一起。归根结底,你的家庭就是我的家庭,我的家庭就是你的家庭。正如群体遗传学家格雷厄姆·库普总结的,“你的族谱是巨大而极其混乱的;没有人纯粹是单一人群的后代”。我们都是人类共同家庭的一部分。“我们都是世界上每个人的后代。
族谱祖先与遗传祖先
让我们把事情再复杂化一点。我刚才描述的是你的族谱祖先。但你的族谱祖先不一定是你的遗传祖先,特别是当我们追溯到很多代以前时。撇去性染色体(X或Y)不谈,你从你父亲那里继承了22条染色体。在制造后来成为你的精子细胞时,你父亲从他的母亲和父亲那里得到的染色体交换了大块的遗传物质,以产生一个新的DNA序列,也就是独一无二的你。平均而言,每当一个基因组被传递给下一代时,就会发生33次这样的重组事件。因此,你继承的22条染色体可以分解成22+33=55个不同的块,每一块都可以追溯到你的祖父母中的一个。
当然,同样的过程也发生在再上一代,所以你也可以把你继承的染色体分解成22+33×2=88块,每一块都可以追溯到你四个父系曾祖之一。在你家族历史的早期,块的数量(88)远远大于族谱上的祖先数量 (4),所以你几乎肯定从这些人那里继承了DNA。
但数字很快就开始快速转变了。追溯到42代之前,就像从耶稣追溯到亚伯拉罕,意味着你的DNA可以分解成2×(22+33×41)=2750块,每块可以追溯到241≥2万亿个祖先中的一个。很明显,你没有2万亿个祖先,因为你的一些祖先(由于近亲结婚)在族谱中可以出现好几次。但是你仍然有很多祖先,比你的DNA块要多。因此,来自九代之前的任何一个特定族谱祖先的DNA仍然潜伏在你的基因组中的可能性非常小。
我们没有从绝大多数遥远的族谱祖先那里继承任何DNA,这一事实可以帮助我们理解下面两个事实,否则这两个事实可能看起来很矛盾。首先,追溯到几千年前,每个人的族谱都是相同的,无论他们生活在世界的哪一地区;我们都是世界上每一个人的后代。其次,生活在世界不同地区的人在基因上是不同的,这些遗传差异可能非常古老,比几千年还要古老许多。
你的一位族谱祖先可能是占领军,他对你的另一位族谱祖先的强奸,将你的族谱与现在生活在地球另一端的人的族谱联系起来。但有可能的是,那个强奸犯的DNA没有一个仍然潜伏在你的基因组中(同样,Y染色体在这里是一个例外)。这是因为我们任何一个上古的族谱祖先同时也是遗传祖先的概率很小。族谱祖先经常从你的DNA中消失,而你与远方民族的遗传联系也随之消失。
你只继承了你的大量族谱祖先当中一小部分人的DNA。而你的大多数祖先都是在地理上相互接近的情况下生活、繁殖和死亡的。大多数的交配机会不仅受限于地理亲近性,还受限于关于谁可以与谁发生性关系的复杂文化规则。这一过程的净结果是,人类的遗传变异存在着结构 (structure)。也就是说,任何一个人的基因构成跟其他任何人的基因构成的相似性和差异性,都有一定的模式。这些模式——这种结构——反映了地理和文化的影响。
血统与种族
人类之间遗传相似性和差异性的最重要模式,反映了最显著的地理障碍和边界,如海洋、沙漠和大陆分水岭。与遗传祖先居住在欧洲的人相比,遗传祖先居住在东亚的人彼此之间的遗传相似性更高。因此,遗传相似性和差异性的统计学模式可以通过这样的手段来总结:根据人们的遗传相似性对其分组,然后给这些分组贴上大陆地理的标签(非洲、亚洲与欧洲)。这种操作是很合理的。“非洲血统”这个短语作为一种科学的速记方法,被用来描述一群在遗传上相似的人,因为他们有许多共同的遗传祖先,而这些遗传祖先生活在非洲大陆。
但是,随着科学家学会了更好地分析人类种群的遗传相似性和差异性模式,并开始为具有共同遗传祖先的人群贴上地理标签,其他人开始发出警告。遗传学家是否在重新创造种族,将其视为生物现实,而不是社会建构?这种可能性令人震惊,因为种族的生物学概念长期以来一直被用来为压迫辩护。多萝西·罗伯茨在《致命的发明:科学、政治和大企业如何在21世纪重新创造种族》一书中指出,“使种族成为一个生物学概念”一直“具有重要的意识形态功能”。“在一个声称平等乃其最珍视的理想的社会中,将种族视为生物学概念,构成了对奴隶制唯一合适的‘道德辩护’。”罗伯茨和她的三位同行认为,种族的生物学概念“在其最好的情况下也仍然值得商榷,在其较坏的情况下则是有害的”。他们继续呼吁科学家使用“血统”(ancestry)和“种群”(population)等术语,而不是“种族”。
血统和种族之间的这种区别有时被认为是一种诡辩,它使科学家能够在谈论种族之间的生物差异时避免使用“种族”一词。例如,在一次播客采访中,《钟形曲线》的作者查尔斯·默里说:“现在遗传学家喜欢用‘种群’这个词来代替‘种族’,我不怪他们。”像这样的评论把种族和遗传血统混为一谈,使“种族不平等的结果肯定是由于先天的生物学差异”的思想得以延续。因此,关键是要理解,为什么把种族和遗传血统混为一谈是错误的。
在1995年的电影《独领风骚》中,主角雪儿·霍洛维茨把她的一个竞争对手称为“彻头彻尾的莫奈”:“这就像一幅画,看到了吗?远看还行,近看就是一塌糊涂。”对人类种群的遗传结构的分析,就是这样一幅彻头彻尾的莫奈画作。镜头拉远之后,图案(pattern)看起来足够清晰,超群(super-population)与地球上的主要大洲相对应。
将镜头拉近,你仍然可以看到模式,但它们模糊了起来。一项关于欧洲的“基因反映地理”的研究确实发现,祖辈都居住在现今的法国的人,比祖辈都居住在现今的瑞典的人在基因上更相似。但是一些意大利人在基因上与其他意大利人差距较大,而与祖辈都是瑞士人的人重合。样本中没有犹太人,也没有祖辈不都来自同一地点的人。
把镜头拉近到一个人,我们从远处看到的清晰图景就会烟消云散。凡是有边界的地方,就有其历史跨越这些边界的人。特别是当人们的家族史受到了殖民主义、奴役、占领、移民或战争的塑造,是由“以前分离的民族被迫聚集在一起”这种现象塑造的时候,我们就很难将他们归类为从远处看来很分明的类别。
不过,正如我们可能将莫奈画作的一部分称为“天空”一样,我们可以将人类的一部分称为“欧洲血统”的人。或者更狭义地说,“北欧血统”。甚至更狭义的话,可以说“英国白人血统”。
如果人类的遗传祖先图是“彻头彻尾的莫奈画作”,那么我们的种族区分更像是蒙德里安的画作:由清晰的边界分开的对比强烈的原色。种族类别是不连续的、相互排斥的:美国人口普查始于1790年,直到2000年才允许人们选择一个以上的种族来定义。而这些类别本质上是有等级的,因为种族分类的过程是为了限制谁能获得权力、财富和物理空间。奥黛丽·斯梅德利和布莱恩·斯梅德利在总结人类学和历史学对于种族的观点时写道:“种族将人及其社会地位、社会行为、社会等级本质化(essentialize)和刻板印象化。”
不过我要明确一点,我并不是说种族和血统是完全独立的。不同的种族群体在遗传血统上当然不同,而这种对应关系是由种族分类的社会史和法律史塑造的。例如,在美国,强制实行种族隔离的法律(例如, “仅限白人”的学校、饮水机、火车车厢、游泳池和其他空间)需要明确界定谁是白人,谁不是。20世纪初,美国南方的几个州通过了“一滴血”种族分类法:任何数量的非白人血统,都足以否定某人在美国种族等级制度中的地位。弗吉尼亚州1924年的《种族完整性法案》是这样规定的:如果一个人“没有任何高加索人种以外的血统”,他就是白人。“一滴血”规则是“降格继嗣”(hypodescent)规则的极端版本。在“降格继嗣”规则中,混血儿被算作父母双方中社会地位较低一方的种族。
由于种族分类“降格继嗣”规则的社会史和法律史,目前在美国被认定为白人的人极不可能有任何数量的非欧洲的遗传血统。一项研究估计,只有0.3%自认为白人的人有任何数量的非洲血统。同时,非洲人被强行带到美国并被奴役,他们的后代被归类为“黑人”,因此,几乎所有(根据一项研究,99.7%)被社会归类为黑人的人,都至少有一些 “非洲”遗传血统。
尽管在“只有欧洲遗传血统”与“被归类为白人”之间存在着接近1:1的对应关系,或者说在“具有一些非洲遗传血统”与“被归类为黑人”之间存在着接近1:1的对应关系,但将种族概念视为血统的同义词,仍然是一个错误。原因有四:
第一,当我们把人划分为种族时,我们突出了人与人之间的某些区别,而忽略了其他区别。这些种族区别是由文化和历史决定的。如果你回顾一下20世纪早期信奉优生学的思想家的作品,他们痴迷的“种族”问题可能会让你觉得很怪诞。阅读普林斯顿大学心理学教授、智力测试的早期倡导者卡尔·布里格姆关于“种族问题”的文章,我们会发现他试图弄清楚来自每个欧洲国家的移民有多少北欧、阿尔卑斯和地中海“血统”。一波又一波的欧洲移民,如意大利人、爱尔兰人、犹太人,起初并不被视为美国“白人”统治阶级的一部分。对种族的界定不可避免地带有社会层面的偶然性,因为种族(与血统不同)是一个固有的等级概念,用于安排(structure)谁可以获得空间和社会权力。
第二,人们在社会层面是否被归类为不同的种族,并不直接对应他们的遗传差异程度。特别是非洲血统的人口,其遗传多样性非常突出,有些非洲人群之间的遗传差异比欧洲人和东亚人之间的差异更大。但每一个非洲裔美国人都被划入同一个“黑人”类别。同样,在遗传血统方面,南亚裔与东亚裔是有区别的,以至于南亚人通常被算作一个单独的大陆超群(super population)。但美国人口普查局将亚裔的种族类别定义为“起源于远东、东南亚或印度次大陆的任何原初民族的人”。
第三,在任何一个具有自我认同的种族群体中,人们可能有一系列迥异的大陆祖先背景,所以如果我们只掌握了种族信息,几乎不可能有把握地确定一个人的血统。正如我们所看到的,自我认同的美国黑人几乎都有部分非洲血统(这本身就是一个非常异质的超范畴),但与此同时,90%以上的美国黑人也有部分欧洲血统。注虽然我们可以相当有把握地认为,在美国被认定为白人的人有欧洲遗传血统,但反过来就不对了,因为有一定量欧洲血统的人几乎可以被认定为任何其他种族类别。
第四,血统可以被非常精细地量化,而这些精细的区别不可能用我们熟悉的种族术语来描述。正如我前面提到的,“一滴血”的社会规则保证了,被认定为白人的美国人不太可能有任何非欧洲的遗传血统,所以在这种情况下,自我报告的(self-reported)种族和遗传血统似乎趋同。但是,即使在完全是欧洲血统的人群中,仍然有反映更精细的地理渐变的遗传结构,以及所有潜在的语言、文化和阶级差异,这些差异使交配变得非随机。
为了捕捉这种遗传结构(它可能是“隐秘的”或隐藏的),遗传学家通常使用一种叫作“主成分分析”(PCA)的方法。PCA分析人与人之间的遗传相似性(这反映了他们有共同的祖先)的模式,并产生一组有关血统信息的主成分,即“PC”。这些变量中的每一个都是连续的(意味着人们可以是高的,矮的,或介于两者之间的任何位置),而不是非黑即白的。研究者在研究中考虑了40个或更多的血统信息PC,这并不罕见,即使他们只关注一个在纸面上看起来已经相当同质的群体(例如,所有被认定为“英国白人”的人)。这种方法精细地描述了一群人的特征,否则这些人都会被归为单一的种族类别,而每一个血统信息PC都不可能用种族术语来解释。
把所有这些情况放在一起,罗伯茨和她的同行这样总结了种族和血统之间的区别:“血统是一个基于过程(process)的概念,是关于一个人在其族谱历史中与其他人的关系的声明;因此,它是对一个人的基因组遗产的非常个人化的理解。而种族是一个基于模式(pattern)的概念,它使科学家和普通人都得出了关于人类等级制组织的结论,该组织将一个人与一个更大的、预设的、有明确地理范围或社会构建的群体联系起来。” (强调是我加的)
为什么血统对GWAS很重要?
历史上的科学种族主义者会指出被划归不同种族的人的头骨差异。现代的科学种族主义者更倾向于谈论遗传血统的模式,以说明先天的种族差异。但是,正如我在本章迄今为止描述的,仔细研究一下遗传血统的科学,就会发现,“种族在科学上是站不住脚的”。遗传数据并没有“证明”种族的生物学现实。相反,很有讽刺意味的是,了解社会定义的种族群体在其遗传血统方面的差异,有助于我们理解为什么现代“种族科学”实际上是伪科学。有些人(往往)心术不正地企图利用全基因组关联分析(GWAS)发现的人间群内(within)的个体差异,得出关于人群差异来源的结论。在下一节中,我将解释为什么不同人群之间的遗传差异会让上述企图必然失败。
遗传数据并没有“证明”种族的生物学现实。相反,很有讽刺意味的是,了解社会定义的种族群体在其遗传血统方面的差异,有助于我们理解为什么现代“种族科学”实际上是伪科学。有些人(往往)心术不正地企图利用全基因组关联分析(GWAS)发现的人间群内(within)的个体差异,得出关于人群差异来源的结论。在下一节中,我将解释为什么不同人群之间的遗传差异会让上述企图必然失败。人群间差异的第一个方面是,遗传变异的呈现及其常见程度不同。在某一人群中罕见的遗传变异,在另一个人群中可能很常见。大约四分之三的遗传变异只在一个大陆群体中发现,甚至只在一个次大陆群体中发现,而非洲血统的人群显示出最大的遗传多样性。因此,在一个人群中对表型最重要的遗传变异,在另一人群中不一定是最重要的:例如,CFTR基因的一个特定突变在欧洲血统的人群中造成超过70%的囊性纤维化病例,但在非洲血统的人群中只造成了不到30%的病例因此,关注世界上更多遗传多样性的研究具有非凡的潜力,可以发现新的遗传变异,而只关注欧洲血统人群的研究永远不会发现这些变异。例如,对生活在埃塞俄比亚、坦桑尼亚和博茨瓦纳的非洲人的研究发现了影响皮肤色素的新的遗传变异。皮肤色素在整个非洲大陆的差异很大,有浅色皮肤的桑人(San),也有东非的皮肤很深的尼罗—撒哈拉人。
人群间差异的第二个方面是,在基因组中看到的连锁不平衡(LD)的模式不同,如哪些遗传变异与哪些其他变异相关联。同样,非洲血统的人群在这里特别值得注意,因为他们的LD比非非洲血统的人群低,而且LD在不同的非洲人群中是异质的。我们回顾一下, GWAS通常不测量每一个DNA序列,而是测量一小部分SNP。因此, GWAS的结果可能是由“与被测SNP的关联”或“与被测SNP的LD中的任何遗传变异的关联”所驱动的。魔鬼就在这个技术细节中:同一个遗传变异可能与不同人群的结果相关,但仅在一个人群中进行的GWAS的结果仍可能无法移植到别的人群,因为实际测量的SNP在一个人群中 “标记”的因果变异(causalvariant)与另一个人群的不同。
那么,最重要的一点是,我们不能,也不应该期望GWAS的结果可以在遗传血统或社会定义的种族之间“移植”。你在一个人群中发现的东西,不能期望它会适用于另一个人群;如果你研究一个不同的人群,你可能会发现不同的基因。这种期望在数据中得到了明确的证实。纵观从高密度脂蛋白胆固醇到精神分裂症的各种表型,基于欧洲血统人群分析的多基因指数,与在其他人群(特别是非洲血统人群)中测量到的表型的关系并不紧密。当研究者在英国、美国威斯康星州或新西兰的被识别为白人、欧洲血统的样本中使用受教育程度GWAS来构建一个多基因指数时,那么这个分数就“奏效”了:它捕获了这些样本中受教育程度的10%以上的差异。但是,当研究者在非裔美国人(这些人都被认为至少有部分非洲血统)样本中测试这个多基因指数时,它与受教育程度的联系就不那么紧密了。正如我们在囊肿性纤维化或肤色等在遗传上比较简单的表型研究中看到的,未来对非洲和非洲裔人群的受教育程度或其他社会和行为表型的遗传学研究,可能会发现与欧洲人群不同的相关基因。
GWAS研究的欧洲中心主义偏见
不过,就目前而言,几乎所有的GWAS研究都集中在遗传血统完全为欧洲的人身上。截至2019年,欧洲血统的人只占全球人口的16%,却占GWAS参与者的近80%。尽管基因型分型(genotyping)的成本在下降,但上述情况并没有改善。在过去的五年里,尽管基因型分型的总人数继续爆炸性增长,但专注于欧洲血统者的遗传学研究的比例一直保持稳定。
由于在一个血统群体中进行的遗传学研究的结果不可能移植到另一个血统群体的人身上,目前遗传学研究的欧洲中心主义有可能加剧现有的健康差距。医学遗传学方面的工作正在开发多基因风险评分,以预测未来癌症、肥胖症、心脏病和糖尿病的发病情况。这些工作的目标是更早地发现高风险人群,并使他们更快地得到有效治疗。不过,这些慢性疾病对美国的有色人种造成了不成比例的影响。因此,多基因指数的使用有可能进一步扩大不同人群间的健康差距,因为它只改善了那些完全是欧洲血统的人的健康。
解决这个问题的唯一办法是,优先投资于对全球其他人群的遗传学研究。但是,遗传学研究不仅仅是不成比例地研究白种人,它也是不成比例地由白种人进行的。因此,从非欧血统的人群中收集和分析基因数据,处于进退两难的困境。如果不对整个全球人群进行遗传学研究,就有可能使遗传学知识只对原本就处于优势的人有益。但也有一些合理的、根深蒂固的担忧,即DNA会成为白人为了白人的利益从边缘人群中提取的又一宝贵资源,同时使参与者容易受到更多的监视、歧视和其他伤害。这样看来,遗传学研究的欧洲中心主义是一个很好的例子,说明不同的种族主义体系如何相互作用、相互加强,使得任何一个体系都难以孤立地发生改变。
生态谬误和种族主义先验
说到这里,希望大家能明白,为什么任何关于智力、受教育程度、犯罪或任何行为特征的“遗传”种族差异的说法,在科学上都是毫无根据的。因为现有的大规模GWAS是基于欧洲血统人群的,在谈到遗传如何与生活结果的不平等相关时,我们的知识纯粹是关于血统完全是欧洲的、自我认定的种族很可能是白人的人们之间的个体差异。我们之所以不能假设这些基因关联在具有不同遗传血统的人身上会以同样的方式发挥作用,部分是由于有关基因组测量和分析的技术性很强。我们不能用不同血统群体的多基因指数来“比较”其遗传信息。我们不能假设种族相同的人都有相同的遗传祖先。无论我们谈论的是像教育这样复杂的社会表型,还是像身高这样相对没有争议的体质表型,现代分子遗传学研究,像较早的双生子研究一样,都完全不能解释种族不平等的原因。
但是,即使在遗传的种族差异没有任何“证据”的情况下,人们通常会提出一个貌似合理的论点。如果(1)白人群体中教育的个体差异是由遗传差异造成的,并且(2)美国黑人的平均教育水平较低,那么(3)群体间差异也是由遗传造成的,或者至少有一点点是由遗传造成的,这难道不是很直观的道理吗?
从“X导致群体内的个体差异”到“X的平均水平差异导致群体间的平均差异”的跳跃似乎很简单。但从统计学的角度来看,假设一个群体内的相关关系能告诉你群体间差异的原因,是一个只有傻瓜才会做的跳跃。这是一个生态谬误(ecological fallacy)。
为了解释生态谬误,不妨举一个与遗传学无关的例子。但愿这能更清楚地表明,我反对将个体差异与群体间差异联系起来,不仅仅是因为我认为种族群体间差异由“遗传造成”这一结论令人不适。我不是在试图表现得“政治正确”。我提出的是一个统计学观点,它适用于我们试图从一个层次的集合跳到另一个层次的任何时候,而不仅仅是我们在谈论遗传和种族这个争议性话题的时候。
1950年,社会学家W.S.罗宾逊写了一篇关于生态谬误的开创性论文,在其中提出了两组相关关系。第一组是在国外出生或在(美国)本土出生与英语文盲之间的个体相关性(individual correlation)。这是一个正数(~.12),说明在美国以外出生的成年人比在美国出生的成年人更难用英语流利地阅读和书写。接下来,罗宾逊计算了一个州的境外出生居民的百分比和该州文盲率之间的“生态”相关性。它不仅与个体相关性不同,而且实际上转换了方向(~-.5)。对这一明显悖论的解释是,外来移民到了美国之后,往往定居在本土出生的居民更有可能识字的州。也就是说,各州的识字率之所以不同,除了我们在计算个体相关性时测量的变量之外,还有其他很多原因。
现在想象一下,如果我们只拥有罗宾逊掌握的信息的一部分。在这种情况下,我们可以观察到境外出生和英语文盲之间正的个体相关关系,但我们只能在美国的部分州观察到这种个体相关关系。我们可以合理地猜测,其他州的个体相关性也是一样的,但这只是猜测而已。而且,在这种情况下,我们可以观察到美国各州的文盲率不同。但是,由于测量问题,我们没有任何关于各州境外出生居民比例的数据。我们可以看到结果中的群体间差异, 但我们无法测量假设的解释变量(explanatory variable)中的群体间差异。
在只掌握了部分信息的情况下,我们可以(不正确地)推测生态相关性(ecological correlation)与个体相关性是相同的,或者至少是同方向的。因此,你看到那些文盲率较高的州,然后得出结论,那些州有更多的出生于境外的居民。你可能会对冲一下。“好吧,我不是说密西西比州的文盲率比加州高的唯一原因是密西西比州的移民多。也许这只是原因的一半。”
但是你完全搞错了,真相是:你观察到的文盲率较高的州,出生于境外的居民实际上较少。
这种以不完整的信息和错误的假设为特征的情况,正是我们在几乎任何性状的人群间差异(无论是身高、智力测试分数,还是受教育程度)中发现的。例如,在一个群体(欧洲血统的人)中,我们可以观察到遗传变异和受教育程度之间的正相关关系。我们可以观察到不同血统群体之间教育结果的差异。但我们不能可靠地测量假设的解释变量
——遗传的群体间差异。在一个群体中,我们可以观察到遗传和受教育程度之间的个人层面的相关性。似乎可以合理地认为,这意味着某个血统群体的教育结果更差是因为导致更好教育结果的遗传变异更少。
但现实可能恰恰相反。对教育有正面影响的基因可能在受教育程度较差的血统群体中更常见。个体相关性和生态相关性不仅仅是不同的东西,而且其中一个并不能提供关于另一个的信息。半个多世纪后,罗宾逊在他的论文中扼要地写下的结论仍然很有意义:“唯一合理的假设是,生态相关性几乎肯定不等于其相应的个体相关性。”
那么,对于这种谬论——“科学表明”生活结果中的种族差异是由于种族之间的遗传差异,我们能做什么?的确,社会构建的种族差异与遗传血统有系统性的关系。而且,确实,在欧洲血统的人群内部,人们之间的遗传差异与他们在社会层面重要的生活成果的差异相关。但是,这些信息中的任何一个,都不能提供关于种族间差异来源的任何信息。
在贝叶斯统计中,有一种叫先验(a prior)的东西,它指的是,在考虑任何证据之前,你相信什么以及你对这些信念的不确定性的数学表达。当没有信息可用时,你知道什么,或相信你知道什么?在观察教育等复杂的生活结果中的人群间遗传差异时,我们所处的局面就是这样。我们不妨更进一步。“生活结果中的种族差异是由于种族之间的遗传差异”是一种先验的信念,如果它没有科学证据,那么它的基础是什么?
白人因其基因而享有更好的生活结果这一先验的信念,是一种有害的顽固观念。1960年代,教育心理学家阿瑟·詹森推测,由于遗传的限制,黑人学童的教育进步不会超越某一程度,当然也无法达到白人学童的水平。1990年代,赫恩斯坦和默里轻率地提出了他们的假设,即美国黑人和西班牙裔的平均智商测试分数之所以低于白人,至少有一部分原因是不同种族之间的遗传差异。今天,“种族现实主义者”和“人类生物多样性”团体张贴了《自然—遗传学》的文章,他们认为这些文章证明了种族之间存在遗传差异,进而导致智力测试分数、冲动行为和经济成功方面的差异。
这些团体坚持认为,他们“只是在问”一个经验性的问题:遗传血统群体之间是否存在能够导致平均生活结果差异的遗传差异?然而,一旦我们认识到他们的假设没有任何正当的科学根据,我们就可以认识到,这个问题建立在关于某些种族群体至高无上的种族主义的先验信念之上。
后基因组世界中的反种族主义和责任
我已经解释了为什么关于基于遗传的种族差异的猜测在今天没有科学依据,但明天呢?毕竟,人类遗传学领域正在以非凡的速度发展。目前,群体遗传学领域的研究者已经在使用GWAS的结果,试图了解人类之间的差异是否可能随着时间的推移而演变。2018年,遗传学家大卫·赖克在《纽约时报》发表评论,敦促人们考虑:“我们应当如何准备应对如下情况,即在未来若干年里,遗传学研究将证明许多性状受到遗传变异的影响,而这些性状在人类不同种群之间存在差异?否认这些差异将是不可能的,事实上,是反科学的、愚蠢的和荒谬的。”
2020年夏天,当我参加作家萨姆·哈里斯的播客节目时,他也提出了类似的论点。在解释了我为什么认为种族群体的智力存在“遗传”差异的想法没有科学根据(原因我在本章中已经介绍过)之后,哈里斯发动了反击,认为我的立场“会被遗传学和其他科学的未来发展推翻”。他预测:“如果你能列出人类最关心的100件事物,智力将是其中之一……如果我们关心的100件事物的平均值对每一个可以想象的人类群体都是一样的,那将是一个奇迹……因此,在政治上,我的观点是,我们需要能够消化这个事实。”
我对赖克和哈里斯的前提持怀疑态度,有多方面的原因。我怀疑群体之间在社会和行为特征(如教育)方面的差异能否在遗传学的分析层次(level of analysis)得到最好的理解(我会在第八章再探讨分析层次的问题)。我不相信科学结论会恰好与白人为了给奴隶制和压迫提供“道德辩护”而编造的故事相一致。我对任何自称洞悉了人类遗传学将向我们揭示什么的人持怀疑态度,因为迄今为止,人类遗传学的发展经常出乎研究者的预料。
不过,虽然我对赖克和哈里斯关于“未来的基因组数据分析会发现什么”的先验立场持怀疑态度,但我确实同意他们的一个观点:如果人们对种族平等的道德承诺依赖于整个人类种群的精确的基因同一性,那么这些承诺的基础就是不稳固的。例如,考虑一下伊布拉姆·肯迪的畅销书《如何成为反种族主义者》。在“生物学”一章中,肯迪坚持认为“生物学上的反种族主义者”是这样的人:他“相信各种族在生物学上的意义是相同的,不存在遗传层面的种族差异”(强调是我加的)。
正如我在上文讨论的,种族不是一个有效的生物学范畴。但是,认为被认定为不同种族的人群之间不存在任何遗传差异,是完全不正确的:正如我在本章前面所描述的,种族群体在遗传血统上是不同的,因此在哪些遗传变异存在以及这些变异的常见程度上也是不同的。我们对反种族主义和种族平等的承诺,难道必须建立在“不同种族之间不存在遗传差异”这种摇摇欲坠的基础之上吗?正如我告诉哈里斯的,“将公平、包容或正义的主张……建立在不存在遗传差异的基础上,是一个严重的错误”。这样做会使我们的道德承诺从根本上不稳定,有可能被《自然—遗传学》的下一篇论文推翻。
如果我们要使我们的反种族主义立场在后基因组世界中保持稳定,我认为有必要考虑赖克的问题(尽管这么做可能令人不快),即我们应该如何为将来的科学发现做准备,无论它们是什么。我们不应当害怕去考虑看似最坏的情况:如果明年突然出现了科学证据,表明欧洲血统人群的演化方式使他们在遗传上更容易发展出在学校获得高分的那种认知能力,那该怎么办?我们将如何“消化”这一事实?
赖克在回答自己的问题时,呼吁“把每个人当作一个个体”,“给予[每个人]同等的自由和机会,无论他们之间的差异如何”。虽然我同意应当避免基于群体身份的成见并提供平等机会,但我认为这些还不足以解答他的问题。很多时候,“机会均等”的想法是一种修辞上的回避,是为了避免考虑人类生活结果的严重不平等。现在对每个人都一视同仁,只会复制过去的不平等现象。
而如果我们有兴趣使我们对种族平等的承诺“得到遗传学的证明” (genetics-proof),我认为我们必须消除“社会有责任解决的不平等”和“生物学差异造成的不平等”之间的错误区分。(注:哲学家托马斯·内格尔描述了对种族之间“先天”差异或“生物学”差异的兴趣是如何在人们心中与责任的问题联系起来的。“如果一个人认为社会的责任……只延伸到那些由社会不公正造成的劣势,那么他就会对平均智商的种族差异受遗传影响的程度(如果有的话)赋予政治上的重要性。”)
萨姆·哈里斯在我们的播客谈话快结束时的评论中,提出了“遗传原因是社会责任的边界”这种明显错误的想法。我们谈话的时候,正值乔治·弗洛伊德和布伦娜·泰勒被警察谋杀的夏天,世界各地的城市都爆发了“黑人的命也是命”的抗议活动,而《白人的脆弱性》和《你想谈谈种族》这两本书在《纽约时报》的畅销书排行榜上名列前茅。这些迹象表明,美国正在发生关于警政、住房、医疗保健、教育、财富和政治权力等方面的种族差异的全国性对话。关于这一点,哈里斯问道:
真正的问题是,造成所有这些差异的原因是什么?目前政治上的问题是,当你谈论美国社会中的白人—黑人差异时……在许多方面,唯一可以接受的解释是白人种族主义,或系统性的种族主义、制度性的种族主义,奴隶制和“吉姆·克劳法”的遗留影响……这是非常不可靠的,因为我们会发现一些关于群体间差异的东西。
这些评论提出了一个非此即彼的观点:要么是系统性的种族主义,白人有道德责任来解决这个问题;要么是遗传,它被假定为生物学的一个固定的、决定论的方面,所以不应该让任何人感到自己对其负有责任。正如女权主义哲学家凯特·曼恩在其关于性别歧视的著作中所说的:“这里未说明的前提是‘应该蕴含能够’(ought implies can)原则的一个版本……可能被弱化为‘不能够甚至蕴含懒得管’(can't even implies don't bother)。”将遗传而非种族主义定位为种族差异的原因,其未点明的前提是要暗示人们,特别是处于种族等级制顶端的白人,他们不必在道德上感受到压力,要去为改变差异做任何事情,因为种族差异是遗传造成的。
这种思维的关键缺陷并不是它假设种族群体之间存在遗传差异。正如我们看到的,种族并不能代表遗传血统,但种族与遗传血统并非毫无关系。上述思维的关键缺陷也不在于它将遗传差异与生活结果的差异联系起来。正如我将在本书中解释的,有大量的科学证据表明,我们的基因对塑造自我很重要,而且不仅限于我们身体特征的塑造。
上述思维的关键缺陷在于,它认为,遗传造成的人类差异的存在,意味着我们无需承担解决不平等问题的社会责任。正如我在接下来的章节将会描述的,遗传影响的存在(无论它如何在社会定义的群体中分布)并没有对通过社会机制进行社会变革的前景施加一个硬性界限,也不是我们逃避社会责任的“免罪金牌”。
最终,我认为学界即将获得的来自多血统人群的海量基因组数据很可能会显示,与心理特征(比如我们目前的一系列智力测试所测试的认知能力)有关的遗传变异在各人群中的分布占比相当,差异很小(如果有差异的话)。但是,无论人们的遗传差异如何,无论人们的遗传差异如何在社会定义的种族群体中分布,无论这些遗传差异多么强烈地影响人类特征的发展,无论这些特征是生理的还是心理的,我们仍然不能逃避为所有人谋福利的责任,而不能仅仅服务于全球遗传多样性中以欧洲血统为主的那一小群人。这一责任必须在我们的社会政策中得到体现。也就是说,我们的社会政策应该反映这样一个事实:正如演化生物学杜布赞斯基所写的,“遗传多样性是人类最宝贵的资源,而非对单调的同一性这一理想状态的令人遗憾的偏差……不充分实现人类的潜力,是对人力资源的浪费”。
总结并展望未来
在这里,让我重述一下本章提出的观点:遗传血统是一个基于过程的概念,将人们与他们个人的族谱历史联系起来;而种族是一个基于模式的概念,将人们与社会构建的群体联系起来,以维持等级权力关系。 GWAS研究要考察的是单纯具有“欧洲”血统的人在智力、行为和成就上的个体差异。由于美国社会构建“白人”这一群体的方式,这些人都可能被认定为白人。GWAS的这些结果不一定能推广到其他的血统人群,也不能用来在不同的血统人群之间进行比较。没有科学证据表明不同的种族群体或血统人群之间的智力测试分数表现差异是遗传差异造成的。美国黑人因为基因不好而获得更糟糕的社会结果的想法,不是基于科学证据,而是基于许多世纪以来的种族主义思想。种族主义思想以种族化的等级制度来看待人与人之间的差异,而白人处于等级制度的顶端。而且,最关键的是,我们有责任妥善地改造社会,使其惠及所有人,而不仅仅是具有某种遗传特征的人。任何遗传学的发现都不能免除我们的这种社会责任。
当我们讨论遗传和社会不平等之间的关系时,要清楚地记住上述观点可能非常困难。这种困难不是偶然的,而是几十年来种族主义思想的结果,这种思想一直将生物学作为其意识形态工具的一部分,对种族等级制度进行正当化。那么,在接下来的章节中,当我论证为什么我们应当认真对待“作为个体差异之原因的基因”时,读者诸君不妨回过头来看看本章,提醒自己,为什么个体差异和种族差异不是一回事,以及为什么遗传差异的存在并不能免除我们的社会责任。
同时,本章已经开始触及一些需要慢慢解释的重要问题,如遗传原因可能具有社会机制(第七章),以及遗传影响并不对社会变革的可能性施加硬性界限(第八章和第九章)。但在这之前,我们必须解答一个更基本的问题。什么是遗传原因?正如我在上一章所描述的,GWAS将一小部分DNA与某种结果相关联。但是,正如人们常说的,相关不代表因果。我们如何从GWAS的相关结果,推进到理解基因如何在特定的历史文化背景下成为社会不平等的原因之一?要回答这个问题,就要求我们对“原因”这个词有准确的定义。在下一章,我们会集中探讨这个话题。
