【本文节选自《基因:不平等的遗传》,作者: [美]道尔顿·康利(Dalton Conley) / [美]詹森·弗莱彻(Jason Fletcher),出版社: 中信出版集团,经出版社授权在网易新闻平台发布,欢迎关注,禁止随意转载。】

对于遗传力缺失还有一种简单得多的解释——效果不明显,样本也太小。我们可以把一个遗传学研究的样本量想象成照片的像素,像素低时,我们也能明显地辨别出大致的形状,比如,照片里是有山还是有海,天空是蓝色还是绯红色。像素(样本量)越高,我们能辨别的细节就越精确,越能看出照片之间的细微差别。这就是遗传学所谓的“微小效应”范式转向。

社会科学家感兴趣的大多数效应都受到很多基因的影响,而社会科学研究惯用的样本量(一般不超过1000~10000个研究对象)很难识别出这些基因的各种微小效应。这就相当于照片像素太低,图片太模糊,导致我们看不清想找的东西。即使用身高这种我们确信高度可遗传的性状来说,当我们把样本量增加10倍(比如,从20000个增加到200000个)时,GWAS中的显著位点数量也相应增加了一个数量级,从10多个增加到了100多个。

但是,样本量只是其中的一个问题。当我们有具体搜寻目标的时候,为了避免由于之前谈到的各种原因导致的假阳性现象,我们最好将范围限制在达到全基因组显著水平(5×10-8)的位点上。但是,当我们想要解释总体差异情况时,这个方法就不合适了。在如此严格的标准下,我们势必会把大量有用的信息排除在外,因此有可能犯下假阴性的错误。这条原则有点像刑法学里的一条经典原则(有时称为“布莱克斯通公式”):哪怕放走10个罪犯,也好于让1个无辜者入狱。这固然是个合理的原则,但会导致很多刑事案件无法结案。放到这里,就是会忽略许多遗传效应。

打开网易新闻 查看更多图片

为了避免遗漏重要信息,我们可以采取一种替代方案,即综合我们收集到的所有信息。这并不困难,只需要把GWAS的数据加总即可。以1号染色体上的1号SNP为例,如果我们发现,相关等位基因每增加一个,智商就会提高0.1点,那么如果我们分别给没有该等位基因、有一个和有两个的情况赋予0分、0.1分和0.2分。然后再算1号染色体上的2号SNP,直到把23条染色体上所有的SNP都算完。通过这种方式,我们就能把整个基因组扫描一遍,然后用我们上百万的独立GWAS计算出一个多基因的分数。这个公式是通过对一个(或多个)样本进行GWAS得出的,接下来我们将这个公式套用到另一个独立的样本上,用它来进行预测,看看它能在多大程度上解释表型的变化(也就是它得出的遗传力在多大程度上是可加的)。

实际上,在关注全基因组内的显著位点的情况下,我们的教育的多基因分数(polygenic score)几乎完全无法解释教育年限、智力水平的差异。然而随着我们逐步放宽要求,直到最后考察全部的SNP时,我们发现预测能力也在稳步上升。但我们仍然只能解释教育方面3%左右的差异,而我们本来以为它的遗传力至少应该是这个数字的10倍。一个最近的评分研究表明,它能够解释大约6%的教育年限差别,同时科学家也在致力于增加样本容量,以进一步提升预测能力。

在身高的遗传分析方面,科研工作者已经能够通过一项分数来解释60%的遗传力了,这项分数是由GWAS数据加总得来的。想想看,只要用一个数字!随着“元分析”(meta-analysis)(一种将多个样本的结果整合起来的统计学手段)可用的样本越来越多,也越来越大,这个数据也必然会上升。图3.3基于单个研究的样本量显示了一些预测(大量研究使这个斜率稍微平坦了一点,但总体趋势是相同的)。

若想将完整的加性遗传力估计归约为可以通过个体基因分型SNP芯片确定的单一分数,目前面临着重重障碍。而障碍之一就是,我们测得的SNP标记并不能完整地反映基因组中真正关键的SNP。遗传力会因时间和地点而异的假设带来了第二个障碍。在研究环境和人群相差巨大的情况下,如果仅仅去寻找共有的遗传效应,那么得到的结果可能不过是某个特定样本中某个性状的遗传力的一部分罢了。

打开网易新闻 查看更多图片

图3.3 样本量与某多基因分数能够解释的遗传力比例的关系

资料来源:Daetwyler et al.(2008)

注:该分数衡量的是一个连续性状,基于SNP计算得到的遗传力为12%。由样本量的PGS条件解释的遗传比例随着遗传力而上升(h2snp)。图中Y轴(纵轴)代表着这个案例中的表型变异比例,最大值为12%; X轴(横轴)描述了需要12%的预测值所需的样本量,范围是0~3000000。

暂时把这些问题放在一边,概而言之:并没有遗传力缺失这一回事。它隐匿于人类种群中常见的各个个体中,我们只是需要大量样本来提高实验的信噪比(signal-to-noise ratio)。这些大样本如今可以通过网络获得。私营基因组公司23andme如今已经为超过100万人进行过基因组测序(尽管这些对象有高度的自我选择意识,但代表性不是很强)。加利福尼亚的Kaiser Permanente也为超过50万名受试者进行过基因测序。The UK Biobank提供了50万名受试者的基因型信息,他们的受试者是通过合理的采样方式抽取的,以保证各民族样本的代表性,虽然也面临着参与率低下的隐忧。

当我们对于这些单一多基因评分的预测能力开始达到两位数时,就有必要对人为选择[或称“私人优生”(personal eugenics)]进行严肃的讨论了。尤其是当越来越多的父母选择试管婴儿的生育方式时,这样的讨论就显得更为必要(关于政策的影响,我们将于第八章进行讨论)。同时,在我们能够直接测量给定基因型的效应,而不仅揣测相关性的情况下,这些分数已经对解释许多问题提供了帮助,比如,基因是如何与社会环境相互作用的(第七章的主题),以及我们会如何将自己分成不同的“遗传种姓”(genetic caste),或者避免这一情况的发生。

在这种情况下,教育的多基因分数让我们能够从简单的遗传力计算以外的角度去重新审视基因统治(genotocracy)问题。遗传力描述的是遗传因素对于某个性状的影响程度,但它无法告诉我们遗传影响在家庭内部以及不同家庭之间的情况。但有了多基因分数之后,我们就可以做到这一点了。假如家庭之间(相当于人群中随机选择的个体间)的教育分数有较强的预测能力,而家庭内部的分数(即解释兄弟姐妹的成绩差异时)则价值不大,那么《钟形曲线:美国社会中的智力与阶层结构》的观点,即遗传会促进正在扩大的社会阶级分化和代际复制,似乎就是有一定道理了。

打开网易新闻 查看更多图片

我们现在来看另一种情况:与从总体中随机选定的两人相比,多基因分数相差一个标准差带来的实际成绩差别对一对兄弟(或姐妹)更大。在这种家庭内部差异较大的情况下,遗传因素可能会不利于“老子英雄儿好汉,老子狗熊儿浑蛋”的发生,而有利于个人的成功。尽管随机婚配(random mating)会使兄弟姐妹间的相关性平均约为50%,这种假说依然是可能的。换言之,在基因、生态位构成(niche formation)、特化(specialization)等因素作用下,家庭内部共有的遗传基因(geneticsand)可能会被抵消,带来新的社会流动性。

我们会发现,给定教育多基因分数的差值,相对于从总体中随机选取的两个人,兄弟姐妹间的实际成绩差异确实更大。
换句话说,尽管兄弟姐妹共有的基因较多,他们之间的差异依然十分关键。在家庭内部,一个标准差的分数差值会引起约1/3的教育年限差别;而如果是两个随机个体,这一数字大约是1/4。为什么会出现这种结果呢?答案很可能在于微小差异带来的巨大外部影响。人们会更多地在兄弟姐妹之间进行比较,而并不是将他们与随机选取的人比较。父母看到兄弟姐妹间的能力差异后,可能会进一步强化这种差异,孩子自己也可能会去想办法与兄弟姐妹区分开,从而放大了基因差异的效果。比方说,一个家庭里有两个孩子,一个喜欢学习,另一个更喜欢运动。前者可能会通过拼成绩来确立自己的个性,而后者则会更重视在校队里的表现。不论原理如何,这都会减轻基因型对阶级固化的推动作用(虽然并没有完全消除,因为虽然家庭内部的效应较强,但还没有强到完全抹杀兄弟姐妹共有基因影响的地步)。这个故事比赫恩斯坦与默里的更加复杂。兄弟姐妹间的微小差异和共同遗传来源对不平等代际延续的影响方式还取决于另一个因素:父母根据基因差异对孩子区别对待的程度。这也正是接下来的话题——基因分类。

打开网易新闻 查看更多图片