【本文节选自《基因:不平等的遗传》,作者: [美]道尔顿·康利(Dalton Conley) / [美]詹森·弗莱彻(Jason Fletcher),出版社: 中信出版集团,经出版社授权在网易新闻平台发布,欢迎关注,禁止随意转载。】
原标题《遗传力估算哪里出错了》
前文已经讨论过,我们认为估算遗传力能帮助人们理解社会的许多方面——从教育制度的精英化程度,到慢性病的干预政策是否有效,不一而足。至少这种估算能告诉我们,政策对几代人的影响将如何动态地变化。即便如此,我们如果想知道关于社会经济地位遗传力的“准确”数字,就必须了解得出结论(如“影响收入的变量中,50%是由基因决定的”)所用的方法。到底是不恰当的方法导致了疯狂的结论,还是疯狂的结论导致了不恰当的方法?
自统计学家兼生物学家罗纳德·费希尔(Ronald Fisher)和弗朗西斯·高尔顿之后,双生子研究在很长时期内都是评价身体性状或社会性状与遗传因素是否相关的黄金标准。因为同卵双生子的基因是相同的,这就可以帮助我们分辨出哪些效应是由基因以外的因素导致的。比如,子宫里的一对女性双生子,其中一个因为胎盘位置的原因导致营养不良(她的姐妹把所有营养都吸收了),这就好比一个中了彩票,而另一个背了一大笔债。在经济学和其他相关领域一直有双生子差异研究的传统。
但是,要想让双生子来告诉我们遗传学因素对某个性状(如身高)的影响程度,那就不仅要对同卵双生子进行研究,还要对不太流行的同性别异卵双生子进行研究,然后通过ACE模型来进行估算。在ACE模型中,一个性状被拆分成了三个要素,其中A代表加性遗传力(Additive heritability),即遗传因素;C代表共有的环境(Common environment),即受试儿童共有的环境,如家庭环境或邻里环境;而E代表独有的、非共有的环境(Unique Environment),例如,不同的老师和学生。一个性状的全部变量=A+C+E。ACE模型早在几十年前就有了,从数学的角度来看很是简洁明了,但直到不久前,我们发现它所需的若干关键假设都站不住脚。
该模型的基本理念是,同卵双生子的基因100%相同,异卵双生子平均有50%的基因相同。这样的话,同卵双生子在相似度方面超出异卵双生子的部分就蕴含着基因起到了多大作用,即某种性状的遗传力,或者更准确地说,是加性遗传力。不仅如此,我们还能分别从独有环境和共有环境两个方面去分析环境影响对某个性状的贡献程度。对于某性状或表型而言,我们只需要看看同卵双生子在这方面的相似度比100%差了多少,就能得出独有环境(要素E)所占的比重。假如双生子中的一个在八年级的时候遇到的数学老师水平很高,而另一个却必须忍受一位上课如上刑的数学老师,这就形成了独有环境(要素E)。如果父母对待两人的方式恰巧也不一样(但前提是这种差异绝不是由他们的基因情况导致的),这也属于要素E的一部分。共有的、共同的环境(要素C)指的是孩子们共同享有的,且不是由各自基因导致的环境因素。比如说,如果只让确实在基因方面有音乐天赋的孩子上声乐课,那么这就属于基因的整体效应(要素A);但如果父母不管孩子有没有“音乐细胞”,都让他们上声乐课,那这应该属于要素C。
我们可以举例来计算一下。假如一对同卵双生子身高相同的概率是95%(即同卵双生子身高的相关度为95%),那么非共有环境要素E(如个人独有的影响因素)的作用就是5%。如果我们接下来算出了遗传因素的比重(即加性遗传力),将得到的数字做减法,就能了解共同环境(要素C)发挥的作用。所以,接着往下算,如果同性别异卵双生子身高的相关度或相似度为55%,那么同卵双生子与异卵双生子的相似度差异就是40%(95%-55%),乘以2倍之后,我们就能得到加性遗传力的估计值为80%。遗传因素的影响是80%,也就意味着环境因素的影响是20%,而我们已经知道了独有的、非共有环境的影响是5%,那么共有的、共同环境的影响就是15%。这些数字与发达国家对身高的普遍预测结果相差不大。因为我们的目的是研究社会行为的生物学根源,所以让我们把注意力放到遗传因素上——就是这个例子中的那80%。
这个案例有以下几个关键性的假设:首先,整个估算过程都假定我们能准确分辨一对双生子是同卵还是异卵。其次,ACE模型建立在异卵双生子平均有50%的基因(更确切地说是与给定性状相关的基因)相同的假设之上(这里我们不对同卵双生子的基因100%相同做出质疑,尽管已经有一些新的研究表明,也许我们也应该质疑一下)。最后,使用ACE模型的前提是,我们必须假设异卵双生子所处环境的一致性与同卵双生子相同——这个假定通常被称为平等环境假设。
所以,我们姑且假设科学家能准确辨别双生子的卵性(zygostity,指受精卵的个数,即同卵还是异卵),稍后我们会继续讨论这个问题。第二个假设(异卵双生子的基因关联性为50%)乍看起来无懈可击,因为孩子的染色体各自包含了父母的一半,所以亲代和子代之间确实有50%的基因相同。但是,虽然异卵双生子每人都与自己的父亲或母亲有一半的基因相同,但那并不一定是“相同的”一半。也就是说,虽然同性别异卵双生子平均来说有一半的基因相同,但有些异卵双生兄弟或姐妹的相同基因会多于或少于一半。这个现象是由两个因素引起的,第一个因素是运气:双生子得到了父母二人每人手里一半的牌,但来自父亲和母亲的牌有多少是一样的,这就得看运气了。所以,有些异卵双生子的基因相似度仅仅与同父异母,或同母异父的兄弟姐妹差不多,有些却高得接近同卵双生子的水平。这个问题并不影响ACE模型的使用,因为我们假设的是异卵双生子平均有50%的基因相同。但是第二个因素——选型婚配确实会影响到双生子之间的关联性,因为这个因素能导致平均值不再是50%(升高或降低),从而使结果产生偏差。也就是说,如果一对父母的基因相似度比人群中随机两个个体之间的相似度要高(即不是随机配对,而是选型配对),那么子女(包括异卵双生子)之间的基因相似度就要比我们估计的50%高;而如果一对父母的基因相似度比人群中随机两个陌生人之间的相似度还要低,即为负选型婚配(negative assortative mating)(我们将在第四章讨论基因选型婚配)。这对ACE模型造成的影响是,受试双生子的父母如果大多是正选型婚配(positive assortative mating),我们就会低估遗传因素对某一表型的影响;而如果存在负选型婚配,我们得出的遗传力就会比实际偏高。现有的所有证据都表明,无论是对基因组的整体研究,还是对某性状标志基因的研究,都存在正选型婚配的问题。这个问题导致ACE模型的假设不再成立,然而这却意味着遗传力可能被低估了,而不是高估!换言之,我们一般在计算时假设同卵双生子遗传因素的一致性为100%,是异卵双生子的(50%)2倍。所以,当存在正选型婚配时,由于父母双方的基因比较相似,异卵双生子的基因相似度就会高于50%,他们实际存在的基因差异就比假设的要小。假设正选型婚配普遍存在,比如,个子高的人更愿意跟个子高的人结婚,个子矮的人更愿意跟个子矮的人结婚,父母的身高基因非常相似,那么在这种情况下,异卵双生子身高基因的相似度也会升高,比如说,升高到67%,这样异卵双生子之间基因的相似度与同卵双生子的差异就只有33%(100%-67%)了。我们要想百分之百地估算出遗传因素的效应,其实应该用同卵与异卵双生子基因相似度的差异乘以3,而不是乘以2。如果仍然只乘以2的话,正选型婚配就会导致加性遗传力被低估。
ACE模型的第三个关键假设——异卵双生子所处环境的一致性与同卵双生子相同,情况就大不一样了。这个假设的意思是,对于我们感兴趣的某个性状,如果我们发现同卵双生子在这个性状上的相似度比异卵双生子高,这完全是因为同卵双生子在基因方面的相关度更高,而不是因为他们所处(与该性状相关的)环境的一致性比异卵双生子高。这个假设会有什么实际的影响?有些研究者错误地认为,在同卵双生子之间一致,而在异卵双生子之间不一致的任何环境差异都会带来问题,但其实并不是这样。如果一对同卵双生子因为智力相当而上了层次相当的数学课程,那么相对于因为先天数学能力差异而上了不同层次数学课程的异卵双生子,前者在环境上更高的一致性就是更高的基因相似度的直接结果,应当被归入要素A。同卵双生子的朋友等方面都比较相像也是这个道理,因为他们的个性可能就比较相像。
但是,如果人们对待同卵双生子的方式也类似(因为两个一模一样的人本身就会让其他人对他们产生“特别的”反应),那就会有问题了。想象有这么一个世界,兄弟姐妹之间基因相似度的范围是0~100%,相似度达到90%的兄弟或姐妹很常见,碰巧达到100%(同卵双生子)也并非罕见。我们也许可以假设基因相似度在43%~48%的兄弟姐妹所处环境的一致性,与相似度在95%~100%的兄弟姐妹一样。那么当基因相似度达到100%(同卵双生)时,基因的相似度就自然会导致他们所处环境的一致性提高。
然而,在我们生活的世界中要想达到100%并不容易。而且,100%的相似度也有其问题。具体来说,一个问题是,同卵双生子会得到特殊的对待,因此他们环境的一致性会较高,高于单纯由于基因相似度而产生的一致性。例如,同卵双生子更容易被当成对方,他们在一起的时间也会不成比例地多于其他类型的兄弟姐妹(这些都违背了ACE模型的假设)。这个现象与同卵双生子通常会上同样的数学课程,或者朋友数量相差不多有着本质的差异,因为后者源于先天的相似度,与ACE模型的假设不冲突。除此之外,同卵双生子会对ACE模型产生的另一个干扰是异位显性(epistasis)。异位显性(我们将在第七章进行更详细的讨论)是指两个非等位基因组合在一起时会引发某种特殊的性状。如果整个基因组中的所有基因都能相互作用,从而导致某种性状产生,那么因为同卵双生子比其他类型的兄弟姐妹基因更为相似,所以除了这些基因的加性效应之外,他们产生相同基因组合的可能性也更高。
异位显性、易混淆性(confusability)、更大程度的交叉社会化(cross-socialization)等同卵双生子特有的属性,意味着同卵双生子本身的影响可能会超过(至少相当于)基因相同带来的影响。用社会科学的行话来说就是,以同卵双生子为研究对象会带来外部效度(external validity)问题——由于同卵双生子的特殊性,我们可能无法把从他们身上得出的任何研究结论推广到其他人群。
所以,以双生子为研究对象得出的一切遗传力信息,从是否喜欢混合动力汽车和芥末(遗传力分别是37%和22%18)到喜欢爵士乐还是歌剧(遗传力分别是42%和39%19),再到教育情况(遗传力是40%20)和几岁开始抽烟(遗传力是44%21),似乎毫无意义。为了在一定程度上解决这个问题,研究者对基本研究设计做了微调,引入了基因相似度不同的其他亲属,这就是扩展双生子模型。例如,一对同卵双生子分别成为父母之后,他们的孩子互为堂/表亲关系,这些孩子之间的基因相似度(平均值为25%,而第一代堂/表亲的基因相似度平均只有15%)跟同父异母或同母异父的同胞类似,只不过他们不生活在一起。如果通过比较这些孩子与第一代堂/表亲的孩子估算出的遗传力,与之前通过比较同卵双生子和异卵双生子估算出的遗传力近似,那我们对之前数据的把握就要大一些。当然,尽管排除了一个维度的假设,但在其他方面,这两种方法对双生子与环境的前提假设还是相同的。
由于同卵双生子的特殊经验,根据他们得出的结论在多大程度上能推广到其他因素还尚有疑问。于是我们利用分子标记法(molecular marker)对双生子模型的一个基本假设发起了挑战:“科研工作者(和双生子自己)能准确地分辨一对双生子是同卵还是异卵。”过去行为遗传学家只能靠自己的双眼、调查问卷和双生子家庭自己的感觉去判定一对同性别的双生子是同卵还是异卵,但现在不同了,我们只要反复对比一对兄弟或姐妹的同一段高度可变性(多态的)DNA片段,就能知道准确答案(有些DNA片段在所有人身上都一样,而有些却在不同的人身上差异很大,所以很适合用于案件侦破、亲子鉴定、同卵双生子验证) 。如果一对双生子的一系列关键性标志物都吻合(比如,在被检测的位点上都有碱基C或T,或者有相同数量的重复碱基序列,如AGG、AGG、AGG、AGG),因为巧合导致这种现象的可能性微乎其微,因此这对双生子应该是同卵的。而如果他们只有一个位点不同,那么他们一定是异卵的。比起诸如“他们是不是很像同一个豆荚里的两颗豌豆,或者同一株上两个豆荚里的豌豆”(这个问题曾经被用来辨别双生子)这样的问题,我们可以使用分子遗传学来更准确地分析双生子的卵性。
我们曾经研究过的同性别双生子中,就有很大一部分的卵性被搞错了!在美国青春期到成年期健康纵向追踪研究(Add Health)的双生子研究对象中,大约有18%的同性别双生子搞错了自己的卵性。在这些搞错的情况中,本来是同卵却以为自己是异卵的占大多数。这可以理解,因为家里人往往会认为长得一模一样的双生子才是同卵双生子,但其实同卵双生子在身体上可以有很多不同——从出生时就会表现出来,因为胎盘结构的原因,双生子之一可能在子宫内吸收了更多的营养,所以双生子出生时的体重可能会有明显的差异。
如果你是双生子之一,当你发现自己对从小与自己住同一间卧室的人竟然看走了眼时,也许会感觉有点受伤,但对科研工作者来说,这能很好地检验ACE模型在“平等环境假设”不成立时是否依然有效。通过研究被误认为是异卵双生子的同卵双生子,我们就可以看到当没有来自外界环境的“特殊对待”时,遗传力估算值是否会发生变化;相反的情况则可以用来进行交叉检验。
令我们大吃一惊的是,用错认的同卵双生子代替真正的同卵双生子(或用错认的异卵双生子代替真正的异卵双生子)之后,估算出的各种性状遗传力均未降低。我们使用了3组不同的数据(2组来自美国,1组来自瑞典),样本中被错认的双生子有的是被自己错认的,有的是被研究人员(通过观察和提出一系列问题来判别,准确度比前者高,错认率约为5%)错认的。所有这些方法和样本得出的结果都有效。我们这些质疑“平等环境假设”的准确性,认为行为遗传学家犯了根本性错误的社会科学家,最终反而是帮行为遗传学家证明了他们“朴素的”ACE模型。
早在我们尝试否定双生子研究方法却“未遂”之前,就已经出现了一系列回避“奇特的”双生子的新方法。它们得益于基因革命和价格低廉的基因检测芯片的广泛普及。既然科学家现在可以对大样本的研究对象进行基因检测,就不需要再去猜测某个家族谱系中两个个体(如兄弟或姐妹)之间的基因相似度,直接检测就可以了。具体方法是利用基因芯片来分析检查两个个体的全部46条染色体,看看在这100多万个碱基中,两人有多少碱基相匹配。我们可以这样理解这种方法的原理。先把有100万个碱基的片段想象成只有10个碱基,在这个(随机)选定的序列上,每个位点的碱基都有两种可能性(我们在这里只使用双等位基因来举例,也就是说,染色体每个位点上的碱基只会是四种碱基中的两种,此处假设为A和C)。在这两种碱基中,我们把其中一个称为稀有碱基(在典型人群中比较少见),另一个称为参考碱基。这样我们就可以分别来看两个人染色体上10个位点总共有0个、1个还是2个稀有碱基。假设49%的研究对象有碱基A,而51%的研究对象有碱基C,那么C就是参考碱基。然后我们对所有的研究对象进行基因检测,并对他们每条染色体上的前10个位点进行评分——基因型是CC得0分;是AC或CA得1分;是AA则得2分。10个位点都评完分之后(当然,在实际研究中,我们在每个位点要找的碱基可能是不一样的),我们就可以计算出两个个体在每个位点的相似度(即相关性),再把这10个位点的评分加起来,就能计算出总体的相关度。
如果把样本中的每一对研究对象都这样分析一遍,我们就可以知道,基因型更相似的人,是否在我们感兴趣的表型上更相似;换句话说,基因的相似度是否预示着某些性状(如身高或受教育程度)的相似。这些新方法将研究对象随机分组,每组两人之间的基因相似度有高有低,然后分析他们在表型上的相似度在多大程度上受基因影响,所以与双生子研究方法并没有太大的不同,唯一的区别是,在ACE模型中,基因的相似度分别被假设为100%和50%,而以没有亲属关系的人为研究对象的新方法可能是在探讨基因相似度为0.5%或1%的两个人之间的差异。这些新方法的好处是,我们不必再为如何从双生子推广到其他人群而苦恼了,因为我们现在可以直接分析“其他人群”。现在,第一组被试的整体基因组可能有0.01的正相关(即基因相似度比随机选取的其他个体高1%),第二组相关度为0,第三组则是略微负相关。而且人们发现,在已发表的研究论文中,使用这种方法估算出的遗传力只有双生子研究得出的一半(见第三章对遗传力缺失的讨论)。
但是,我们对这种研究设计背后的假设也持怀疑态度。是否存在这样一种可能:我们观察到的基因相似度与性状相似度之间的关联,其实并不是基因的作用,而是基因冒领了环境的功劳?这就是所谓的人群结构(population structure)或人群分层(population stratification)问题,另一个术语是“筷子问题”(chopsticks problem),是群体遗传学家(population genetics)迪安·哈默尔(Dean Hamer)和列弗·西罗塔(Lev Sirota)给起的名字。想象把所有美国人作为一个样本,你对这个样本进行研究之后,意外地在你的数据中发现第16条染色体上有一个基因标记极有可能决定了一个人是否使用筷子。你大喜过望,忙不迭地发表论文,说明你发现了使用筷子的基因。然而没过多久,你的研究伙伴就建议你把数据按种族分开,各自再重新分析一遍。你在重新分析的时候就会发现,这个特殊的等位基因或基因标记(见第一章)在各种族的分布情况是这样的:白人98%是C, 2%是A;黑人90%是C,10%是A;拉丁裔人94%是C,6%是A;然后意外出现了,亚裔人18%是C,82%是A。这时候你觉得好像发现了一个与东亚人群有关的基因,这个基因使他们使用筷子,而不是用刀叉。但如果要检验用筷子是否确实由基因决定,还是仅仅由历史原因引起,跟不同大洲人群的等位基因频率差异构成了巧合,那就要看同一个种族的人(甚至应该看同一个家族,如兄弟姐妹)之间,这个基因与用筷子的关系是否依然存在。但是,当我们再进一步,单独分析白人,或单独分析黑人、亚裔人、拉丁裔人时,发现等位基因A(或C)与是否用筷子进餐毫无关联。你只是被人群分层所迷惑。你以为自己发现了某种文化习俗在根本上是由生物学性状决定的,结果你只不过发现了一个与族裔信息吻合度很高的基因标记而已。
回到前面的话题,因为像上文那样不考虑人群分层进行的分析会造成结果偏倚,我们把人群分层也纳入新方法中,然而估算出的遗传力基本没有变化(感兴趣的读者可以阅读附录2)。所以,我们从社会科学的角度证明遗传学家用错了的努力又一次以失败而告终!