打开网易新闻 查看更多图片

正文共:1427字

预计阅读时间:4分钟

大肠杆菌产生3000多种不同的蛋白质;一个人有大约20000个基因,可以产生超过一百万种不同的蛋白质。在这两个物种中,每种类型的蛋白质都有一个独特的氨基酸序列,赋予特定的三维结构。这种结构又赋予了一种独特的功能。

氨基酸序列是更广泛的生物信息领域的重要元素。它们是以基因形式存储在DNA中的信息的主要功能表达。这些序列并不是随机的。每种蛋白质都有不同数量和序列的氨基酸残基。正如我们将在第4章中看到的,蛋白质的一级结构决定了它如何折叠成独特的三维结构,而这反过来又决定了蛋白质的功能。

一些简单的观察结果说明了蛋白质一级结构或氨基酸序列的功能重要性。首先,正如我们已经注意到的,具有不同功能的蛋白质总是具有不同的氨基酸序列。其次,数千种人类遗传疾病已被追踪到产生活性较低或活性改变的蛋白质。这种改变可以是氨基酸序列的单一变化(如第5章所述的镰状细胞病),也可以是多肽链的大部分缺失(如在大多数杜氏肌营养不良症中:编码蛋白肌营养不良蛋白的基因的大量缺失导致产生缩短的、无活性蛋白)。最后,通过比较不同物种的功能相似的蛋白质,我们发现这些蛋白质通常具有相似的氨基酸序列。因此,蛋白质一级结构和功能之间的紧密联系是显而易见的。

特定蛋白质的氨基酸序列不是绝对固定的或不变的。人类中几乎所有的蛋白质都是多态性的,在人群中具有氨基酸序列变异。许多人类蛋白质即使在个体内也是多态的,氨基酸变异的发生是由于本文第 III 部分将描述的过程。其中一些变异对蛋白质的功能几乎没有影响;其他可能会显著影响功能。此外,在亲缘关系较远的物种中执行大致相似功能的蛋白质在总体大小和氨基酸序列上可能存在很大差异。

尽管一级结构的某些区域中的氨基酸序列可能会有很大的变化,而不会影响生物功能,但大多数蛋白质含有对其功能至关重要的关键区域,因此具有保守的序列。整个序列中至关重要的部分因蛋白质而异,这使得将序列与三维结构和结构与功能联系起来的任务变得复杂。然而,在我们进一步考虑这个问题之前,我们必须研究序列信息是如何获得的。

1953年,Frederick Sanger计算出了胰岛素多肽链中的氨基酸残基序列(图3-24),这让许多长期以来认为确定多肽的氨基酸序列将是一项极其困难的任务。同年,Watson和Crick对DNA结构的阐明揭示了DNA和蛋白质序列之间的可能关系。在这些发现后不到十年,将DNA的核苷酸序列与蛋白质分子的氨基酸序列相关的遗传密码就被阐明了(第27章)。

打开网易新闻 查看更多图片

蛋白质的氨基酸序列现在通常是间接来源于基因组数据库中的DNA序列。然而,一系列源自传统多肽测序方法的技术为更广泛的蛋白质化学领域做出了重要贡献。Sanger用于对胰岛素进行测序的方法基于从氨基末端对蛋白质进行直接化学测序的经典方法,即由Pehr Edman开发的两步Edman降解法。

来源:国家基因库大数据平台