打开网易新闻 查看更多图片

阿尔伯特·爱因斯坦的质能方程源于他的相对论,许多相对主义者高呼“一切都是相对的”。事实上,爱因斯坦将他的理论命名为“相对论”,是因为它是对牛顿力学中的相对运动规则的修正。

在牛顿力学中,运动是相对的,并且依赖于参考系。但爱因斯坦意识到:一些特定的物理现象根本不是相对的,而是绝对的。由此,他发现了一种新的物理学,在这种物理学中,物体在快速移动时长度会收缩,时间会变慢,质量会无限制地增加。相对论让我们对宇宙的起源和宇宙的结构有了迄今为止最好的理解。

相对论已被证实,并且得到了实际的应用。全球定位系统(GPS)只有考虑了相对论效应才能有效运行。同样的道理也适用于粒子加速器,例如大型强子对撞机,它让我们成功地发现了希格斯玻色子(质量起源的粒子)。现代通讯速度已经非常快了,但遇到一个限制——光速,任何信息的传递都不能超过光速。

相对论包括狭义相对论和广义相对论。狭义相对论研究的是没有引力的空间、时间和物质;而广义相对论考虑了引力。这两个理论的灵感都来自于很难将牛顿物理学与观测结果相协调。

在牛顿时代,物理学似乎相当简单直观。空间就是空间,时间就是时间,两者永远不会有联系。空间几何是欧几里得的几何。时间是独立于空间的,这一点对于所有的观察者来说都是一样的(前提是他们已经同步了自己的时钟)。物体的质量和大小在它移动时不会改变,而时间在任何地方总是以相同的速度流逝。但是当爱因斯坦重新构建了物理学之后,所有这些观点被证明是错误的

牛顿对宇宙的描述是一个近似值,这个近似是极其准确的(只要物体的速度比光速慢很多)。那么如果以光速或近光速运动会怎样?物理学家已经证明了光是一种波,麦克斯韦的方程也证实了这一点。但是光的波动性面临一个新问题。海浪是水里的波,声波是空气中的波,地震是地球上的波,那么光是哪里的波?

打开网易新闻 查看更多图片

从数学上讲,它们是电磁场中的波,我们假定电磁场遍及整个空间。当电磁场被“激发”时,我们能观察(探测)到电磁波。如果电磁场没有被激发,它就像平静的海面,安静的空气和地球,没有波浪,没有声音,没有地震。

物理学中所有已知的波都是有形的波,都需要有介质才能传播。所以物理学家们一开始认为存在某种支持电磁波的介质,称它为“以太”。介质越坚硬,振动传播越快,而光非常快,所以以太必须非常坚硬。由于我们并没有看到或摸到以太,因此假设它没有质量,没有黏性,不可压缩,并且对所有形式的辐射都是完全透明的。

几乎所有的物理学家都假设以太的存在。此外,以太的存在原则上是可以被探测到的。因为光在真空中的速度是一个常数c,根据牛顿力学,我们不得不问这样一个问题:相对于“什么”速度是c?如果在两个不同的、相对运动的参照系中测量一个物体的速度,那么会得到不同的答案。光速不变性(光在任何参考系中的速度都是c)暗示了一个明显的答案:相对于以太。但这有点草率,因为两个相对运动的参考系不可能同时相对于以太静止。

对物理学家来说,找到一个特殊的参考系,就相当于找到了宇宙的中心,可以定义“绝对”的运动,其意义是极其重大的。直到麦克斯韦1879 年去世之前,他都非常关心能否确定地球绝对运动的问题。

地球在以太中绕着太阳公转,但从地球上看就好像以太在沿相反方向移动,形成一种以太风。所以根据牛顿力学,光速应该在两个极端之间变化:c加上地球相对于以太的运动的贡献,和c减去相同的贡献。在19世纪后期,人们进行了许多实验以证明以太的存在,但结果都不确定。要么没有差异,要么是实验误差。更糟糕的是,地球可能会拖着以太一起走。地球相对于以太的运动总是为零。

1887年,阿尔伯特·迈克尔逊和爱德华·莫雷进行了史上最著名的物理实验之一。他们设计了一种仪器来探测光速在两个方向上的微小变化。但地球相对于以太是在运动的,不可能以相同的相对速度在两个不同的方向上运动,除非它碰巧沿着这两条方向的等分线运动,在这种情况下,只需稍微旋转一下仪器,然后再试一次。

  • 实验原理示意图

这个仪器很小,使用一面半镀银的镜子将光束分成两部分,一部分穿过镜子,另一部分以正确的角度反射。每一束光束沿着它的路径被反射回来,然后两束光束再次结合,以击中探测器(E)。仪器经过调整,使两个路径长度相同。

最初的光束被设定为相干的,也就是说所有的波都有相同的相位和峰值。两束光的光速差会导致它们的相位相对移动,因此它们的峰值会出现在不同的地方,进而导致两束波之间的干涉,出现“衍射条纹”。地球相对于以太的运动会导致条纹移动,但这种影响是微小的:根据已知的地球相对于太阳的运动,衍射条纹将会移动大约一个条纹宽度的4%。通过多重反射,可以让条纹移动增加到40%,这就足以被探测到了。为了避免地球恰好沿着这两束光的平分线运动的巧合,迈克尔逊和莫雷将仪器漂浮在一桶水银上,这样它就可以轻松而快速地旋转。这样就可以观察到条纹以同样快的速度移动。

打开网易新闻 查看更多图片

这是一个精细、准确的实验。结果是完全意外的。条纹没有移动40%的宽度,而且是一点都没有移动。

这个结果不仅否定了以太,还威胁到了麦克斯韦的电磁学理论。这意味着,相对于移动的参照系,光并不以牛顿的方式运动。这个问题可以追溯到麦克斯韦方程的数学性质,以及它们(方程)是如何相对于运动坐标系进行变换的。爱尔兰物理学家乔治·菲茨杰拉德和荷兰物理学家亨德里克·洛伦茨分别在1892年和1895年提出了一种大胆的猜想来解决这个问题,

如果一个运动的物体在其运动方向上稍稍收缩,收缩的幅度刚好合适,那么迈克尔逊-莫雷实验所希望检测到的相位变化就会被光所经过的路径长度的变化完全抵消。

洛伦兹证明,这个“洛伦兹-菲茨杰拉德收缩”也解决了麦克斯韦方程的数学难题。研究表明,包括光在内的电磁学实验结果并不依赖于参照系的相对运动。庞加莱也一直在从事类似的研究。

1905年,爱因斯坦在一篇题为《论运动物体的电动力学》的论文中,发展并扩展了先前关于相对运动理论的猜想。他的研究在两个方面超过了前人。他证明了相对运动的数学公式的必要改变不仅仅是一个解决电磁学问题的要求,也是所有物理定律的要求。因此,新的数学必须是对现实的真实描述,必须与实验更加一致。这才是真正的物理学。

牛顿所使用的相对运动的观点可以追溯到更早的伽利略。在他1632年的《关于两个主要世界体系的对话》中,伽利略讨论了一艘在完全平静的海面上匀速航行的船,他认为甲板下进行的任何力学实验都无法证明船在移动。这就是伽利略的相对论原理。在力学中,在两个相对于对方以匀速运动的坐标系中所作的观测是没有区别的。特别地,没有所谓的“静止”的特殊参照系。爱因斯坦的出发点是同样的原理,但有一个额外的条件。它必须不仅适用于力学,而且适用于所有物理定律

对爱因斯坦来说,迈克尔逊-莫雷实验只是一个额外证据,他的新理论正确的证明在于他的广义相对论,以及物理定律的数学结构。

爱因斯坦的“新理论”被称为狭义相对论,因为它只适用于惯性参照系。根据狭义相对论,有三个重要的结论:如果一个参照系相对于另一个参照系匀速运动,那么在该参照系中测量到的长度沿着运动方向收缩质量增加时间变慢。这三种效应由基本的能量和动量守恒定律联系在一起。

这些效应的公式用来描述一个坐标系中的测量值与另一个坐标系中的测量值之间的关系。简单说,如果一个物体能以接近光速的速度运动,那么它的长度就会变得非常小,它的时间会非常慢,它的质量会变得非常大。我简单介绍一下这里的数学。这一切都来自于勾股定理。科学中最古老的方程式会引出最新的方程式。

  • 左图:在宇航员的参考系统中进行的实验。右图:同样的实验在地面观测者的参考系中进行。

左图从宇航员的视角显示了光的路径。对他们来说,光是笔直向上的。由于光以c的速度传播,所以传播的距离为cT。右图显示了从地面观测者的视角来看光的路径。宇宙飞船移动了一段距离,所以光沿着对角线移动。由于对地面观测者来说,光的传播速度也是c,所以对角线的长度为ct。根据勾股定理,

打开网易新闻 查看更多图片

显然,T<t。

为了推导洛伦兹-菲茨杰拉德收缩,我们现在假设宇宙飞船以速度v飞行到距离x的行星,那么经过的时间是t = x/v。但前面的公式表明,对于宇航员来说,所花费的时间是T,而不是t。对于他们来说,距离X必须满足T = X/v。因此,

显然,X<x。

质量变化的推导要稍微复杂一些,它取决于对质量的特殊解释(静止质量),所以我就不详细讲了。这个公式是,

显然,M>m。

这些方程告诉我们,物体的速度有一个上限,那就是光速。

时空几何的狭义相对论,最初是由赫尔曼·闵可夫斯基提出的。空间中一个点(x,y,z)与另一个点(X,Y,Z)之间的距离是,

取平方根得到d。闵可夫斯基时空有四个坐标(x,y,z,t),三个空间加一个时间,一个点被称为事件(一个在特定时间观察到的空间位置。距离公式非常相似:

距离d称为间隔。只有当等式右边为正时,平方根才为实数。

正如我们所看到的,物理学家之前做过实验,明确地证明光是一种波,而麦克斯韦证明了光是一种电磁波。然而,到1905年,物理学家逐渐明白,尽管有足够的证据证明光的波动性质,但在某些情况下,光的行为就像粒子一样。在那一年,爱因斯坦用这个想法来解释光电效应的一些特征。他认为,只有当光以离散的形式出现时,实验数据才能解释得通。

这个令人困惑的发现是通向量子力学的关键步骤之一。奇怪的是,这个典型的量子力学思想对爱因斯坦的相对论公式至关重要。为了推导出质量与能量的关系,爱因斯坦考虑了一个发射一对光子的设备会发生什么。为了简化计算,他考虑一维空间的情况,让设备沿直线运动。其基本思想是考虑设备在两个不同的参考系中,一个参考系随着设备一起运动,所以设备在那个参考系看起来是静止的。另一个参考系相对于设备以很小的,非零的速度运动。

爱因斯坦假设这两个光子的能量相等,但发射方向相反。它们的速度相等且相反,所以设备的速度(在两个参考系中)在光子发射时不会改变。然后他计算了在设备发射光子对之前和之后系统的能量。通过假设能量一定是守恒的,他得到了一个表达式,将由发射光子引起的系统能量的变化与其(相对论)质量的变化联系起来。其结果是:

合理地假设一个质量为零的物体能量为零,然后就得到了这个结论

这就是著名的质能方程,E表示能量,m表示质量。

除了计算之外,爱因斯坦还必须解释它们的含义。他特别指出,在一个物体处于静止状态的坐标系中,公式给出的能量应该被认为是它的“内部”能量,因为它是由亚原子粒子组成的,每个亚原子粒子都有自己的能量。在运动坐标系中,还有动能。

爱因斯坦并不满足于狭义相对论。它只是一个关于空间、时间、物质和电磁的统一理论,但它忽略了一个重要的成分。

引力

爱因斯坦认为“所有的物理定律”都必须满足相对论。万有引力定律当然应该是其中之一。但事实并非如此。牛顿的平方反比定律没有在参照系之间正确地变换。所以爱因斯坦决定改变牛顿定律。

这花了他十年的时间。他的出发点是计算出相对论对“在引力影响下自由运动的观察者”的影响,例如,在一个自由下落的电梯中。他得到了数学家马塞尔•格罗斯曼的帮助,格罗斯曼向他介绍了一个非常重要的数学领域——微分几何。这是从黎曼流形概念发展而来的。黎曼度规可以写成一个3 × 3的矩阵,这是一个对称张量。一个意大利数学家学派,继承了黎曼的思想并将其发展成为张量微积分

从1912年起,爱因斯坦就确信,相对论引力理论的关键在于他要用张量演算来重新表述他的思想,但要在四维时空而不是三维空间中。黎曼几何允许任意维度的存在,数学家们已经为爱因斯坦奠定了数学基础。爱因斯坦最终推导出了我们现在所说的爱因斯坦场方程

这里R,g和T是张量(定义物理性质和根据微分几何规则变换的量),k是常数。下表是遍历时空的四个坐标,所以每个张量是一个4 × 4=16个不同的变量。它们都是对称的,也就是说,当下标(miu和niu)被交换时它们不会改变,因此变量被减少到10个。所以这个公式包含了10个方程,这就是为什么我们经常用复数来表示它们(比较麦克斯韦方程)。R是黎曼度规:它定义了时空的形状。g是里奇曲率张量,它是对黎曼曲率的修正。T是能量-动量张量,它描述了这两个基本量如何依赖于相关的时空事件的。1915年,爱因斯坦向普鲁士科学院提交了他的方程式。他把他的最新成果称为广义相对论

我们可以用几何的方法来解释爱因斯坦的场方程。最基本的创新是,引不是一种力,而是时空的曲率。就像勾股定理适用于平面,但不适用于正或负弯曲的非欧几里德空间一样。在没有引力的情况下,时空是闵可夫斯基空间(平坦的

引力通常的描述方法是去掉时间,并将空间的维度降低到2,并得到如下图(左)所示的结果。闵可夫斯基空间的平面被扭曲了,这里显示的是一个实际的弯曲,产生了一个凹陷。在远离恒星的地方,物质或光以直线的方式传播。但是曲率导致路径弯曲,似乎有某种来自恒星的力将物质吸引到它身上(没有力,只有扭曲的时空)。然而,这个曲率的图像(左图)使空间沿着一个额外的维度变形。另一种方法是画一个由测地线、最短路径组成的网格,根据弯曲度规等距分布。它们在曲率较大的地方聚集在一起,如下图(右)。

如果时空的曲率很小,那么这个公式就会得出牛顿的万有引力定律。比较两种理论,爱因斯坦常数k为8πG/c^4,其中G为牛顿引力常数。这个常数将新理论与旧理论联系起来,并证明在大多数情况下,新理论与旧理论是一致的。即使在引力很大时,任何相对论的测试也都必须在实验室之外进行,这涉及到了天文学。

因此,爱因斯坦开始寻找行星运动中无法解释的特性,以及与牛顿不符的效应。他找到了一个可能合适的答案,水星近日点的近动。水星是离太阳最近的行星,受到最大的引力作用。如果爱因斯坦理论是正确的,水星处于一个高曲率的区域内。

水星的轨道非常接近椭圆,所以它轨道上的一些点比其他点更接近太阳。其中离太阳最近的被称为近日点。这个近日点的确切位置已经被观测了许多年,这其中有些有趣的现象,近日点缓慢地绕着太阳旋转,这种效应称为岁差;轨道椭圆的长轴正在缓慢地改变方向。这没什么,牛顿定律也预言了这一点,因为水星不是太阳系中唯一的行星,其他行星也在慢慢改变它的轨道。问题是牛顿的计算给出了错误的进动速率,轴旋转得太快了。

在牛顿模型中,水星进动率的精度约为0.7%,与观测值相比,这一数值相差很小,但足以引起法国天文学家勒维耶的注意。1846年,勒维耶分析了天王星轨道的不规则性,并预测了一颗当时还未被发现的行星——海王星,从而一举成名。他希望能重现这一壮举。他将水星近日点的近动解释为某种未知行星的干扰。他做了计算,并预测存在一颗小行星(火神星),它比水星离太阳更近。

1915年,爱因斯坦用广义相对论重新分析了行星的运动。通过一个简单的计算,他得出了43秒的岁差值。牛顿计算预测的岁差值为每世纪5560弧秒,但实际观测结果为5600弧秒,差值是40弧秒,所以每世纪大约有3弧秒岁差仍然无法解释。

广义相对论的另一个著名的天文学验证是爱因斯坦关于太阳使光线弯曲的预测。牛顿的万有引力定律也预测了这一点,但广义相对论预测的弯曲量是它的两倍。1919年的日全食期间,亚瑟·爱丁顿拍下了太阳周围区域的恒星的照片。根据广义相对论,当恒星的光线经过太阳附近时,会出现轻微的偏移。这种效应只有在日食时才会被注意到。爱丁顿证实了爱因斯坦的相对论。

到了20世纪60年代,对射频辐射进行观测已成为可能,这才确定光线的弯曲确实是牛顿预测的两倍,与爱因斯坦预测的相符。

广义相对论中最引人注目的预测出现在一个更大的尺度上——黑洞。

由于爱因斯坦的场方程包含十个变量,很难用数学公式表示出它的显式解。因此需要对方程进行简化,简化方程的标准方法是引用对称性。假设时空的初始条件是球对称的。这样就大大减少了变量的数量。1916年,德国天体物理学家卡尔·史瓦西对爱因斯坦的方程做了这样的假设(球对称),并设法用一个精确公式解出了方程,这个公式被称为史瓦西度规。他的公式有一个奇怪的点:奇点。解在离中心一定距离处变成无穷大,这个距离叫做史瓦西半径。起初,人们认为这个奇点是某种数学上的产物,它的物理意义也引起了相当大的争议。我们现在把它解释为黑洞的视界

想象一颗巨大的恒星,其辐射无法抵消其引力场。恒星开始坍缩(密度变大),密度越大,这种效应就越强,所以坍缩的速度就越快。恒星的逃逸速度也在增加。史瓦西度规告诉我们,在某个阶段,当逃逸速度等于光度时,就没有东西能逃脱了,因为没有东西能比光还快。恒星变成了一个黑洞,史瓦西半径告诉我们,在黑洞视界的范围内,没有任何东西可以逃脱。

黑洞物理是极其复杂的,这里无法展开。简单地说,大多数宇宙学家现在都相信这个预测是正确的,宇宙中有无数的黑洞,而且至少有一个黑洞潜伏在银河系的中心。

1917年,爱因斯坦将他的方程应用于整个宇宙,并假设了另一种对称:均匀性。宇宙在空间和时间的所有点上看起来都应该是一样的(在足够大的尺度上)。那时,他已经修改了方程,加入了一个“宇宙常数”Λ,并厘定了常数k的含义。方程现在是这样的,

方程的解让人惊讶,宇宙会随着时间的推移而收缩。这迫使爱因斯坦在方程中加上一个宇宙常数项,因为爱因斯坦相信宇宙是一个不变的、稳定的宇宙。1922年,亚历山大·弗里德曼发现了另一个方程,该方程预测宇宙会膨胀。它还预测了膨胀的速度。

1929年,美国天文学家埃德温·哈勃和米尔顿·休马森发现了宇宙正在膨胀的证据。遥远的星系正在远离我们,从它们发出的光频率的变化就可以看出,这就是著名的多普勒效应。

如果让膨胀时间倒流,结果发现,在过去的某个时刻,整个宇宙本质上只是一个点。在那之前,它根本不存在。在那个最原始的时刻,空间和时间都出现在著名的大爆炸理论中。大爆炸理论是由法国数学家乔治·勒梅特于1927年提出的。1964年,当射电望远镜观测到宇宙微波背景辐射时,其温度与宇宙大爆炸模型相符,宇宙学家认为勒梅特是正确的。关于大爆炸理论是另一篇文章的内容了,会涉及到标准模型、暗物质、暗能量、膨胀理论甚至热力学(彭罗斯)等。

撇开令人困惑的宇宙学领域不谈,有更普通的方法(在人类的尺度上)来验证相对论。狭义相对论可以在实验室中测试,现代测量技术提供了精确的精度。如果不考虑相对论效应,像大型强子对撞机这样的粒子加速器根本无法工作,因为在这些机器中的粒子的速度确实非常接近光速。广义相对论的大多数测试仍然是天文学的,从引力透镜到脉冲星动力学,而且精度很高。

还有一个关于相对论动力学的例子,更贴近我们的生活:卫星导航。卫星导航系统(如GPS)通过很多地球轨道卫星组成的网络来计算位置。它是基于非常精确的定时信号,由卫星发射并在地面接收到的脉冲信号。比较几颗卫星发出的信号,就可以确定接收器的位置。牛顿动力学无法给出正确的位置,因为牛顿方程中没有考虑到两个影响时间流动的效应:卫星的运动和地球的引力场

狭义相对论预测,由于相对论时间膨胀,卫星上的原子钟与地面上的原子钟相比,每天会慢7微秒(百万分之一秒)。广义相对论预测,由于地球引力的作用,地球每天将增加45微秒。最终的结果是,由于相对论的原因,卫星上的时钟每天增加38微秒。这可能看起来很小,但它对GPS信号的影响绝不是微不足道的。38微秒的误差是38000纳秒,大约是GPS可容忍误差的1500倍。如果使用牛顿动力学计算出你的车的位置,你的卫星导航系统很快就会失效,因为误差会以每天10公里的速度增长。