狭义相对论的时空观
狭义相对论都听说过,一些公式甚至在中学就已经在课本上给出。 然而这些公式都并不直观。 最近在看电磁学,这里的很多东西,要理解,非需要理解相对论不可。
常常会说相对论把时间和空间统一在一起考虑了,也就是所谓的“四维时空”。 当想要了解具体的东西的时候,维基百科等资料往往会直接假定读者已经精通了微分几何,然后啪啪啪给出几个向量或者矩阵。 这对于我这样的小白是非常不友好的。 这里我尝试绕过微分几何里才有的一些数学概念,直接来讨论这个闵什么四维时空,力求得到一个直观的结论。
闵可夫斯基时空
这个空间的长度单位也是现实中的长度单位。 有四个维度,后三个就是现实中的三维,第一个维度是 $ct$,就是把时间乘以光速 $c$ 变成长度的单位。 有一些资料会把 $ict$ 作为第一个维度,但这会让数学基础模糊不清(虚数的坐标轴是什么玩意儿?)。 历史上曾经有这样的倾向,但最终还是倾向于使用 $ct$。
暂时假定这几个坐标轴是相互垂直的(之后会看到,这里假定的垂直毫无意义,只是为了方便在一开始时直观理解)。 那么可以画出原点处的光锥,这个光锥的侧面就是两个坐标轴的角平分线。 可以看到:
- 任意惯性参考系中,测量到的任意粒子的速度,都会位于这个光锥内或者最多是这个光锥的边界上,也就是和时间轴的夹角小于 45 度。
- 同样是在惯性参考系中,任意两个事件之差对应的向量(即 $(c(t_1-t_2), x_1-x_2, y_1-y_2, z_1-z_2)$), 如果在这个光锥里(与时间轴的夹角小于与空间超平面的夹角),那么这两个事件是可能互相联系的, 无论如何变换(惯性)参考系,事件的先后顺序都不会改变。 然而,如果这个向量在光锥外(例如在某个参考系中观察到在不同两地同时发生的事件),那么这两个事件是不可能互相联系的, 通过变换参考系,可以改变事件的先后顺序。 这两个结果是可以代公式来检验它的正确性的。 但很快就可以看到,它其实会是一个非常直观的结果,根本不需要任何计算。
斜坐标系与洛仑兹变换
从一个惯性参考系变换到另一个惯性参考系去观察同一个事件,就像是从一个坐标系变换到另一个坐标系去观察同一个点。 问题是,这两个变换是如何关联的?
- 如果两个参考系相对静止,只是零点不同,那么在闵可夫斯基时空中,显然也就是把参考系平移过去。
- 如果两个参考系相对运动,坐标系是如何变换过去的?转动?
小时百科给了我想要的结论。 实际上并不是转动,而是将一个互相垂直的坐标系变得并不互相垂直, 时间轴和一个空间轴(两个参考系相对运动的那个方向的空间轴)同时向它们的角平分线倾斜一个相同的角度,然后再同时拉伸一个相同的倍数。 具体来说:
- 倾斜的角度是 $\arctan(v/c)$,也就恰好是把事件轴倾斜到两个坐标轴的相对速度对应的那个方向上。
- 坐标轴拉伸的比例是 $\cfrac{1}{\sqrt{\cos[2]\theta-\sin[2]\theta}}$, 或者说在变换后的坐标上再乘以 $\sqrt{\cos[2]\theta-\sin[2]\theta}$。
然后将同一个点的坐标分解到新得到的斜坐标系中,就得到了事件在新的参考系中的表示。我检验过了,是正确的。 具体来说,假定第二个参考系相对于第一个参考系朝着 $x$ 轴正方向运动,速率为 $v$; 假定某事件在第一个参考系中的坐标为 $(ct, x)$,在第二个参考系中的坐标为 $(ct’, x’)$,那么就有:
$$ \begin{aligned} ct’ &= \frac{ct - x\tan\theta}{\sqrt{1-\tan[2]\theta}} \\ x’ &= \frac{x - ct\tan\theta}{\sqrt{1-\tan[2]\theta}} \end{aligned} $$
伽利略变换对应的则是,仅仅倾斜 $ct$ 轴,并且也只拉伸 $ct$ 轴 (想象将所有点都沿着 x 方向平移一点,平移的幅度随着 ct 增加而增加,拉伸的幅度是 $\cfrac{1}{\cos\theta}$)。 考虑到日常生活中,大多运动的速度都远远小于光速(也就是速度向量非常接近 $ct$ 轴),事件也往往落在 $ct$ 轴附近。 在这种情况下,转换坐标轴导致的 $ct$ 轴的倾斜角度和拉伸比例是无法忽略的影响,而空间轴的旋转和拉伸变得可以忽略, 因此就恰好符合了伽利略变换的近似。
考虑变换前后的坐标轴,容易得到:
- 光锥依然是时间与空间的角平分线。或者说,光锥曲面与具体的坐标系无关,无论如何它都保持在空间与时间的角平分线上。
- 光锥里的向量,无论如何变换,都依然在光锥里。 它相对于 $ct$ 轴夹角和方位(对应于运动速率和方向)会改变,但不可能变换到光锥外;并且它到 $ct$ 轴的分量的符号不会改变(先后不会颠倒)。
- 光锥外的向量,无论如何变换,都依然在光锥外。 如果它一开始就比较接近那个发生变换的空间轴,那么它在 $ct$ 轴上的分量的符号将可能会在变换后改变,也就是事件的先后顺序可能会改变。
一切都变得非常合理,合理得不得了,狭义相对论变成了幼儿园的折纸或者小棍。 除了那个神秘的拉伸比例 $\sqrt{\cos[2]\theta-\sin[2]\theta}=\sqrt{\cos{2\theta}}$, 像是尽力在保证某个量(与表示出来的坐标有关)在变换前后不变。 实际上它是在维护 $-c^2t^2+x^2+y^2+z^2$ 不变。 但这个量在几何上确实没有看出什么直观的意义,我尝试了一下没有找到。 或许如果一开始就假定时间坐标轴与空间不垂直(实际上没有任何理由认为某个参考系对应的坐标轴是垂直的), 可以比较容易看到这个量的意义。