四维形式的电磁理论(Ⅱ)
作者|yubr
编辑|Trader Joe's
在上一章《四维形式的电磁理论(Ⅰ)》中我们推导了麦克斯韦方程的四维形式,建立了四维语言下电磁理论的基本动力学方程。
本章中,我们将用四维语言描述带电粒子在电磁场中的运动,也就是建立洛伦兹力的四维形式;我们还将显式地给出电磁场在洛伦兹变换下的具体变换规则;最后我们介绍著名的A-B效应(Aharonov–Bohm effect)。
Yakir Aharonov
David Bohm
1. 带电粒子在电磁场中的运动方程——洛伦兹力的四维形式
在我们熟悉的三维矢量语言下,带电粒子在电磁场中的运动由洛伦兹力来决定
$$
\vec{F}_{洛}=\frac{d\vec{p}}{dt}
$$
其中
$$
\vec{F}_{洛}=q\left( \vec{E}+ \frac{\vec{v}}{c}\times \vec{B}\right)
$$
但是显然,这个方程在洛伦兹变换下不是协变的,换言之,在不同的惯性系下观测到的粒子受到的洛伦兹力并不同。
为了更好地描述在不同惯性系下粒子受到的洛伦兹力的关系,我们需要用四维语言改写上面的方程。
在《四维形式的狭义相对论及其动力学》中,我们已经给出了动量和速度的四维形式,所以方程的右边很容易改写:
$$
\frac{d\vec{p}}{dt}\rightarrow \frac{dp^{\mu}}{d\tau}=m\frac{d}{d\tau}U^{\mu}=m\frac{d}{d\tau}(\gamma c,\gamma \vec{v})
$$
我们先来看时间分量:
$$
\begin{aligned}
\frac{d\gamma}{d\tau}&=\gamma\frac{d\gamma}{dt}=\gamma\frac{d}{dt} \left (1- \frac{v^2}{c^2}\right)^{-1/2}\\&=-\frac{1}{2}\gamma\left(1-\frac{v^2}{c^2}\right)^{-3/2}\left(-\frac{2\vec{v}}{c^2}\right)\cdot \frac{d\vec{v}}{dt}\\&=\gamma^4\frac{\vec{v}}{c^2}\cdot\frac{d\vec{v}}{dt}
\end{aligned}
$$
另一方面,
$$
\begin{aligned}
\vec{F}&=\frac{d\vec{p}}{dt}=\frac{d}{dt}\left(\gamma m \vec{v}\right)\\&=m\left(\frac{d\gamma}{dt}\vec{v}+\gamma \frac{d\vec{v}}{dt} \right)\\&=m\left[\frac{\gamma^3}{c^2}\left(\vec{v}\cdot \frac{d\vec{v}}{dt}\right)\vec{v}+\gamma\frac{d\vec{v}}{dt}\right]
\end{aligned}
$$
$$
\begin{aligned}
\vec{F}\cdot \vec{v}&=m\left[ \left(\frac{\gamma^3v^2}{c^2}+\gamma \right)\left(\vec{v}\cdot \frac{d\vec{v}}{dt}\right) \right]\\&=m\gamma^3\left(\vec{v}\cdot \frac{d\vec{v}}{dt}\right)
\end{aligned}
$$
所以
$$
\frac{dp^0}{d\tau}=\frac{\gamma}{c}\vec{F}\cdot\vec{v}
$$
我们再来看空间分量:
$$
\frac{d}{d\tau}\left(\gamma\vec{v}\right)=\gamma\left(\frac{d\gamma}{dt}\vec{v}+\gamma\frac{d\vec{v}}{dt}\right)=\frac{\gamma\vec{F}}{m}
$$
所以
$$
\frac{dp^i}{d\tau}=\gamma\vec{F}
$$
总结一下
$$
\frac{dp^{\mu}}{d\tau}=\left(\frac{\gamma}{c}\vec{F}\cdot\vec{v},\gamma\vec{F}\right)
$$
我们来看看它的物理含义,利用 $p^{\mu}=\left(E/c,\vec{p}\right)$ ,我们有
$$
\begin{aligned}
\frac{d}{d\tau}\left(\frac{E}{c}\right)=\frac{\gamma}{c}\vec{F}\cdot\vec{v}\Rightarrow \frac{dE}{dt}=\vec{F}\cdot\vec{v}
\end{aligned}
$$
这正是能量守恒定律
$$
\frac{d\vec{p}}{d\tau}=\gamma \vec{F}\Rightarrow \frac{d\vec{p}}{dt}=\vec{F}
$$
这正是牛顿第二定律
好,下面我们把三维力以洛伦兹力的具体形式
$$
\vec{F}=q\left( \vec{E}+ \frac{\vec{v}}{c}\times \vec{B}\right)
$$
代入,对时间分量有
$$
\begin{aligned}
\frac{dp^0}{d\tau}&=\frac{\gamma}{c}\vec{F}\cdot\vec{v}\\&=\frac{\gamma}{c}q\left(\vec{E}+\frac{\vec{v}}{c}\times \vec{B}\right)\cdot \vec{v}\\&=\frac{\gamma}{c}q \vec{E}\cdot \vec{v}=\frac{q}{c}\left(\vec{E}\cdot \gamma \vec{v}\right)\\&=\frac{q}{c}E^i U^i=\frac{q}{c}F^{i0}U^{i}\\&=\frac{q}{c}F^{0i}U_i=\frac{q}{c}F^{0\nu}U_{\nu}
\end{aligned}
$$
其中我们用到了电场强度和电磁场张量之间的关系 $E^{i}=F^{i0}$ ,这个关系在上一章 《四维形式的电磁理论(Ⅰ)》(超链接)中已经推导过了。对空间分量我们有
$$
\begin{aligned}
\frac{dp^{i}}{d\tau}&=\gamma F^{i}=\gamma q(\vec{E}+\frac{\vec{v}}{c}\times \vec{B})^{i}\\&=\frac{q}{c}\left(\gamma cE^{i}+\gamma \epsilon_{ijk}v^{j}B^{k} \right)\\&=\frac{q}{c}\left(U^{0}F^{i0}-\frac{1}{2}\epsilon^{ijk}\epsilon^{klm}U^{j}F^{lm}\right)\\&=\frac{q}{c}\left( U^{0}F^{i0} - U^{j}F^{ij}\right)\\&=\frac{q}{c}F^{i\nu}U_{\nu}
\end{aligned}
$$
其中用到了磁场强度和电磁场张量之间的关系 $B^{k}=-\frac{1}{2}\epsilon^{klm}F^{lm}$ 和恒等式 $\epsilon^{ijk}\epsilon^{klm}=\delta^{il}\delta^{jm}-\delta^{im}\delta^{jl} $
合并一下我们就得到了带电粒子在电磁场中的运动方程
$$
\frac{dp^{\mu}}{d\tau}=\frac{q}{c}F^{\mu\nu}U_{\nu}
$$
这是四维形式的运动方程,和三维形式相比最大的优点就是具有显式的洛伦兹协变性。
所以四维形式的洛伦兹力可以定义为
$$
F^{\mu}_{洛}=\frac{q}{c}F^{\mu\nu}U_{\nu}
$$
显然它也是洛伦兹协变的。
2. 电磁场的洛伦兹变换
对于一个电磁场体系,电场 $\vec{E}$ 和磁场 $\vec{B}$ 的描述与电磁场张量 $F^{\mu\nu}$ 的描述完全等价,其对应分量为
$$
F^{\mu\nu}\equiv \left( \begin{array}{cccc} F^{00}&F^{01}&F^{02}&F^{03}\\ F^{10}&F^{11} &F^{12} &F^{13}\\ F^{20}& F^{21}& F^{22}&F^{23}\\F^{30}&F^{31}&F^{32}&F^{33} \end{array} \right) = \left( \begin{array}{cccc} 0&-E^1&-E^2&-E^3\\ E^1&0 &-B^3 &B^2\\ E^2& B^3& 0&-B^1\\E^3&-B^2&B^1&0 \end{array} \right)
$$
采用电磁场张量描述的好处是其具有显式的洛伦兹协变性。
具体地,设 $F^{\mu\nu}$ 和 $F^{\prime\mu\nu}$ 分别为电磁场张量在两个惯性系 $\Sigma$ 和 $\Sigma^{\prime}$ 的分量,两个惯性系之间的洛伦兹变换矩阵为 $\Lambda^{\mu}_{\nu}$ ,则两个惯性系中的分量可以通过如下表达式联系
$$
F^{\prime \mu\nu}=\Lambda^{\mu}_{\rho}\Lambda^{\nu}_{\sigma}F^{\rho\sigma}
$$
或者
$$
F^{\prime}=\Lambda F \Lambda^{T}
$$
下面我们来具体写出电场分量和磁场分量的洛伦兹变换关系。
为简单起见,我们假设两个惯性系的y轴和z轴平行,x轴重合,$\Sigma^{\prime}$ 系相对 $\Sigma$ 系以速度 $v$ 沿x轴正方向平动,则洛伦兹变换矩阵为
$$
\Lambda^{\mu}_{\nu}=\left( \begin{array}{cccc} \gamma&-\gamma \beta&0&0\\ -\gamma\beta&\gamma &0&0\\ 0& 0&1&0\\ 0&0&0&1 \end{array} \right)
$$
其中 $\beta\equiv v/c$ , $\gamma \equiv 1/\sqrt{1-\beta^2}$ 。从而
*这个公式用图*
最后我们得到
$$
E^{\prime 1}=E^1
$$
$$
E^{\prime 2}=\gamma\left(E^2-\beta B^3\right)
$$
$$
E^{\prime 3}=\gamma\left(E^3+\beta B^2\right)
$$
$$
B^{\prime1}=B^{1}
$$
$$
B^{\prime 2}=\gamma\left(B^2+\beta E^3\right)
$$
$$
B^{\prime 3}=\gamma\left(B^3-\beta E^2\right)
$$
3. Aharonov-Bohm 效应
在上一章 《四维形式的电磁理论(Ⅰ)》(超链接)中我们引入了电磁势 $A^{\mu}=(\phi,\vec{A})$ 来描述电磁场,它和电磁场分量的关系为
$$
\vec{E}=-\nabla\phi-\frac{1}{c}\frac{\partial \vec{A}}{\partial t}
$$
$$
\vec{B}=\nabla \times \vec{A}
$$
一个很自然的问题是,场和势这两种对电磁体系的描述是等价的吗?如果不是,哪一种描述更加基本呢?
首先注意到,在经典电磁体系中,势的描述存在不确定度,即对于一组确定的$(\vec{E},\vec{B})$ 的值,我们可以找到不止一组的 $(\phi,\vec{A})$ 的值与之对应,这称为规范冗余。
具体地说,对原来的标量势和矢量势做如下变换:
$$
\phi\rightarrow\phi^{'}=\phi+\frac{1}{c}\frac{\partial\chi}{\partial t}
$$
$$
\vec{A}\rightarrow \vec{A}^{\prime}=\vec{A}-\nabla \chi
$$
其中 $\chi$ 是一个任意的关于时空坐标的标量函数(不同的 $\chi$ 对应不同的规范),那么对应的电场和磁场并不发生改变
$$
\vec{E}^{\prime}=-\nabla\phi^{\prime}-\frac{1}{c}\frac{\partial \vec{A}^{\prime}}{\partial t}=-\nabla(\phi+\frac{1}{c}\frac{\partial\chi}{\partial t})-\frac{1}{c}\frac{\partial}{\partial t}(\vec{A}-\nabla \chi)=-\nabla\phi-\frac{1}{c}\frac{\partial \vec{A}}{\partial t}=\vec{E}
$$
$$
\vec{B}^{\prime}=\nabla \times \vec{A}^{\prime}=\nabla \times (\vec{A}-\nabla \chi)=\nabla\times \vec{A}=\vec{B}
$$
或者等价地,用四维语言来描述,对于四维势做如下变换:
$$
A^{\mu}\rightarrow A^{\prime \mu}=A^{\mu}+\partial^{\mu}\chi
$$
电磁场张量保持不变
$$
\begin{aligned}
&F^{\mu\nu}\rightarrow F^{\prime \mu\nu}\\=&\partial^{\mu}A^{\nu\prime}-\partial^{\nu}A^{\prime \mu}\\=&\partial^{\mu}\left(A^{\nu}+\partial^{\nu}\chi\right)-\partial^{\nu}\left(A^{\mu}+\partial^{\mu}\chi\right)\\=&\partial^{\mu}A^{\nu}-\partial^{\nu}A^{\mu}\\=&F^{\mu\nu}
\end{aligned}
$$
所以,对于经典电磁体系,场的描述比势更加基本。场是物理的,对应可观测量,而势并不是物理的,它不能唯一确定电磁场,不具有可观测效应。
任何可观测量的值都应该不依赖于电磁势对规范的选择(即不依赖于函数$\chi$),这称为规范不变性。
但是,到了量子体系中,这一切都发生了变化。1959年,Aharonov和Bohm指出(Phys. Rev. 115, (1959), 485):
在量子体系中,电磁势也具有可观测效应。这称为Aharonov-Bohm效应,简称A-B效应。
为此,我们设想如下的实验:
考虑通以稳恒电流 $I$,半径为 $R$,单位长度密绕匝数 $n$ 的无限长通电螺线管,容易计算出,对于这样的电磁体系,螺线管的内部为匀强磁场,方向沿着螺线管的径向,而螺线管外部磁场为零
$$
B(r)=nI,\qquad r < R
$$
$$
B(r)=0,\qquad r > R
$$
通过这个螺线管的磁通量为
$$
\Phi=\int_S \vec{B}\cdot d\vec{S}=n \pi IR^2
$$
但是,螺线管内外的磁矢势都不为零,其方向环绕螺线管的径向
$$
A(r)=\frac{1}{2}nIr ,\qquad r < R
$$
$$
A(r)=\frac{R^2}{2r}nI, \qquad r > R
$$
所以,在螺线管的外部,没有电磁场,但是有电磁势,按照经典电磁理论,螺线管外部不应该有任何可观测效应。
我们现在把这个无限长通电螺线管放入电子的双缝干涉实验中:
我们知道通过双缝的两束电子发生干涉的原因是因为它们到达屏上的时候存在相位差,屏上明暗条纹的具体位置取决于那一点处的相位差。
设螺线管不通电时电子的波函数为 $\psi_{0}$,则由量子力学可以证明,存在矢势时其波函数为
$$
\psi=\psi_0 e^{\frac{ie}{\hbar c}\int_l \vec{A}\cdot d\vec{l} }
$$
在螺线管不通电时,两束电子到达屏上后总的波函数为
$$
\psi_0=\psi^{(1)}_0+\psi^{(2)}_0=|\psi^{(1)}_0|e^{i\phi_1}+|\psi^{(2)}_0|e^{i\phi_2}=\psi^{(1)}_0\left(1+\frac{|\psi_{0}^{(2)}|}{|\psi_{0}^{(1)}|}e^{i(\phi_2-\phi_1)}\right)
$$
其相位差为
$$
\Delta{\phi}_0=\phi_2-\phi_1
$$
而在螺线管通电后, 两束电子到达屏上后总的波函数为
$$
\begin{aligned}
\psi&=\psi^{(1)}+\psi^{(2)}\\&=\psi_{0}^{(1)}e^{\frac{ie}{\hbar c}\int_{l_1} \vec{A}\cdot d\vec{l} }+\psi_{0}^{(2)}e^{\frac{ie}{\hbar c}\int_{l_2} \vec{A}\cdot d\vec{l} }\\&=\psi^{(1)}\left(1+\frac{|\psi_{0}^{(2)}|}{|\psi_{0}^{(1)}|}e^{i\left(\phi_2-\phi_1+\frac{e}{\hbar c}\int_{l_2}\vec{A}\cdot d\vec{l}-\frac{e}{\hbar c}\int_{l_1}\vec{A}\cdot d\vec{l}\right)}\right)
\end{aligned}
$$
其相位差为
$$
\begin{aligned}
\Delta{\phi}&=\phi_2-\phi_1+\frac{e}{\hbar c}\left(\int_{l_2}\vec{A}\cdot d\vec{l}-\int_{l_1}\vec{A}\cdot d\vec{l}\right)\\&=\Delta\phi_0+\frac{e}{\hbar c}\oint_l\vec{A}\cdot d\vec{l}
\end{aligned}
$$
利用Stokes定理,
$$
\oint_l\vec{A}\cdot d\vec{l}=\int_S \vec{B}\cdot d\vec{S}=\Phi_B=n \pi IR^2
$$
所以可以看到螺线管通电前后,相位差改变了
$$
\Delta\phi-\Delta\phi_0=\frac{e}{\hbar c}\Phi_B=\frac{e }{\hbar c}n \pi IR^2
$$
而这会引起屏上明暗条纹的移动,是确确实实的可观测效应。
---
A-B效应告诉我们:
矢势(严格来说应该是矢势的环量,或者磁通量)具有可观测效应。对于量子体系,电磁场的描述并不完全(因为通电前后,螺线管外部的电磁场都为零,但是屏上的条纹却会移动),所以在量子水平上我们应该使用电磁势而不是电磁场来描述电磁体系。
之前提到,矢势具有规范变换下的不确定度,但是可以证明其环量是规范不变的:
$$
\begin{aligned}
\oint_{l} \vec{A}^{\prime}\cdot d\vec{l}&=\oint_{l}\left( \vec{A}-\nabla \chi \right)\cdot d\vec{l}\\&=\oint_{l} \vec{A}\cdot d\vec{l}-\oint_l d\chi\\&=\oint_{l} \vec{A}\cdot d\vec{l}
\end{aligned}
$$
其中利用了梯度积分的性质
$$
\int_a^b \nabla\chi \cdot d\vec{l}=\int_a^b d\chi=\chi(b)-\chi(a)
$$
$$
\oint_{l} \nabla\chi \cdot d\vec{l}=\oint_l d\chi=0
$$
这是合理的,因为矢势的环量具有直接的可观测效应的,理应不依赖于规范的选择。
A-B效应其实对应着非常漂亮的几何图像。按杨振宁先生的观点,20世纪理论物理的三个主旋律分别是:量子化、对称性和相因子。而A-B效应中的A-B相位
$$
\oint_l \vec{A}\cdot d\vec{l}=\int_S \vec{B}\cdot d\vec{S}
$$
是典型的非定域效应。
它告诉我们,定域的电磁场 $(\vec{E},\vec{B})$ 并不能包含电磁体系所有的信息,对于那些不能连续收缩到一点的路径(例如这里的无限长通电螺线管,你在螺线管外面画一个圈包围螺线管,无论怎么收缩都没有办法将这个圈收缩为一个点),仅使用定域的场来描述会丢失体系的一些信息。
而那些丢失的信息就蕴含在了非定域的A-B相位中,它们对应的是这个空间整体的拓扑性质,所有的A-B相位可以按照路径的同伦类进行分类。