微分几何视角下的电动力学【更高更妙的电动力学·1】

目录

你可能听说过麦克斯韦方程有很简单的形式:

dF=0dF=μ0J\begin{aligned} \mathrm{d} F&=0 \\ \mathrm{d} \star F &= \mu_0 \star J \end{aligned}

又或者是

μ(F)μν=0μFμν=μ0Jν\begin{aligned} \partial_\mu (\star{F})^{\mu \nu}&= 0 \\ \partial_\mu F^{\mu\nu}&= \mu_0 J^\nu \end{aligned}

注:严格来说,其中 dF=0\mathrm{d}F=0 (或者 μ(F)μν=0\partial_\mu (\star{F})^{\mu \nu}= 0 )并不属于电磁场的动力学方程,而是属于电磁场自身结构的一部分。这是因为根据场强的定义 F=dAF=\mathrm{d}A 就能得到 dF=0\mathrm{d}F=0

这究竟是怎么一回事?这是否意味着其实存在更高更深奥的视角?

没错,就是如此。本文将从最小作用量原理出发推导麦克斯韦方程,并且在过程中使用微分几何的语言。

为什么要用微分几何的语言?第一,它帮助我们将电磁场的数学结构看得更加清楚,第二,它使得将麦克斯韦方程推广到弯曲时空中非常容易。

在那之前,我们要先做一些数学上的准备工作。数学不错的读者可以跳过。

场论的背景是配备了闵氏度规的四维时空,记为 MM

各种物理场(如电磁场)在数学上就是流形 MM 上的场(如矢量场)。

给定 MM 上的场 ϕ\phi 和拉氏量 L[ϕ,μϕ]\mathcal{L}[\phi, \partial_\mu \phi] ,其中 μϕ:=ϕxμ\partial_\mu \phi := \frac{\partial \phi}{\partial x^\mu}

作用量定义为 S[ϕ]:=L[ϕ,μϕ]d4xS[\phi] := \int \mathcal{L}[\phi, \partial_\mu \phi] \mathrm{d}^4x 。对 ϕ,μϕ\phi, \partial_\mu \phi 进行变分:

δS[ϕ]=δL[ϕ,μϕ]d4x=[Lϕδϕ+L(μϕ)δ(μϕ)]d4x=[Lϕδϕ+L(μϕ)μ(δϕ)]d4x=[Lϕδϕ(μL(μϕ))δϕ]d4x=[LϕμL(μϕ)](δϕ)d4x\begin{aligned} \delta S[\phi] &= \int \delta\mathcal{L}[\phi, \partial_\mu \phi] \mathrm{d}^4x \\ &= \int \left[\frac{\partial \mathcal{L}}{\partial \phi} \delta \phi+\frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)}\delta(\partial_\mu \phi)\right]\mathrm{d}^4x \\ &= \int \left[\frac{\partial \mathcal{L}}{\partial \phi} \delta \phi+\frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)}\partial_\mu (\delta\phi)\right]\mathrm{d}^4x \\ &= \int \left[\frac{\partial \mathcal{L}}{\partial \phi} \delta \phi-\left(\partial_\mu \frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)}\right)\delta\phi\right]\mathrm{d}^4x \\ &= \int \left[\frac{\partial \mathcal{L}}{\partial \phi} -\partial_\mu \frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)}\right] (\delta\phi )\mathrm{d}^4x \end{aligned}

其中第三个等号用到了 δμ=μδ\delta \partial_\mu = \partial_\mu\delta ,第四个等号用到了分部积分。注意用到了爱因斯坦求和约定。

根据最小作用量原理,令 δS=0\delta S=0 ,由 δϕ\delta \phi 的任意性,则有

LϕμL(μϕ)=0\begin{aligned} \frac{\partial \mathcal{L}}{\partial \phi} -\partial_\mu \frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)} = 0 \end{aligned}

这就是场变分的欧拉-拉格朗日方程。这和经典力学中的欧拉-拉格朗日方程略有不同,因为在经典力学中,变分的对象是粒子的一维的运动轨迹,而这里变分的对象是四维场的所有可能配置。

由于我们的时空是平直的,我们不需要太多的微分几何知识。只需要知道最基本的逆变(Contravariant)、协变(Covariant)、微分形式(Differential Forms)和外微分(Exterior Derivative)就差不多了。

1.2.1 逆变矢量

在接触微分几何前,我们绝大多数时间都在使用逆变矢量场,而非协变矢量场。这是因为当我们选定一组基之后,坐标变换是基变换的逆变换,这就是“逆变”的意思,即变换规则与基变换相反。

例如,给定一个矢量场 Aμ=(Ax,Ay,Az)A^\mu = (A^x, A^y, A^z) ,即 A=AμeμA = A^\mu e_\mu ,其中 eμe_\mu 是我们选取的基。当做基变换 eν=Mνμeμe^\prime_\nu = M^{\mu}_\nu e_{\mu} 时,由于 Aμeμ=AμeμA^\mu e_\mu = A^{\prime \mu} e^\prime_\mu ,很显然,坐标变换就应当是逆变换: Aμ=(M1)νμAνA^{\prime \mu} = (M^{-1})^{\mu}_{\nu} A^\nu

实际上,可以令 eμ=μ=xμe_\mu = \partial_\mu = \frac{\partial}{\partial x^\mu} 。这看起来可能很奇怪,不过在微分几何中,逆变矢量的定义就是偏导算子!这点暂时不理解也没关系,不影响后续的推导。

注意,逆变矢量的坐标都应该写成上标,例如 AμA^\mu ,以便于和基的下标 eμe_\mu 缩并(根据爱因斯坦求和约定)。

1.2.2 协变矢量

反过来,“协变”的意思就是坐标变换和基变换的矩阵相同。但怎么会有这样的矢量呢?

实际上,协变矢量生活在另一个空间,叫做原空间的对偶空间。

对偶空间中的矢量 ωμ\omega_\mu (写成下标)可以和原空间中的矢量 vμv^{\mu} (上标)相互缩并成为一个标量: ωμvμ=C\omega_\mu v^\mu = C

eμ=μe_\mu = \partial_\mu 对偶的基是 dxμ\mathrm{d}x^\mu ,满足 dxμν=δνμ={1μ=ν0μν\mathrm{d}x^\mu \partial_\nu = \delta^\mu_\nu = \begin{cases} 1 & \mu=\nu \\ 0 & \mu\ne \nu\end{cases} 。运用和之前相似的推理,我们能够得出,对偶基 dxμ\mathrm{d}x^\mu 的变换矩阵是基 μ\partial_\mu 变换的逆矩阵。从而,对偶矢量的坐标 ωμ\omega_\mu 变换矩阵是基 vμv^\mu 变换矩阵的逆的逆,也就是正好等于基变换矩阵本身。这就是“协变”的意思,即变换规则与基变换相同。

1.2.3 度规

协变矢量和逆变矢量之间不能直接转换,除非我们有一个度规。度规是一个二阶对称协变张量场 gμν=gνμg_{\mu\nu} = g_{\nu\mu}

度规是流形上的额外结构。不是所有流形都天生拥有度规。配备了度规的流形叫做黎曼流形。如果度规不是正定的,那么该流形就叫做伪黎曼流形。物理中用到的流形是伪黎曼流形,因为闵氏度规不是正定的。

借助度规 gμνg_{\mu\nu} ,我们可以将逆变矢量转化为协变矢量 Aμ=gμνAνA_\mu = g_{\mu\nu} A^\nu ,也可以借助 gμagaμ=δνμg^{\mu a}g_{a\mu}=\delta^\mu_\nu 定义逆变度规 gμνg^{\mu\nu} ,从而将协变矢量转化为逆变矢量 Aμ=gμνAνA^\mu = g^{\mu\nu} A_\nu

在狭义相对论中,我们使用闵氏度规:

g00=±1g11=g22=g33=1gij=0,(ij)\begin{aligned} &g_{00} = \pm1\\ &g_{11} = g_{22}=g_{33}=\mp1\\ &g_{ij}=0, (i\ne j) \end{aligned}

一般有两种惯例: (+,,,)(+,-,-,-)(,+,+,+)(-,+,+,+) ,前者对应 g00=1g_{00}=1 ,后者对应 g00=1g_{00}=-1

1.2.4 微分形式

微分形式可以看做是协变反对称张量场。反对称的意思就是,交换下标会改变符号: ωμν=ωνμ\omega_{\mu \nu} = -\omega_{\nu\mu}

例如,二阶反对称协变张量场 ωμν\omega_{\mu\nu} 是 2-形式。

特别地,协变矢量场 ωμ\omega_\mu 是 1-形式,标量场是 0-形式。

两个 1-形式通过 wedge product 可以得到 2-形式:

ω=αβ=αμβνdxμdxν\omega = \alpha \wedge \beta = \alpha_\mu \beta_\nu\mathrm{d}x^\mu \wedge \mathrm{d}x^\nu

其中 dxμdxν=dxνdxμ\mathrm{d}x^\mu \wedge \mathrm{d}x^\nu = -\mathrm{d}x^\nu \wedge \mathrm{d}x^\mu

以此类推。

1.2.5 外微分

定义外微分运算 d\mathrm{d} ,它将 n-形式变为 (n+1)-形式:

dω=d(ωμdxμ) =d(ωμ)dxμ=(νωμdxν)dxμ\begin{aligned} \mathrm{d} \omega &= \mathrm{d}(\omega_\mu \mathrm{d}x^\mu)\ \\ &= \mathrm{d}(\omega_\mu) \wedge \mathrm{d}x^\mu\\ &= (\partial_\nu \omega_\mu\mathrm{d}x^\nu)\wedge\mathrm{d}x^\mu \end{aligned}

一句话概括,外微分运算就是对每个基上的分量取全微分再 wedge 上对应的基。

特别地,对 0-形式做外微分运算,其实就是标量场的全微分本身: df=(μf)dxμ\mathrm{d}f = (\partial_\mu f) \mathrm{d}x^\mu

外微分运算是典范的:它不需要借助流形上的额外结构,也不依赖于基的定义。

引理: αβ=(1)deg(α)deg(β)βα\alpha \wedge \beta = (-1)^{\deg(\alpha)\deg(\beta)} \beta\wedge \alpha ,其中 deg\deg 表示微分形式的阶数。

证明:为了将 β\beta 移动到 α\alpha 前面,需要将 β\beta 中的 deg(β)\deg(\beta) 个 1-形式 向前移动 deg(α)\deg(\alpha) 次,共 deg(α)deg(β)\deg(\alpha) \deg(\beta) 次,每次积累一个负号。

定理:做两次外微分运算总是会得到零: dd=0\mathrm{d}\mathrm{d}=0 ,证明略。

1.2.6 Hodge 对偶

关于 Hodge 对偶,有兴趣的读者可以自行查阅,这里就不详细介绍了。简单来说,k-形式 的 Hodge 对偶是与其“互补”的 (n-k)-形式。例如,在欧式空间 R3\mathbb{R}^3 中,给定标准正交基 dx,dy,dz\mathrm{d}x,\mathrm{d}y,\mathrm{d}z ,有

(1)=dxdydz,(dxdydz)=1dx=dydz,(dydz)=dxdy=dzdx,(dzdx)=dydz=dxdy,(dxdy)=dz\begin{aligned} \star (1) &=\mathrm{d}x\wedge\mathrm{d}y \wedge\mathrm{d}z, \quad\star(\mathrm{d}x\wedge\mathrm{d}y \wedge\mathrm{d}z)= 1\\ \star \mathrm{d}x &= \mathrm{d}y \wedge \mathrm{d}z , \quad\star(\mathrm{d}y \wedge \mathrm{d}z) = \mathrm{d}x\\ \star\mathrm{d}y&=\mathrm{d}z\wedge \mathrm{d}x, \quad\star(\mathrm{d}z\wedge\mathrm{d}x) = \mathrm{d}y \\ \star \mathrm{d}z&=\mathrm{d}x\wedge \mathrm{d}y, \quad\star(\mathrm{d}x\wedge\mathrm{d}y)=\mathrm{d}z \end{aligned}

在这个例子中,做两次 Hodge 对偶会返回自身: =id\star\star = \operatorname{id} 。但一般来说,并非总是如此。例如在闵氏时空中:

(dtdx)=(dydz),(dydz)=dtdx\star(\mathrm{d}t \wedge\mathrm{d}x) = -(\mathrm{d}y \wedge \mathrm{d}z),\quad \star(\mathrm{d}y \wedge \mathrm{d}z) = \mathrm{d}t \wedge\mathrm{d}x

dt=dxdydz,(dxdydz)=dt\star\mathrm{d}t = -\mathrm{d}x\wedge\mathrm{d}y \wedge\mathrm{d}z, \quad \star(\mathrm{d}x\wedge\mathrm{d}y \wedge\mathrm{d}z) = -\mathrm{d}t

实际上,在闵氏时空中,对于偶数阶形式, =id\star\star = -\operatorname{id} 。对于奇数阶形式, =id\star\star = \operatorname{id}

对于一般的情形,见附录引理 3。

4-势(4-potential)定义为 Aμ=(A0,A1,A2,A3)=(ϕ/c,Ax,Ay,Az)A^\mu = (A^0, A^1, A^2, A^3) = (\phi/c, A^x,A^y,A^z)

用更严谨的微分几何语言,就是 A=A00+A11+A22+A33=ϕc(ct)+Axx+Ayy+AzzA = A^0\partial_0 + A^1 \partial_1 + A^2 \partial_2 + A^3 \partial_3 = \frac{\phi}{c} \partial_{(ct)} + A^x\partial_x + A^y \partial_y + A^z\partial_z
这是一个切矢量场,基为 (0,1,2,3)(\partial_0, \partial_1,\partial_2,\partial_3)

由于只有协变矢量有自然的外微分运算,我们用度规将 4-势变为协变形式:

Aμ=gμνAνA_{\mu}=g_{\mu\nu}A^{\nu}

以下采用 (,+,+,+)(-,+,+,+) 的度规惯例,于是:

Aμ=(A0,A1,A2,A3)=(ϕ/c,Ax,Ay,Az)A_\mu = (A_0, A_1, A_2, A_3) = (-\phi/c, A_x, A_y, A_z)

也就是

A=A0dx0+A1dx1+A2dx2+A3dx3=ϕ/cd(ct)+Axdx+Aydy+Azdz=ϕdt+Axdx+Aydy+Azdz\begin{aligned} A &= A_0 \mathrm{d}x^0 + A_1\mathrm{d}x^1 + A_2\mathrm{d}x^2 + A_3\mathrm{d}x^3 \\&= -\phi/c \mathrm{d}(ct) +A^x\mathrm{d}x + A^y\mathrm{d}y + A^z\mathrm{d}z \\&= -\phi \mathrm{d}t +A^x\mathrm{d}x +A^y\mathrm{d}y +A^z\mathrm{d}z \end{aligned}

对协变 4-势 AA 做外微分运算得到场强张量 FF

F=dA=d(ϕdt+Axdx+Aydy+Azdz)=(xϕ+tAx),dtdx+(yϕ+tAy),dtdy+(zϕ+tAz),dtdz+(yAzzAy)dydz+(zAxxAz)dzdx+(xAyyAx)dxdy=ExdtdxEydtdyEzdtdz+Bxdydz+Bydzdx+Bzdxdy\begin{aligned} F &= \mathrm{d}A \\ &= \mathrm{d} (-\phi \mathrm{d}t +A^x\mathrm{d}x +A^y\mathrm{d}y +A^z\mathrm{d}z) \\ &=(\partial_x \phi + \partial_t \mathrm A^x) ,\mathrm{d}t \wedge \mathrm{d}x \\ &+ (\partial_y \phi + \partial_t A^y) ,\mathrm{d}t\wedge \mathrm{d}y \\ &+ (\partial_z\phi + \partial_t A^z),\mathrm{d}t \wedge \mathrm{d}z \\ &+ (\partial_y A^z - \partial_z A^y) \mathrm{d}y \wedge \mathrm{d}z \\ & +(\partial_z A^x - \partial_x A^z)\mathrm{d}z \wedge \mathrm{d}x \\ & +(\partial_x A^y - \partial_y A^x)\mathrm{d}x \wedge \mathrm{d}y \\ &= -E^x \mathrm{d}t \wedge \mathrm{d}x - E^y \mathrm{d}t \wedge \mathrm{d}y - E^z \mathrm{d}t \wedge \mathrm{d}z \\ & + B^x \mathrm{d}y \wedge \mathrm{d}z + B^y \mathrm{d}z \wedge \mathrm{d}x + B^z \mathrm{d}x \wedge \mathrm{d}y \end{aligned}

也可以写成矩阵形式:

[0ExEyEzEx0BzByEyBz0BxEzByBx0]\begin{bmatrix} 0 & E^x & E^y & E^z \\ -E^x & 0 & -B^z & B^y \\ -E^y & B^z & 0 & -B^x \\ -E^z & -B^y & B^x & 0 \end{bmatrix}

为了保持量纲一致,我们将 cc 吸收进 dt\mathrm{d}t ,于是

Fμν=[0Ex/cEy/cEz/cEx/c0BzByEy/cBz0BxEz/cByBx0]\color{red}{F_{\mu\nu}=\begin{bmatrix} 0 & E^x/c & E^y/c & E^z /c\\ -E^x/c & 0 & -B_z & B^y \\ -E^y/c & B^z & 0 & -B^x \\ -E^z /c& -B^y & B^x & 0 \end{bmatrix}}

注意这里的第一个指标 μ\mu 不是代表行,而是代表列,第二个指标 ν \nu 代表行。

实际上, Fμν=μAννAμ\color{red}{F_{\mu\nu} = \partial_\mu A_\nu - \partial_\nu A_\mu} ,请读者自行根据定义 F=dAF=\mathrm{d}A 推导。

FμνF_{\mu\nu} 的逆变形式为 Fμν=gμρgνσFρσF^{\mu\nu} = g^{\mu \rho} g^{\nu \sigma} F_{\rho \sigma}

Fμν=[0Ex/cEy/cEz/cEx/c0BzByEy/cBz0BxEz/cByBx0]F^{\mu\nu} = \begin{bmatrix} 0 & -E^x/c & -E^y/c & -E^z /c\\ E^x/c & 0 & -B_z & B^y \\ E^y/c & B^z & 0 & -B^x \\ E^z /c& -B^y & B^x & 0 \end{bmatrix}

最后,4-流(4-current)定义为 Jμ=(ρc,Jx,Jy,Jz)J^{\mu}=(\rho c, J^x,J^y,J^z) ,协变形式为 Jμ=(ρc,Jx,Jy,Jz)=ρc2dt+Jxdx+Jydy+JzdzJ_{\mu}=(-\rho c, J^x, J^y, J^z) = -\rho c^2 \mathrm{d}t +J^x \mathrm{d}x + J^y \mathrm{d}y + J^z \mathrm{d}z

实际上,4-势是主丛上的一个联络。所谓主丛,就是一个纤维丛,其纤维有李群的结构,而向量丛(例如切丛/余切丛)的纤维是向量空间(例如切空间/余切空间)。可见主丛不同于向量丛。

主丛上的联络的定义与向量丛上的联络的定义也是不同的。向量丛上的联络定义为协变导数,而主丛上的联络是一个取值为李代数的 1-形式。对于电磁场而言,主丛的纤维是 U(1)U(1) ,其李代数为 R\mathbb{R} ,因此看起来与普通的 1-形式没有区别。详情我们在本系列下一篇文章中介绍。

这里直接给出拉氏量:

L[Aμ,νAμ]=14μ0FμνFμν+AμJμ\color{red}{ \begin{aligned} \mathcal{L}[A_\mu, \partial_\nu A_\mu] = -\frac{1}{4\mu_0} F_{\mu\nu} F^{\mu\nu} + A_{\mu} J^{\mu} \end{aligned} }

注意,如果选择另一种度规 (+,,,)(+,-,-,-) ,则上式第二项应为负。

如果展开来计算,会发现它等于:

L=12(ϵ0E21μ0B2)ρϕ+AJ\color{red}{\mathcal{L} = \frac{1}{2}\left(\epsilon_0\mathbf{E^2} -\frac{1}{\mu_0} \mathbf{B^2}\right) -\rho\phi + \mathbf{A} \cdot \mathbf{J}}

至于为什么拉氏量是这个样子,这里就不深究了。

使用第一节介绍的场变分法,有:

LAνμL(μAν)=0\begin{aligned} \frac{\partial \mathcal{L}}{\partial A_\nu} -\partial_\mu \frac{\partial \mathcal{L}}{\partial(\partial_\mu A_\nu)} = 0 \end{aligned}

其中

LAμ=Jμ\begin{aligned} \frac{\partial \mathcal{L}}{\partial A_\mu} = -J_\mu \end{aligned}

L(μAν)=(μAν)[14μ0FabFab]=14μ0[Fab(μAν)Fab+FabFab(μAν)]=14μ0[Fab(μAν)Fab+gaigbjFij(gakgblFkl)(μAν)]=14μ0[Fab(μAν)Fab+δkiδljFijFkl(μAν)]=14μ0[Fab(μAν)Fab+FijFij(μAν)]=12μ0[Fab(μAν)Fab]=12μ0[(aAbbAa)(μAν)Fab]=12μ0[(δaμδbνδbμδaν)Fab]=12μ0(FμνFνμ)=1μ0Fμν\begin{aligned} \frac{\partial \mathcal{L}}{\partial(\partial_\mu A_\nu)} &= -\frac{\partial }{\partial(\partial_\mu A_\nu)} \left[\frac{1}{4\mu_0} F_{ab} F^{ab} \right]\\ &= -\frac{1}{4\mu_0}\left[\frac{\partial F_{ab}}{\partial(\partial_\mu A_\nu)} F^{ab} + F_{ab}\frac{\partial F^{ab}}{\partial(\partial_\mu A_\nu)} \right] \\ &= -\frac{1}{4\mu_0}\left[\frac{\partial F_{ab}}{\partial(\partial_\mu A_\nu)} F^{ab} + g_{ai}g_{bj}F^{ij}\frac{\partial (g^{ak}g^{bl}F_{kl})}{\partial(\partial_\mu A_\nu)} \right] \\ &= -\frac{1}{4\mu_0}\left[\frac{\partial F_{ab}}{\partial(\partial_\mu A_\nu)} F^{ab} + \delta_{ki}\delta_{lj}F^{ij}\frac{\partial F_{kl}}{\partial(\partial_\mu A_\nu)} \right] \\ &= -\frac{1}{4\mu_0}\left[\frac{\partial F_{ab}}{\partial(\partial_\mu A_\nu)} F^{ab} + F^{ij}\frac{\partial F_{ij}}{\partial(\partial_\mu A_\nu)} \right] \\ &= -\frac{1}{2\mu_0}\left[\frac{\partial F_{ab}}{\partial(\partial_\mu A_\nu)} F^{ab} \right] \\ &= -\frac{1}{2\mu_0}\left[\frac{\partial(\partial_a A_b - \partial_b A_a)}{\partial(\partial_\mu A_\nu)} F^{ab} \right] \\ &= -\frac{1}{2\mu_0}\left[(\delta^\mu_a\delta^\nu_b - \delta^\mu_b\delta^\nu_a ) F^{ab} \right] \\ &= -\frac{1}{2\mu_0} \left( F^{\mu\nu}-F^{\nu\mu} \right) \\ &=-\frac{1}{\mu_0}F^{\mu\nu} \end{aligned}

因此有

μFμν=μ0Jν\begin{aligned} \color{red}{\partial_\mu F^{\mu\nu} = \mu_0 J^{\nu}} \end{aligned}

这就是麦克斯韦方程。

接下来我们将它转写成我们熟悉的形式。把

Fμν=[0Ex/cEy/cEz/cEx/c0BzByEy/cBz0BxEz/cByBx0]F^{\mu\nu} = \begin{bmatrix} 0 & -E^x/c & -E^y/c & -E^z /c\\ E^x/c & 0 & -B_z & B^y \\ E^y/c & B^z & 0 & -B^x \\ E^z /c& -B^y & B^x & 0 \end{bmatrix}

Jμ=(ρc2,Jx,Jy,Jz)J^{\mu} = (\rho c^2, J^x,J^y,J^z)

代入 μFμν=μ0Jν\begin{aligned} \partial_\mu F^{\mu\nu} = \mu_0 J^{\nu} \end{aligned} 得:

iEic=μ0ρcE=ρϵ0\begin{aligned} \frac{\partial_i E^i}{c} = \mu_0 \rho c \\ \Rightarrow \color{red}{ \nabla \cdot \mathbf{E} =\frac{\rho}{\epsilon_0} }\end{aligned}

以及

εkijjBk(ct)Ei/c=μ0Ji×B=μ0(J+ϵ0tE)\begin{aligned} \varepsilon^{ij}_{k} \partial_{j}B^k - \frac{\partial}{\partial(ct)}E^i/c = \mu_0J^i\\ \color{red}{ \Rightarrow \nabla \times \mathbf{B} = \mu_0 (\mathbf{J}+ \epsilon_0 \partial_t \mathbf{E})} \end{aligned}

这就是有源麦克斯韦方程。

但是另外两个无源方程(B=0\color{red}{ \nabla \cdot\mathbf{B}=0}×E=tB\color{red}{ \nabla \times \mathbf{E} = -\partial_t \mathbf{B}} )去哪了?

实际上,这两个无源方程不是电磁场动力学的一部分,而是电磁场自身结构的一部分。这是因为无源方程是由 dF=0\mathrm{d}F=0 得到的,而 dF=0\mathrm{d} F=0 是由 F=dAF = \mathrm{d} A 得到的(对任何微分形式做两次外微分都会得到零)。而 F=dAF=\mathrm{d}A 本身就是场强张量的定义。可见,无源方程是根据电磁场的定义得来的,属于自身结构的一部分。

无源方程可以写成:

μ(F)μν=0\color{red}{\partial_\mu (\star F)^{\mu\nu} = 0}

其中 (F)μν(\star F)^{\mu\nu}FμνF^{\mu\nu} 的 Hodge 对偶:

(F)μν=[0BxByBzBx0Ez/cEy/cByEz/c0Ex/cBz/cEy/cEx/c0]\color{red}{(\star F)^{\mu\nu} = \begin{bmatrix} 0 & -B^x & -B^y & -B^z \\ B^x & 0 & E^z/c & -E^y/c \\ B^y & -E^z/c & 0 & E^x/c \\ B^z /c& E^y/c & -E^x/c & 0 \end{bmatrix}}

请读者从 dF=0\mathrm{d} F=0 推导无源方程。

如果读者会微分几何,以下提供一个更优雅的推导:
dF=0dF=0dF=0(d)(F)=0()(F)=0μ(F)μν=0\begin{aligned} &\mathrm{d}F=0 \\ &\Rightarrow \mathrm{d} \star \star F = 0 \\ &\Rightarrow \mathrm{d} \star \flat\sharp\star F = 0 \\ &\Rightarrow (\sharp\star\mathrm{d} \star \flat)(\sharp\star F) = 0 \\ &\Rightarrow (\nabla\cdot)(\sharp\star F) = 0 \\ &\Rightarrow \partial_\mu (\star F)^{\mu\nu} = 0 \end{aligned}
其中 \sharp 是升指标, \flat 是降指标, ()(\nabla\cdot) 是广义散度,定义为 ()=d(\nabla\cdot) = \sharp\star\mathrm{d} \star \flat

有些读者不喜欢指标运算,而是喜欢更典范的抽象符号,因此本节用微分几何的语言再重写一遍。

给定拉氏量:

L=12μ0F(F)+A(J)=[12μ0F,F+A,J]ω\begin{aligned} \mathcal{L} &= -\frac{1}{2\mu_0} F \wedge (\star F) + A\wedge (\star J) \\ &= \left[-\frac{1}{2\mu_0} \langle F , F\rangle + \langle A , J \rangle\right] \omega \end{aligned}

注意,如果采用 (+,,,)(+,-,-,-) 度规,则上式第二项应为 A,Jω-\langle A, J\rangle \omega

其中度规体积形式 ω\omega 的定义是使得 ω,ωg=±1=:sgn(g)\langle \omega ,\omega \rangle_g = \pm 1 =: \operatorname{sgn}(g) 成立的 n-形式,n 为流形的维数。显式定义为 ω=det(g),dx0dx1dx2dx3=dx0dx1dx2dx3\omega = \sqrt{|\det(g)|},\mathrm{d}x^0 \wedge \mathrm{d}x^1 \wedge \mathrm{d}x^2 \wedge \mathrm{d}x^3 = \mathrm{d}x^0 \wedge \mathrm{d}x^1 \wedge \mathrm{d}x^2 \wedge \mathrm{d}x^3

微分形式 β\beta 的 Hodge 对偶 β\star \beta 的定义式为 αβ=α,βω\alpha \wedge *\beta = \langle \alpha, \beta\rangle \omega 。其中 ,\langle \cdot,\cdot\rangle 是微分形式的内积,对于 n-形式,内积的定义为:
α1,αn,,β1βn=α1,β1α1,βnαn,β1αn,βn\langle \alpha_1,\cdots\wedge\alpha_n,,\beta_1\wedge\cdots\wedge\beta_n\rangle = \begin{vmatrix} \langle \alpha_1,\beta_1 \rangle & \cdots & \langle \alpha_1,\beta_n \rangle \\ \vdots & \ddots & \vdots \\ \langle \alpha_n ,\beta_1 \rangle & \cdots & \langle\alpha_n ,\beta_n \rangle \end{vmatrix}

注意此处系数是 1/(2μ0)-1/(2\mu_0) 而非 1/(4μ0)-1/(4\mu_0) 。这是因为之前的张量指标写法( FμνFμνF_{\mu\nu}F^{\mu\nu} )导致交换 μ,ν\mu, \nu 会重复求和,所以之前要多除以一个 1/21/2

L\mathcal{L} 的形式可以看出,它其实是一个 4-形式,而不是一个标量场。这是因为它要被积分成为作用量 S=L\begin{aligned} S = \int \mathcal{L} \end{aligned}

对作用量变分得到:

δS=1δL=212μ0[(δF)(F)+F(δF)]+(δA)(J)=312μ0[(δF)(F)+(δF)F]+(δA)(J)=412μ0[(δF)(F)+(δF)(F)]+(δA)(J)=51μ0(δF)(F)+(δA)(J)=61μ0(δdA)(F)+(δA)(J)=71μ0d(δA)(F)+(δA)(J)=81μ0(δA)(dF)+(δA)(J)=9(δA)(1μ0dF+J)\begin{aligned} \delta S&\stackrel{1}{=}\int \delta \mathcal{L} \\ &\stackrel{2}=\int -\frac{1}{2\mu_0} [(\delta F) \wedge (\star F) +F\wedge(\delta\star F)] + (\delta A)\wedge (\star J) \\ &\color{blue}{\stackrel{3}{=}}\int -\frac{1}{2\mu_0} [(\delta F) \wedge (\star F)+(\star \delta F)\wedge F] + (\delta A)\wedge (\star J) \\ & \color{blue}{\stackrel{4}=} \int -\frac{1}{2\mu_0} [(\delta F) \wedge (\star F)+(\delta F)\wedge (\star F)] + (\delta A)\wedge (\star J) \\ &\stackrel{5}=\int -\frac{1}{\mu_0} (\delta F) \wedge (\star F) + (\delta A)\wedge (\star J) \\ &\stackrel{6}= \int -\frac{1}{\mu_0} (\delta \mathrm{d}A) \wedge (\star F) + (\delta A)\wedge (\star J) \\ &\stackrel{7}= \int -\frac{1}{\mu_0} \mathrm{d}(\delta A) \wedge (\star F) + (\delta A)\wedge (\star J) \\ &\color{blue}{\stackrel{8}=} \int -\frac{1}{\mu_0} (\delta A) \wedge (\mathrm{d}\star F) + (\delta A)\wedge (\star J) \\ &\stackrel{9}= \int (\delta A) \wedge \left(-\frac{1}{\mu_0}\mathrm{d}\star F + \star J\right) \end{aligned}

其中第 3 个等号用到了:

αβ=(1)deg(α)deg(β)βα\begin{aligned} \alpha\wedge\beta &= (-1)^{\deg(\alpha)\deg(\beta)}\end{aligned} \beta \wedge \alpha

其中 deg(α)\deg(\alpha) 代表 α\alpha 的阶数,例如此处 deg(F)=2\deg(F)=2 ,因为 FF 是 2-form。

第 4 个等号用到了:

αβ=(1)deg(α)deg(β)βα=(1)deg(α)deg(β)β,αω=(1)deg(α)deg(β)α,βω=(1)deg(α)deg(β)αβ\begin{aligned} \star \alpha\wedge\beta &= (-1)^{\deg(\star\alpha)\deg(\beta)}\beta\wedge\star\alpha \\ &= (-1)^{\deg(\star\alpha)\deg(\beta)}\langle\beta,\alpha\rangle \omega \\ &= (-1)^{\deg(\star\alpha)\deg(\beta)}\langle\alpha,\beta\rangle \omega \\ &= (-1)^{\deg(\star\alpha)\deg(\beta)}\alpha \wedge\star\beta \end{aligned}

第 8 个等号用到了分部积分:

(dα)β=[d(αβ)(1)deg(α)αdβ]\begin{aligned} \int (\mathrm{d}\alpha) \wedge \beta &= \int \left[\cancel{\mathrm{d}(\alpha \wedge \beta)} - (-1)^{\text{deg}(\alpha)} \alpha \wedge \mathrm{d}\beta\right]\end{aligned}

之所以 Md(αβ)=0\int_M\mathrm{d}(\alpha \wedge \beta) = 0 ,是因为根据斯托克斯定理(Stoke’s theorem), Md(αβ)=Mαβ\int_M\mathrm{d}(\alpha \wedge \beta)=\int_{\partial M} \alpha \wedge \beta ,其中 M\partial MMM 的边界。而 Mαβ=0\int_{\partial M} \alpha \wedge \beta =0 (变分法的边界条件为 δAM=0\delta A|_{\partial M}=0 )。

由于 δS=0\delta S =0 对任意 δA\delta A 成立,于是有 1μ0dF+J=0-\frac{1}{\mu_0}\mathrm{d}\star F + \star J = 0 ,即麦克斯韦方程:

dF=μ0J\color{red}{\mathrm{d}\star F =\mu_0 \star J}

写成这样有什么好处?答案是它很容易被推广到弯曲时空。从平直时空到弯曲时空,我们只需要替换度规即可,这在上式中反映为替换 Hodge 星算子,因为 Hodge 星算子是依赖度规定义的。

最后,我们对比一下指标写法和微分形式写法:

(逆变)指标写法:

μ(F)μν=0μFμν=μ0Jν\begin{aligned} \partial_\mu (\star{F})^{\mu \nu}&= 0 \\ \partial_\mu F^{\mu\nu}&= \mu_0 J^\nu \end{aligned}

(协变)微分形式写法:

dF=0dF=μ0J\begin{aligned} \mathrm{d} F&=0 \\ \mathrm{d} \star F &= \mu_0 \star J \end{aligned}

指标写法中的 FF ,到了微分形式写法中却变成了对偶 (F)(\star F) ,反之亦然。这是因为指标写法中的 FμνF^{\mu\nu} 是逆变张量,而微分形式 FF 是协变张量。根据 ()=d(\nabla\cdot) \sharp = \sharp\star\mathrm{d} \star ,有 μFμν=dF\partial_\mu F^{\mu\nu} = \sharp\star \mathrm{d} \star F 。见下图:

k-vector fields()(k1)-vector fieldsk-form(k1)-form(nk)-formd(nk+1)-form\begin{matrix} k\text{-vector fields} & \stackrel{(\nabla\cdot)}{\longrightarrow} & (k-1)\text{-vector fields}\\ \uparrow\sharp & & \uparrow\sharp \\ k\text{-form} & & (k-1)\text{-form}\\ \downarrow\star & & \uparrow \star \\ (n-k)\text{-form} & \stackrel{\mathrm{d}}\longrightarrow & (n-k+1)\text{-form} \end{matrix}

或者也可以使用更常见的 co-differential d\mathrm{d}^\dagger ,它的定义式为 α,dβ=dα,β\langle \alpha, \mathrm{d}\beta\rangle = \langle \mathrm{d}^\dagger\alpha, \beta\rangle

可以证明(见附录), dα=(1)k1dα=(1)nk+n+1sdα\mathrm{d}^\dagger \alpha = (-1)^{k}\star^{-1} \mathrm{d} \star \alpha = (-1)^{nk+n+1} s\star \mathrm{d} \star \alpha ,其中 k=deg(α)k=\deg(\alpha)s=sgn(g):=sgn(det(g))s=\operatorname{sgn}(g) := \operatorname{sgn}(\det (g)) 是度规的符号。

对于闵氏度规, s=1s = -1 。代入 s=1,,n=4,,k=2s=-1,,n=4,,k=2dF=dF\mathrm{d}^\dagger F=\star \mathrm{d}\star F

所以上图可以画成:
2-vector fields()1-vector fields2-formd1-form2-formd3-form\begin{matrix} 2\text{-vector fields} & \stackrel{(\nabla\cdot)}{\longrightarrow} & 1\text{-vector fields}\\ \uparrow\sharp & & \uparrow\sharp \\ 2\text{-form} & \xrightarrow{\mathrm{d}^\dagger} & 1\text{-form}\\ \downarrow\star & & \uparrow \star \\ 2\text{-form} & \stackrel{\mathrm{d}}\longrightarrow & 3\text{-form} \end{matrix}

于是有

Fμν()μFμν=μ0JνFddF\begin{matrix} F^{\mu\nu} & \xrightarrow{(\nabla\cdot)} & \partial_\mu F^{\mu\nu}=\mu_0J^\nu \\ \uparrow \sharp & & \uparrow \sharp \\ F & \xrightarrow{\star \mathrm{d}\star} & \star \mathrm{d} \star F \end{matrix}

可见 μFμν=μ0Jν\partial_\mu F^{\mu\nu}=\mu_0J^\nu 等价于 dF=μ0J\star \mathrm{d} \star F = \mu_0 J

而对于 1-形式, 有=(1)k(nk)+sid=(1)1(41)+1id=id\star\star = (-1)^{k(n-k)+s} \operatorname{id} = (-1)^{1(4-1)+1} \operatorname{id} = \operatorname{id} 。所以 dF=μ0J\star \mathrm{d} \star F = \mu_0 J 等价于 dF=μ0J\mathrm{d} \star F = \mu_0 \star J

对于 dF=0μ(F)μν=0\mathrm{d} F = 0 \Leftrightarrow \partial_\mu (\star F)^{\mu\nu} = 0 的推导也是类似的。

引理 1: d(αβ)=dαβ+(1)deg(α)αdβ\mathrm{d}(\alpha \wedge \beta) = \mathrm{d}\alpha \wedge \beta + (-1)^{\deg(\alpha)} \alpha \wedge \mathrm{d}\beta

证明:

αβ=I,JaIbJdxIdxJ=i1,,im,j1,,jnai1,,imbj1,,jndxi1dximdx1jdxjn\begin{aligned} \alpha \wedge \beta &= \sum_{I,J} a_I b_J\mathrm{d} x^I \wedge \mathrm{d}x^J \\ &= \sum_{i_1,\cdots,i_{m},j_1,\cdots,j_n} a_{i_1,\cdots,i_{m}}b_{j_1,\cdots,j_n}\mathrm{d}x^{i_1} \wedge \cdots \wedge \mathrm{d}x^{i_m} \wedge \mathrm{d}x^j_1\wedge \cdots \wedge \mathrm{d}x^{j_n} \end{aligned}

d(αβ)=i(aIbJ)dxidxIdxJ=[(iaI)bJdxidxI]dxJ+aIibJdxidxIdxJ=(iaIdxidxI)(bJdxJ)+(1)deg(α)(aIidxIdxi)(bJdxJ)=dαβ+(1)deg(α)αdβ\begin{aligned} \mathrm{d}(\alpha\wedge \beta) &= \partial_i (a_I b_J) \mathrm{d}x^i\wedge \mathrm{d}x^I \wedge \mathrm{d}x^J \\ &=[(\partial_i a_I)b_J \mathrm{d}x^i \wedge \mathrm{d}x^I] \wedge \mathrm{d}x^J + a_I\partial_i b_J \mathrm{d}x^i \wedge \mathrm{d}x^I \wedge \mathrm{d}x^J \\ &=(\partial_i a_I\mathrm{d}x^i \wedge \mathrm{d}x^I) \wedge (b_J \mathrm{d}x^J) + (-1)^{\deg(\alpha)} (a_I\partial_i \mathrm{d}x^I \wedge \mathrm{d}x^i) \wedge (b_J\mathrm{d}x^J) \\ &=\mathrm{d}\alpha \wedge \beta + (-1)^{\deg(\alpha)} \alpha \wedge \mathrm{d}\beta \end{aligned}

引理 2:当 deg(α)=deg(β)\deg(\alpha)=\deg(\beta) 时,有 αβ=(1)k(nk)αβ\star\alpha \wedge \beta = (-1)^{k(n-k)}\alpha\wedge \star\beta ,其中 k=deg(α)k=\deg(\alpha)

证明:
αβ=(1)deg(α)deg(β)βα=(1)k(nk)β,αω=(1)k(nk)α,βω=(1)k(nk)αβ\begin{aligned} \star \alpha\wedge\beta &= (-1)^{\deg(\star\alpha)\deg(\beta)} \beta\wedge\star\alpha \\ &= (-1)^{k(n-k)}\langle\beta,\alpha\rangle \omega \\ &= (-1)^{k(n-k)}\langle\alpha,\beta\rangle \omega \\ &= (-1)^{k(n-k)}\alpha \wedge\star\beta \end{aligned}

引理 3: α=(1)k(nk)sα\star\star \alpha = (-1)^{k(n-k)}s \alpha ,其中 k=deg(α)k=\deg(\alpha)s=sgn(g)s=\operatorname{sgn}(g)

证明:
αα=α,αω=sα,αω=sαα=(1)k(nk)sαα=α[(1)k(nk)sα]\begin{aligned} \star\alpha \wedge \star\star \alpha &= \langle \star\alpha, \star\alpha \rangle\omega \\ &= s\langle \alpha,\alpha \rangle\omega \\ &= s\alpha \wedge \star \alpha\\ &= (-1)^{k(n-k)}s \star\alpha\wedge \alpha \\ &= \star\alpha\wedge \left[(-1)^{k(n-k)}s \alpha\right] \end{aligned}

引理 4: dα=(1)k1dα\mathrm{d}^\dagger \alpha = (-1)^{k}\star^{-1} \mathrm{d} \star \alpha

证明:
β,dα=dβ,α=dβα=(1)deg(β)βdα=(1)deg(β)+1βdα=(1)deg(α)βdα=(1)deg(α)β(1dα)=(1)kβ,1dα\begin{aligned} \langle \beta,\mathrm{d}^\dagger \alpha\rangle&= \langle \mathrm{d}\beta , \alpha\rangle \\ &= \int\mathrm{d}\beta \wedge \star \alpha \\ &= \int -(-1)^{\deg(\beta)} \beta \wedge \mathrm{d}\star \alpha \\ &= \int (-1)^{\deg(\beta)+1} \beta \wedge \mathrm{d}\star \alpha \\ &= \int (-1)^{\deg(\alpha)} \beta \wedge \mathrm{d}\star \alpha \\ &= \int (-1)^{\deg(\alpha)} \beta \wedge \star (\star^{-1}\mathrm{d}\star \alpha) \\ &= (-1)^{k} \langle\beta, \star^{-1}\mathrm{d} \star \alpha \rangle \end{aligned}

引理 5: dα=(1)nk+n+1sdα\mathrm{d}^\dagger \alpha = (-1)^{nk+n+1} s\star \mathrm{d} \star \alpha

证明:
结合引理 3 和引理 4 即可证得。

Powered By Valine
v1.5.0