你可能听说过麦克斯韦方程有很简单的形式:
dFd⋆F=0=μ0⋆J
又或者是
∂μ(⋆F)μν∂μFμν=0=μ0Jν
注:严格来说,其中 dF=0 (或者 ∂μ(⋆F)μν=0 )并不属于电磁场的动力学方程,而是属于电磁场自身结构的一部分。这是因为根据场强的定义 F=dA 就能得到 dF=0 。
这究竟是怎么一回事?这是否意味着其实存在更高更深奥的视角?
没错,就是如此。本文将从最小作用量原理出发推导麦克斯韦方程,并且在过程中使用微分几何的语言。
为什么要用微分几何的语言?第一,它帮助我们将电磁场的数学结构看得更加清楚,第二,它使得将麦克斯韦方程推广到弯曲时空中非常容易。
在那之前,我们要先做一些数学上的准备工作。数学不错的读者可以跳过。
场论的背景是配备了闵氏度规的四维时空,记为 M 。
各种物理场(如电磁场)在数学上就是流形 M 上的场(如矢量场)。
给定 M 上的场 ϕ 和拉氏量 L[ϕ,∂μϕ] ,其中 ∂μϕ:=∂xμ∂ϕ 。
作用量定义为 S[ϕ]:=∫L[ϕ,∂μϕ]d4x 。对 ϕ,∂μϕ 进行变分:
δS[ϕ]=∫δL[ϕ,∂μϕ]d4x=∫[∂ϕ∂Lδϕ+∂(∂μϕ)∂Lδ(∂μϕ)]d4x=∫[∂ϕ∂Lδϕ+∂(∂μϕ)∂L∂μ(δϕ)]d4x=∫[∂ϕ∂Lδϕ−(∂μ∂(∂μϕ)∂L)δϕ]d4x=∫[∂ϕ∂L−∂μ∂(∂μϕ)∂L](δϕ)d4x
其中第三个等号用到了 δ∂μ=∂μδ ,第四个等号用到了分部积分。注意用到了爱因斯坦求和约定。
根据最小作用量原理,令 δS=0 ,由 δϕ 的任意性,则有
∂ϕ∂L−∂μ∂(∂μϕ)∂L=0
这就是场变分的欧拉-拉格朗日方程。这和经典力学中的欧拉-拉格朗日方程略有不同,因为在经典力学中,变分的对象是粒子的一维的运动轨迹,而这里变分的对象是四维场的所有可能配置。
由于我们的时空是平直的,我们不需要太多的微分几何知识。只需要知道最基本的逆变(Contravariant)、协变(Covariant)、微分形式(Differential Forms)和外微分(Exterior Derivative)就差不多了。
1.2.1 逆变矢量
在接触微分几何前,我们绝大多数时间都在使用逆变矢量场,而非协变矢量场。这是因为当我们选定一组基之后,坐标变换是基变换的逆变换,这就是“逆变”的意思,即变换规则与基变换相反。
例如,给定一个矢量场 Aμ=(Ax,Ay,Az) ,即 A=Aμeμ ,其中 eμ 是我们选取的基。当做基变换 eν′=Mνμeμ 时,由于 Aμeμ=A′μeμ′ ,很显然,坐标变换就应当是逆变换: A′μ=(M−1)νμAν 。
实际上,可以令 eμ=∂μ=∂xμ∂ 。这看起来可能很奇怪,不过在微分几何中,逆变矢量的定义就是偏导算子!这点暂时不理解也没关系,不影响后续的推导。
注意,逆变矢量的坐标都应该写成上标,例如 Aμ ,以便于和基的下标 eμ 缩并(根据爱因斯坦求和约定)。
1.2.2 协变矢量
反过来,“协变”的意思就是坐标变换和基变换的矩阵相同。但怎么会有这样的矢量呢?
实际上,协变矢量生活在另一个空间,叫做原空间的对偶空间。
对偶空间中的矢量 ωμ (写成下标)可以和原空间中的矢量 vμ (上标)相互缩并成为一个标量: ωμvμ=C 。
与 eμ=∂μ 对偶的基是 dxμ ,满足 dxμ∂ν=δνμ={10μ=νμ=ν 。运用和之前相似的推理,我们能够得出,对偶基 dxμ 的变换矩阵是基 ∂μ 变换的逆矩阵。从而,对偶矢量的坐标 ωμ 变换矩阵是基 vμ 变换矩阵的逆的逆,也就是正好等于基变换矩阵本身。这就是“协变”的意思,即变换规则与基变换相同。
1.2.3 度规
协变矢量和逆变矢量之间不能直接转换,除非我们有一个度规。度规是一个二阶对称协变张量场 gμν=gνμ 。
度规是流形上的额外结构。不是所有流形都天生拥有度规。配备了度规的流形叫做黎曼流形。如果度规不是正定的,那么该流形就叫做伪黎曼流形。物理中用到的流形是伪黎曼流形,因为闵氏度规不是正定的。
借助度规 gμν ,我们可以将逆变矢量转化为协变矢量 Aμ=gμνAν ,也可以借助 gμagaμ=δνμ 定义逆变度规 gμν ,从而将协变矢量转化为逆变矢量 Aμ=gμνAν 。
在狭义相对论中,我们使用闵氏度规:
g00=±1g11=g22=g33=∓1gij=0,(i=j)
一般有两种惯例: (+,−,−,−) 和 (−,+,+,+) ,前者对应 g00=1 ,后者对应 g00=−1 。
1.2.4 微分形式
微分形式可以看做是协变反对称张量场。反对称的意思就是,交换下标会改变符号: ωμν=−ωνμ 。
例如,二阶反对称协变张量场 ωμν 是 2-形式。
特别地,协变矢量场 ωμ 是 1-形式,标量场是 0-形式。
两个 1-形式通过 wedge product 可以得到 2-形式:
ω=α∧β=αμβνdxμ∧dxν
其中 dxμ∧dxν=−dxν∧dxμ
以此类推。
1.2.5 外微分
定义外微分运算 d ,它将 n-形式变为 (n+1)-形式:
dω=d(ωμdxμ) =d(ωμ)∧dxμ=(∂νωμdxν)∧dxμ
一句话概括,外微分运算就是对每个基上的分量取全微分再 wedge 上对应的基。
特别地,对 0-形式做外微分运算,其实就是标量场的全微分本身: df=(∂μf)dxμ 。
外微分运算是典范的:它不需要借助流形上的额外结构,也不依赖于基的定义。
引理: α∧β=(−1)deg(α)deg(β)β∧α ,其中 deg 表示微分形式的阶数。
证明:为了将 β 移动到 α 前面,需要将 β 中的 deg(β) 个 1-形式 向前移动 deg(α) 次,共 deg(α)deg(β) 次,每次积累一个负号。
定理:做两次外微分运算总是会得到零: dd=0 ,证明略。
1.2.6 Hodge 对偶
关于 Hodge 对偶,有兴趣的读者可以自行查阅,这里就不详细介绍了。简单来说,k-形式 的 Hodge 对偶是与其“互补”的 (n-k)-形式。例如,在欧式空间 R3 中,给定标准正交基 dx,dy,dz ,有
⋆(1)⋆dx⋆dy⋆dz=dx∧dy∧dz,⋆(dx∧dy∧dz)=1=dy∧dz,⋆(dy∧dz)=dx=dz∧dx,⋆(dz∧dx)=dy=dx∧dy,⋆(dx∧dy)=dz
在这个例子中,做两次 Hodge 对偶会返回自身: ⋆⋆=id 。但一般来说,并非总是如此。例如在闵氏时空中:
⋆(dt∧dx)=−(dy∧dz),⋆(dy∧dz)=dt∧dx
⋆dt=−dx∧dy∧dz,⋆(dx∧dy∧dz)=−dt
实际上,在闵氏时空中,对于偶数阶形式, ⋆⋆=−id 。对于奇数阶形式, ⋆⋆=id 。
对于一般的情形,见附录引理 3。
4-势(4-potential)定义为 Aμ=(A0,A1,A2,A3)=(ϕ/c,Ax,Ay,Az)
用更严谨的微分几何语言,就是 A=A0∂0+A1∂1+A2∂2+A3∂3=cϕ∂(ct)+Ax∂x+Ay∂y+Az∂z
这是一个切矢量场,基为 (∂0,∂1,∂2,∂3)
由于只有协变矢量有自然的外微分运算,我们用度规将 4-势变为协变形式:
Aμ=gμνAν
以下采用 (−,+,+,+) 的度规惯例,于是:
Aμ=(A0,A1,A2,A3)=(−ϕ/c,Ax,Ay,Az)
也就是
A=A0dx0+A1dx1+A2dx2+A3dx3=−ϕ/cd(ct)+Axdx+Aydy+Azdz=−ϕdt+Axdx+Aydy+Azdz
对协变 4-势 A 做外微分运算得到场强张量 F :
F=dA=d(−ϕdt+Axdx+Aydy+Azdz)=(∂xϕ+∂tAx),dt∧dx+(∂yϕ+∂tAy),dt∧dy+(∂zϕ+∂tAz),dt∧dz+(∂yAz−∂zAy)dy∧dz+(∂zAx−∂xAz)dz∧dx+(∂xAy−∂yAx)dx∧dy=−Exdt∧dx−Eydt∧dy−Ezdt∧dz+Bxdy∧dz+Bydz∧dx+Bzdx∧dy
也可以写成矩阵形式:
⎣⎡0−Ex−Ey−EzEx0Bz−ByEy−Bz0BxEzBy−Bx0⎦⎤
为了保持量纲一致,我们将 c 吸收进 dt ,于是
Fμν=⎣⎡0−Ex/c−Ey/c−Ez/cEx/c0Bz−ByEy/c−Bz0BxEz/cBy−Bx0⎦⎤
注意这里的第一个指标 μ 不是代表行,而是代表列,第二个指标 ν 代表行。
实际上, Fμν=∂μAν−∂νAμ ,请读者自行根据定义 F=dA 推导。
Fμν 的逆变形式为 Fμν=gμρgνσFρσ :
Fμν=⎣⎡0Ex/cEy/cEz/c−Ex/c0Bz−By−Ey/c−Bz0Bx−Ez/cBy−Bx0⎦⎤
最后,4-流(4-current)定义为 Jμ=(ρc,Jx,Jy,Jz) ,协变形式为 Jμ=(−ρc,Jx,Jy,Jz)=−ρc2dt+Jxdx+Jydy+Jzdz 。
实际上,4-势是主丛上的一个联络。所谓主丛,就是一个纤维丛,其纤维有李群的结构,而向量丛(例如切丛/余切丛)的纤维是向量空间(例如切空间/余切空间)。可见主丛不同于向量丛。
主丛上的联络的定义与向量丛上的联络的定义也是不同的。向量丛上的联络定义为协变导数,而主丛上的联络是一个取值为李代数的 1-形式。对于电磁场而言,主丛的纤维是 U(1) ,其李代数为 R ,因此看起来与普通的 1-形式没有区别。详情我们在本系列下一篇文章中介绍。
这里直接给出拉氏量:
L[Aμ,∂νAμ]=−4μ01FμνFμν+AμJμ
注意,如果选择另一种度规 (+,−,−,−) ,则上式第二项应为负。
如果展开来计算,会发现它等于:
L=21(ϵ0E2−μ01B2)−ρϕ+A⋅J
至于为什么拉氏量是这个样子,这里就不深究了。
使用第一节介绍的场变分法,有:
∂Aν∂L−∂μ∂(∂μAν)∂L=0
其中
∂Aμ∂L=−Jμ
∂(∂μAν)∂L=−∂(∂μAν)∂[4μ01FabFab]=−4μ01[∂(∂μAν)∂FabFab+Fab∂(∂μAν)∂Fab]=−4μ01[∂(∂μAν)∂FabFab+gaigbjFij∂(∂μAν)∂(gakgblFkl)]=−4μ01[∂(∂μAν)∂FabFab+δkiδljFij∂(∂μAν)∂Fkl]=−4μ01[∂(∂μAν)∂FabFab+Fij∂(∂μAν)∂Fij]=−2μ01[∂(∂μAν)∂FabFab]=−2μ01[∂(∂μAν)∂(∂aAb−∂bAa)Fab]=−2μ01[(δaμδbν−δbμδaν)Fab]=−2μ01(Fμν−Fνμ)=−μ01Fμν
因此有
∂μFμν=μ0Jν
这就是麦克斯韦方程。
接下来我们将它转写成我们熟悉的形式。把
Fμν=⎣⎡0Ex/cEy/cEz/c−Ex/c0Bz−By−Ey/c−Bz0Bx−Ez/cBy−Bx0⎦⎤
和
Jμ=(ρc2,Jx,Jy,Jz)
代入 ∂μFμν=μ0Jν 得:
c∂iEi=μ0ρc⇒∇⋅E=ϵ0ρ
以及
εkij∂jBk−∂(ct)∂Ei/c=μ0Ji⇒∇×B=μ0(J+ϵ0∂tE)
这就是有源麦克斯韦方程。
但是另外两个无源方程(∇⋅B=0 和 ∇×E=−∂tB )去哪了?
实际上,这两个无源方程不是电磁场动力学的一部分,而是电磁场自身结构的一部分。这是因为无源方程是由 dF=0 得到的,而 dF=0 是由 F=dA 得到的(对任何微分形式做两次外微分都会得到零)。而 F=dA 本身就是场强张量的定义。可见,无源方程是根据电磁场的定义得来的,属于自身结构的一部分。
无源方程可以写成:
∂μ(⋆F)μν=0
其中 (⋆F)μν 是 Fμν 的 Hodge 对偶:
(⋆F)μν=⎣⎡0BxByBz/c−Bx0−Ez/cEy/c−ByEz/c0−Ex/c−Bz−Ey/cEx/c0⎦⎤
请读者从 dF=0 推导无源方程。
如果读者会微分几何,以下提供一个更优雅的推导:
dF=0⇒d⋆⋆F=0⇒d⋆♭♯⋆F=0⇒(♯⋆d⋆♭)(♯⋆F)=0⇒(∇⋅)(♯⋆F)=0⇒∂μ(⋆F)μν=0
其中 ♯ 是升指标, ♭ 是降指标, (∇⋅) 是广义散度,定义为 (∇⋅)=♯⋆d⋆♭ 。
有些读者不喜欢指标运算,而是喜欢更典范的抽象符号,因此本节用微分几何的语言再重写一遍。
给定拉氏量:
L=−2μ01F∧(⋆F)+A∧(⋆J)=[−2μ01⟨F,F⟩+⟨A,J⟩]ω
注意,如果采用 (+,−,−,−) 度规,则上式第二项应为 −⟨A,J⟩ω 。
其中度规体积形式 ω 的定义是使得 ⟨ω,ω⟩g=±1=:sgn(g) 成立的 n-形式,n 为流形的维数。显式定义为 ω=∣det(g)∣,dx0∧dx1∧dx2∧dx3=dx0∧dx1∧dx2∧dx3 。
微分形式 β 的 Hodge 对偶 ⋆β 的定义式为 α∧∗β=⟨α,β⟩ω 。其中 ⟨⋅,⋅⟩ 是微分形式的内积,对于 n-形式,内积的定义为:
⟨α1,⋯∧αn,,β1∧⋯∧βn⟩=∣∣⟨α1,β1⟩⋮⟨αn,β1⟩⋯⋱⋯⟨α1,βn⟩⋮⟨αn,βn⟩∣∣
注意此处系数是 −1/(2μ0) 而非 −1/(4μ0) 。这是因为之前的张量指标写法( FμνFμν )导致交换 μ,ν 会重复求和,所以之前要多除以一个 1/2 。
从 L 的形式可以看出,它其实是一个 4-形式,而不是一个标量场。这是因为它要被积分成为作用量 S=∫L 。
对作用量变分得到:
δS=1∫δL=2∫−2μ01[(δF)∧(⋆F)+F∧(δ⋆F)]+(δA)∧(⋆J)=3∫−2μ01[(δF)∧(⋆F)+(⋆δF)∧F]+(δA)∧(⋆J)=4∫−2μ01[(δF)∧(⋆F)+(δF)∧(⋆F)]+(δA)∧(⋆J)=5∫−μ01(δF)∧(⋆F)+(δA)∧(⋆J)=6∫−μ01(δdA)∧(⋆F)+(δA)∧(⋆J)=7∫−μ01d(δA)∧(⋆F)+(δA)∧(⋆J)=8∫−μ01(δA)∧(d⋆F)+(δA)∧(⋆J)=9∫(δA)∧(−μ01d⋆F+⋆J)
其中第 3 个等号用到了:
α∧β=(−1)deg(α)deg(β)β∧α
其中 deg(α) 代表 α 的阶数,例如此处 deg(F)=2 ,因为 F 是 2-form。
第 4 个等号用到了:
⋆α∧β=(−1)deg(⋆α)deg(β)β∧⋆α=(−1)deg(⋆α)deg(β)⟨β,α⟩ω=(−1)deg(⋆α)deg(β)⟨α,β⟩ω=(−1)deg(⋆α)deg(β)α∧⋆β
第 8 个等号用到了分部积分:
∫(dα)∧β=∫[d(α∧β)−(−1)deg(α)α∧dβ]
之所以 ∫Md(α∧β)=0 ,是因为根据斯托克斯定理(Stoke’s theorem), ∫Md(α∧β)=∫∂Mα∧β ,其中 ∂M 是 M 的边界。而 ∫∂Mα∧β=0 (变分法的边界条件为 δA∣∂M=0 )。
由于 δS=0 对任意 δA 成立,于是有 −μ01d⋆F+⋆J=0 ,即麦克斯韦方程:
d⋆F=μ0⋆J
写成这样有什么好处?答案是它很容易被推广到弯曲时空。从平直时空到弯曲时空,我们只需要替换度规即可,这在上式中反映为替换 Hodge 星算子,因为 Hodge 星算子是依赖度规定义的。
最后,我们对比一下指标写法和微分形式写法:
(逆变)指标写法:
∂μ(⋆F)μν∂μFμν=0=μ0Jν
(协变)微分形式写法:
dFd⋆F=0=μ0⋆J
指标写法中的 F ,到了微分形式写法中却变成了对偶 (⋆F) ,反之亦然。这是因为指标写法中的 Fμν 是逆变张量,而微分形式 F 是协变张量。根据 (∇⋅)♯=♯⋆d⋆ ,有 ∂μFμν=♯⋆d⋆F 。见下图:
k-vector fields↑♯k-form↓⋆(n−k)-form⟶(∇⋅)⟶d(k−1)-vector fields↑♯(k−1)-form↑⋆(n−k+1)-form
或者也可以使用更常见的 co-differential d† ,它的定义式为 ⟨α,dβ⟩=⟨d†α,β⟩ 。
可以证明(见附录), d†α=(−1)k⋆−1d⋆α=(−1)nk+n+1s⋆d⋆α ,其中 k=deg(α) , s=sgn(g):=sgn(det(g)) 是度规的符号。
对于闵氏度规, s=−1 。代入 s=−1,,n=4,,k=2 得 d†F=⋆d⋆F 。
所以上图可以画成:
2-vector fields↑♯2-form↓⋆2-form⟶(∇⋅)d†⟶d1-vector fields↑♯1-form↑⋆3-form
于是有
Fμν↑♯F(∇⋅)⋆d⋆∂μFμν=μ0Jν↑♯⋆d⋆F
可见 ∂μFμν=μ0Jν 等价于 ⋆d⋆F=μ0J 。
而对于 1-形式, 有⋆⋆=(−1)k(n−k)+sid=(−1)1(4−1)+1id=id 。所以 ⋆d⋆F=μ0J 等价于 d⋆F=μ0⋆J 。
对于 dF=0⇔∂μ(⋆F)μν=0 的推导也是类似的。
引理 1: d(α∧β)=dα∧β+(−1)deg(α)α∧dβ
证明:
记
α∧β=I,J∑aIbJdxI∧dxJ=i1,⋯,im,j1,⋯,jn∑ai1,⋯,imbj1,⋯,jndxi1∧⋯∧dxim∧dx1j∧⋯∧dxjn
则
d(α∧β)=∂i(aIbJ)dxi∧dxI∧dxJ=[(∂iaI)bJdxi∧dxI]∧dxJ+aI∂ibJdxi∧dxI∧dxJ=(∂iaIdxi∧dxI)∧(bJdxJ)+(−1)deg(α)(aI∂idxI∧dxi)∧(bJdxJ)=dα∧β+(−1)deg(α)α∧dβ
引理 2:当 deg(α)=deg(β) 时,有 ⋆α∧β=(−1)k(n−k)α∧⋆β ,其中 k=deg(α)
证明:
⋆α∧β=(−1)deg(⋆α)deg(β)β∧⋆α=(−1)k(n−k)⟨β,α⟩ω=(−1)k(n−k)⟨α,β⟩ω=(−1)k(n−k)α∧⋆β
引理 3: ⋆⋆α=(−1)k(n−k)sα ,其中 k=deg(α) , s=sgn(g) 。
证明:
⋆α∧⋆⋆α=⟨⋆α,⋆α⟩ω=s⟨α,α⟩ω=sα∧⋆α=(−1)k(n−k)s⋆α∧α=⋆α∧[(−1)k(n−k)sα]
引理 4: d†α=(−1)k⋆−1d⋆α
证明:
⟨β,d†α⟩=⟨dβ,α⟩=∫dβ∧⋆α=∫−(−1)deg(β)β∧d⋆α=∫(−1)deg(β)+1β∧d⋆α=∫(−1)deg(α)β∧d⋆α=∫(−1)deg(α)β∧⋆(⋆−1d⋆α)=(−1)k⟨β,⋆−1d⋆α⟩
引理 5: d†α=(−1)nk+n+1s⋆d⋆α
证明:
结合引理 3 和引理 4 即可证得。
v1.5.0