本学期还上了一门场论课。实际上,我本来是想选量子力学(1)划水的,但是出于种种原因,还是选了场论。这东西我本来是不懂的,因此我料想可以学到许多东西。特别的,我预计一篇文档写不完这个笔记。我打算每三个或两个章节写一篇笔记。
2020-12-21补充:结课了。没有精力和余力维持笔记的质量。因此这会是唯一一篇这个课的笔记。
Intro
量子场论有许多种讲法。从我在逼乎上看到的东西可以推测,这玩意要求你有一个比较不错的量子力学基础,这可以让你更容易地通过一些你已经有些熟悉的例子去把玩新学到的数学。因此我想选一本合适的教材来减弱我的量子无知带来的负面影响。
人们说Peskin的书大概是以上面那种考虑为主而写出来的。在我的情形,我肯定不看这本书。逼乎上还说Zee和Weinberg的书不适合初学者。逼乎上还说Srednicki(我一直把他读成“斯列德尼茨基”,结果好像人们实际并不这样叫他)的书很好。我搞了一本pdf来,还没有看。同Peskin相比,他的书似乎对粒子物理背景之外的人比较好读一些。他开头的“you should recognize and understand"部分对我来说也相对友好些。还有一本QFT for gifted amateurs,可能对我这种低门槛学习者是最友好的,我还得靠这本书补习一些二次量子化之类的玩意。
但以上这些都不是最理想的。最理想的情形是我能够首先学习数学,然后通过这些数学去理解量子物理,而不是相反。好消息是,这门课的老师似乎也是这么想的。毕竟,这门课叫场论,没有“量子”。所以我最后决定,主要看他的讲义。实在有不明白的,再去看其他书。我读书太慢,没有精力看许多书。也许如果当我懂了数学之后,我可以去看srednicki,用他的模块化的办法去理解相关的物理领域,明白相互调用的关系,看看能不能形成一点粗浅的图景式的理解。
Chapter 1, 2
从一个例子(Dirac field),了解一下场论的动机,以及一些基本的概念。然后再通过我们比较熟悉的电磁场和Landau-Ginzburg理论的例子,了解一下场论的pipeline。
Dirac Field:自旋1/2粒子
现代QFT的最初动机非常简单:缝合量子力学和狭义相对论。薛定谔方程并不是洛伦兹协变的,这显然是有问题的嘛!在1920年代,有两拨人试图解决这个问题。
第一拨人的想法是用(人们那时已经习惯的)把波函数语言翻译成粒子语言的办法,形式上从相对论色散关系E 2 = p 2 + m 2 c 4 E^2 = p^2 + m^2c^4 E 2 = p 2 + m 2 c 4 写出
[ ( i ℏ ∂ ∂ t ) 2 − ( ( h c i ∇ ) 2 + m 2 c 4 ) ] Ψ ( x , t ) = 0 \left[\left(i \hbar \frac{\partial}{\partial t}\right)^{2}-\left(\left(\frac{h c}{i} \nabla\right)^{2}+m^{2} c^{4}\right)\right] \Psi(\boldsymbol{x}, t)=0 [ ( i ℏ ∂ t ∂ ) 2 − ( ( i h c ∇ ) 2 + m 2 c 4 ) ] Ψ ( x , t ) = 0
这叫Klein-Gordon方程,我以后叫他KG方程。这样的波函数在洛伦兹变换下是个标量,这是好的。
然而,问题在于从怎么粒子的角度去理解它。人们知道(我不知道)这方程没法描述自旋。而且相对论色散关系并没禁止任意大小的负能量解,或者说,没有基态。这是不好的。早期的物理学家也没有理解这些负能量是怎么回事。
第二拨人是狄拉克。为了避免 负能量解的出现,狄拉克想要搞一个一次的微分方程,让它不和洛伦兹变换相冲突。他搞出来的东西是一个旋量场Ψ a ( x ) ( \Psi_{a}(x)( Ψ a ( x ) ( a = 1 , … , 4 ) a=1, \ldots, 4) a = 1 , … , 4 ) 的方程:
i ℏ ∂ Ψ a ∂ t ( x ) + ℏ c i ∑ j = 1 3 α j a b ∂ j Ψ b ( x ) + m c 2 β a b Ψ b ( x ) = 0 i \hbar \frac{\partial \Psi_{a}}{\partial_{t}}(x)+\frac{\hbar c}{i} \sum_{j=1}^{3} \alpha_{j}^{a b} \partial_{j} \Psi_{b}(x)+m c^{2} \beta_{a b} \Psi_{b}(x)=0 i ℏ ∂ t ∂ Ψ a ( x ) + i ℏ c ∑ j = 1 3 α j a b ∂ j Ψ b ( x ) + m c 2 β a b Ψ b ( x ) = 0
他还需要规定这些旋量分量怎样变换才能实现洛伦兹协变 ,以及(在形式上)与KG方程相容 (但是没有负能量的那些态)。
(实际上,就是把KG方程凑成完全平方的形式:
∇ 2 − ∂ 2 ∂ t 2 = ( A ∂ x + B ∂ y + C ∂ z + i D ∂ t ) ( A ∂ x + B ∂ y + C ∂ z + i D ∂ t ) \nabla^{2}-\frac{\partial^{2}}{\partial t^{2}}=\left(A \partial_{x}+B \partial_{y}+C \partial_{z}+i D \partial_{t}\right)\left(A \partial_{x}+B \partial_{y}+C \partial_{z}+i D \partial_{t}\right) ∇ 2 − ∂ t 2 ∂ 2 = ( A ∂ x + B ∂ y + C ∂ z + i D ∂ t ) ( A ∂ x + B ∂ y + C ∂ z + i D ∂ t )
然后他发现这里面的系数得是最低四维的矩阵。)
我们暂且先看后者。总之,狄拉克发现,在旋量分量协变的情况下,为了凑出来KG方程,狄拉克方程里面的这些α , β \alpha, \beta α , β (它们是一些4*4的矩阵)需要满足Clifford代数:
{ α i , α j } = 2 δ i j I , { α i , β } = 0 , α i 2 = β 2 = I \left\{\alpha_{i}, \alpha_{j}\right\}=2 \delta_{i j} I, \quad\left\{\alpha_{i}, \beta\right\}=0, \quad \alpha_{i}^{2}=\beta^{2}=I { α i , α j } = 2 δ i j I , { α i , β } = 0 , α i 2 = β 2 = I
此代数的一种最简单的表示是狄拉克表示。
α i = ( 0 σ i σ i 0 ) β = ( I 0 0 − I ) \alpha^{i}=\left(\begin{array}{cc}0 & \sigma^{i} \\ \sigma^{i} & 0\end{array}\right) \quad \beta=\left(\begin{array}{cc}I & 0 \\ 0 & -I\end{array}\right) α i = ( 0 σ i σ i 0 ) β = ( I 0 0 − I )
σ \sigma σ 是泡利矩阵。我们在讲自旋1/2粒子的量子力学课上见过它们。
狄拉克发现有更简单的办法来书写狄拉克方程。他定义γ 0 = β γ i = β α i \gamma^{0}=\beta \quad \gamma^{i}=\beta \alpha^{i} γ 0 = β γ i = β α i ,然后得到狄拉克代数{ γ μ , γ ν } = 2 g μ ν I \left\{\gamma^{\mu}, \gamma^{\nu}\right\}=2 g^{\mu \nu} I { γ μ , γ ν } = 2 g μ ν I 。用这种办法,他可以写( i γ μ ∂ μ − m c h ) Ψ = 0 \left(i \gamma^{\mu} \partial_{\mu}-\frac{m c}{h}\right) \Psi=0 ( i γ μ ∂ μ − h m c ) Ψ = 0 。如果定义feynman’s slash a̸ ≡ a μ γ μ \not{a} \equiv a_{\mu} \gamma^{\mu} a ≡ a μ γ μ ,并使用自然单位制(h=c=1),那么狄拉克方程就可以写成
( i ∂̸ − m ) Ψ = 0 \left(i \not \partial-m\right) \Psi=0 ( i ∂ − m ) Ψ = 0
可以证明,KG方程用这种记号可以写成( i ∂̸ + m ) ( i ∂̸ − m ) Ψ = 0 (i \not \partial+m)(i \not \partial-m) \Psi=0 ( i ∂ + m ) ( i ∂ − m ) Ψ = 0 。这样,它们确是相容的。
这一段中,除了记号外,代数结构和它们的表示也是非常重要的,因为我们将会看到,我们做一切物理上ab initio事情的主要动机就是对称性。我们从系统中观察到对称性和别的数学结构,我们用代数结构来刻画它们,用表示论来让它们可计算。然后我们把写下的描述塞到这门课教给我们的pipeline里面,通过繁杂的算术得到完整的“理论”。
再插播一种记号。我们定义Ψ ˉ = Ψ † γ 0 \bar{\Psi}=\Psi^{\dagger} \gamma^{0} Ψ ˉ = Ψ † γ 0 ,可以得到一个守恒流j μ = Ψ ˉ γ μ Ψ j^{\mu}=\bar{\Psi} \gamma^{\mu} \Psi j μ = Ψ ˉ γ μ Ψ ,守恒就是说∂ μ j μ = 0 \partial_{\mu} j^{\mu}=0 ∂ μ j μ = 0 。注意到,j 0 = Ψ ˉ γ 0 Ψ ≡ Ψ † Ψ j^{0}=\bar{\Psi} \gamma^{0} \Psi \equiv \Psi^{\dagger} \Psi j 0 = Ψ ˉ γ 0 Ψ ≡ Ψ † Ψ 与概率密度具有一样的形式,但是它可正可负,它不是概率密度。以后我们会看到它实际上是(场携带的)荷 的密度。
现在再看洛伦兹协变的事情。如果做洛伦兹变换x μ ′ = Λ μ ν x ν x_{\mu}^{\prime}=\Lambda_{\mu}^{\nu} x_{\nu} x μ ′ = Λ μ ν x ν ,旋量空间的变换形式上可写成
Ψ α ′ ( x ′ ) = S ( Λ ) α β Ψ β ( x ) \Psi_{\alpha}^{\prime}\left(x^{\prime}\right)=S(\Lambda)_{\alpha \beta} \Psi_{\beta}(x) Ψ α ′ ( x ′ ) = S ( Λ ) α β Ψ β ( x )
为了保证方程的协变性,S应该满足
S ( Λ ) γ μ S ( Λ ) − 1 = ( Λ − 1 ) ν μ γ ν S(\Lambda) \gamma^{\mu} S(\Lambda)^{-1}=\left(\Lambda^{-1}\right)_{\nu}^{\mu} \gamma^{\nu} S ( Λ ) γ μ S ( Λ ) − 1 = ( Λ − 1 ) ν μ γ ν 。
从这个式子可以看出来:如果Λ \Lambda Λ 是个boost,那么S ( Λ ) S(\Lambda) S ( Λ ) 是厄密的;如果是个旋转,那么S ( Λ ) S(\Lambda) S ( Λ ) 是幺正的。事实上,S ( Λ ) S(\Lambda) S ( Λ ) 正是洛伦兹群S O ( 3 , 1 ) S O(3,1) S O ( 3 , 1 ) 的表示。
现在我们看看怎样表示无穷小洛伦兹变换的生成元。对于这样的洛伦兹变换,我们给一个无穷小的,反对称的扰动ω ν μ \omega_{\nu}^{\mu} ω ν μ ,然后把S展开到一阶项(系数i/4是人为定的):
S ( Λ ) = I − i 4 σ μ ν ω μ ν + … S − 1 ( Λ ) = I + i 4 σ μ ν ω μ ν + … \begin{aligned} S(\Lambda) &=I-\frac{i}{4} \sigma_{\mu \nu} \omega^{\mu \nu}+\ldots \\ S^{-1}(\Lambda) &=I+\frac{i}{4} \sigma_{\mu \nu} \omega^{\mu \nu}+\ldots \end{aligned} S ( Λ ) S − 1 ( Λ ) = I − 4 i σ μ ν ω μ ν + … = I + 4 i σ μ ν ω μ ν + …
带入S需要满足的条件,可以知道生成元σ μ ν \sigma_{\mu \nu} σ μ ν 的条件:σ μ ν = i 2 [ γ μ , γ ν ] \sigma_{\mu \nu}=\frac{i}{2}\left[\gamma_{\mu}, \gamma_{\nu}\right] σ μ ν = 2 i [ γ μ , γ ν ] 。这玩意和泡利矩阵的关系是ϵ l j k σ j k = 2 σ l \epsilon_{ljk}\sigma_{jk}=2\sigma_l ϵ l j k σ j k = 2 σ l 。
这个生成元描述了洛伦兹变换在变换后 坐标系的影响。与之相比,我们实际上更熟悉的是洛伦兹变换在变换前 坐标系的影响。例如,如果我们忽略boost,剩下的旋转部分的这种生成元就是角动量。让我们来看一看加上boost之后会发生什么。这时候S矩阵将被换成U矩阵,其满足
Ψ ′ ( x ) = U ( Λ ) Ψ ( x ) = S ( Λ ) Ψ ( Λ − 1 x ) \Psi^{\prime}(x)=U(\Lambda) \Psi(x)=S(\Lambda) \Psi\left(\Lambda^{-1} x\right) Ψ ′ ( x ) = U ( Λ ) Ψ ( x ) = S ( Λ ) Ψ ( Λ − 1 x )
用与上面相同的办法,得到U ( Λ ) = I − i 2 J μ ν ω μ ν + … U(\Lambda)=I-\frac{i}{2} J_{\mu \nu} \omega^{\mu \nu}+\ldots U ( Λ ) = I − 2 i J μ ν ω μ ν + … ,然后
J μ ν = 1 2 σ μ ν + i ( x μ ∂ ν − x ν ∂ μ ) J_{\mu \nu}=\frac{1}{2} \sigma_{\mu \nu}+i\left(x_{\mu} \partial_{\nu}-x_{\nu} \partial_{\mu}\right) J μ ν = 2 1 σ μ ν + i ( x μ ∂ ν − x ν ∂ μ )
显然,第二项就是(轨道)角动量。第一项这个就是自旋。事实上,以前我也听说过一种说法,即如果自旋真是像经典图像里那样是电子在打转,那么电子表面的线速度将超过光速;但是我从来没有想过如何将电子的自旋作为相对论效应来理解。现在我似乎有一点理解了。
我们已经知道了狄拉克方程是什么,也知道它能够解释电子自旋。现在,我们从场论的角度理解一下这回事。
狄拉克方程是一个场Ψ \Psi Ψ 的方程。一般在场论里面,人们都是从拉氏量得到运动方程/场方程的。在这里,我们则反过来。从场方程知道一个最简单的拉氏量可以是(但如果我们不知道狄拉克方程,我们怎么确定这个形式?我现在还不知道,希望以后会知道):
L = Ψ ˉ ( i ∂̸ − m ) Ψ ≡ 1 2 Ψ ˉ i ∂̸ ↔ Ψ − m Ψ ˉ Ψ \mathcal{L}=\bar{\Psi}(i \not \partial-m) \Psi \equiv \frac{1}{2} \bar{\Psi} i \stackrel{\leftrightarrow}{\not{\partial}} \Psi-m \bar{\Psi} \Psi L = Ψ ˉ ( i ∂ − m ) Ψ ≡ 2 1 Ψ ˉ i ∂ ↔ Ψ − m Ψ ˉ Ψ
其中
Ψ ˉ ∂̸ ↔ Ψ ≡ Ψ ˉ ( ∂̸ Ψ ) − ( ∂ μ Ψ ˉ ) γ μ Ψ \bar{\Psi} \stackrel{\leftrightarrow}{\not \partial} \Psi \equiv \bar{\Psi}(\not \partial \Psi)-\left(\partial_{\mu} \bar{\Psi}\right) \gamma^{\mu} \Psi Ψ ˉ ∂ ↔ Ψ ≡ Ψ ˉ ( ∂ Ψ ) − ( ∂ μ Ψ ˉ ) γ μ Ψ 。
这样,从最小作用量原理得到运动方程
δ L δ Ψ α − ∂ μ δ L δ ∂ μ Ψ α = 0 \frac{\delta \mathcal{L}}{\delta \Psi_{\alpha}}-\partial_{\mu} \frac{\delta \mathcal{L}}{\delta \partial_{\mu} \Psi_{\alpha}}=0 δ Ψ α δ L − ∂ μ δ ∂ μ Ψ α δ L = 0
δ L δ Ψ ˉ α − ∂ μ δ L δ ∂ μ Ψ ˉ α = 0 \frac{\delta \mathcal{L}}{\delta \bar{\Psi}_{\alpha}}-\partial_{\mu} \frac{\delta \mathcal{L}}{\delta \partial_{\mu} \bar{\Psi}_{\alpha}}=0 δ Ψ ˉ α δ L − ∂ μ δ ∂ μ Ψ ˉ α δ L = 0
也就是( i ∂̸ − m ) Ψ = 0 , (i \not \partial-m) \Psi=0, \quad ( i ∂ − m ) Ψ = 0 , 和Ψ ˉ ( i ∂̸ ← + m ) = 0 \quad \bar{\Psi}(i \overleftarrow{\not\partial}+m)=0 Ψ ˉ ( i ∂ + m ) = 0 。我们进一步还可以写出广义动量
Π ( x ) = δ L δ ∂ 0 Ψ ( x ) = i Ψ ˉ ( x ) γ 0 ≡ i Ψ † ( x ) \Pi(x)=\frac{\delta \mathcal{L}}{\delta \partial_{0} \Psi(x)}=i \bar{\Psi}(x) \gamma^{0} \equiv i \Psi^{\dagger}(x) Π ( x ) = δ ∂ 0 Ψ ( x ) δ L = i Ψ ˉ ( x ) γ 0 ≡ i Ψ † ( x )
并以此得到哈密顿量
H = Π ( x ) ∂ 0 Ψ ( x ) − L = i Ψ ˉ γ 0 ∂ 0 Ψ − L = Ψ ˉ i γ ⋅ ∇ Ψ + m Ψ ˉ Ψ = Ψ † ( i α ⋅ ∇ + m β ) Ψ \begin{aligned} \mathcal{H} &=\Pi(x) \partial_{0} \Psi(x)-\mathcal{L}=i \bar{\Psi} \gamma^{0} \partial_{0} \Psi-\mathcal{L} \\ &=\bar{\Psi} i \gamma \cdot \nabla \Psi+m \bar{\Psi} \Psi \\ &=\Psi^{\dagger}(i \alpha \cdot \nabla+m \beta) \Psi \end{aligned} H = Π ( x ) ∂ 0 Ψ ( x ) − L = i Ψ ˉ γ 0 ∂ 0 Ψ − L = Ψ ˉ i γ ⋅ ∇ Ψ + m Ψ ˉ Ψ = Ψ † ( i α ⋅ ∇ + m β ) Ψ
注意到,这个量不是正定的。因此,我们可能会担心这个系统的稳定性,事实上这种担心也确实是对的。以后我们会看到,为了让这个系统稳定,我们得加一个泡利不相容原理。在这里,粒子的场方程/自旋与粒子的统计(例如,泡利原理即意味着费米-狄拉克统计)之间有某种联系。这正是spin-statistics theorem的一个例子。
(幼儿园版)Ginzburg-Landau理论
这是一个很好的例子,它比狄拉克方程更加具有场论的特点而少了许多影响理解的细节。这个理论就是假设顺磁物质有一个良好定义的序参量,然后它是一个标量场。如果我们只从物理性质去理解序参量的场的自由能,我们会要求他是
定域的(能用PDE表达的)
对称的(做了傅里叶变换之后,只含有偶次项;不显含坐标x \mathbf{x} x )
变化比较小的(这里比较tricky,总之,在所有四次项里,只留下M 4 M^4 M 4 ,而舍去( ∇ M ) 4 (\nabla M)^4 ( ∇ M ) 4 等项)。
我们把它写成
E ( M ) = ∫ d D x ( 1 2 K ( T ) ∣ ∇ M ( x ) ∣ 2 + 1 2 a ( T ) M 2 ( x ) + 1 4 ! b ( T ) M 4 ( x ) + … ) E(M)=\int d^{D} x\left(\frac{1}{2} K(T)|\nabla M(x)|^{2}+\frac{1}{2} a(T) M^{2}(x)+\frac{1}{4 !} b(T) M^{4}(x)+\ldots\right) E ( M ) = ∫ d D x ( 2 1 K ( T ) ∣ ∇ M ( x ) ∣ 2 + 2 1 a ( T ) M 2 ( x ) + 4 ! 1 b ( T ) M 4 ( x ) + … )
做代换Φ ( x ) = K M ( x ) \Phi(x)=\sqrt{K} M(x) Φ ( x ) = K M ( x ) ,将自由能写成F ( Φ ) = ∫ d D x { 1 2 ( ∇ Φ ) 2 + U ( Φ ) } F(\Phi)=\int d^{D} x\left\{\frac{1}{2}(\nabla \Phi)^{2}+U(\Phi)\right\} F ( Φ ) = ∫ d D x { 2 1 ( ∇ Φ ) 2 + U ( Φ ) } 。为了求出系统的状态,使用我们在统计力学课上学过的鞍点近似,对自由能做变分让其为零,得到朗道金茨堡方程
0 = − ∇ 2 Φ c ( x ) + m ˉ 2 Φ c ( x ) + λ 3 ! Φ c 3 ( x ) 0=-\nabla^{2} \Phi_{c}(\boldsymbol{x})+\bar{m}^{2} \Phi_{c}(\boldsymbol{x})+\frac{\lambda}{3 !} \Phi_{c}^{3}(\boldsymbol{x}) 0 = − ∇ 2 Φ c ( x ) + m ˉ 2 Φ c ( x ) + 3 ! λ Φ c 3 ( x ) 。
最低能量下肯定∇ 2 Φ c ( x ) = 0 \nabla^{2} \Phi_{c}(\boldsymbol{x})=0 ∇ 2 Φ c ( x ) = 0 。这时,方程剩下的那部分就是我们在统计力学课上学到的关于顺磁相变的知识了。
Wick转动
Wick转动是一个解析延拓的操作,它将量子场论和经典统计力学联系在一起。(注:此处“经典”指非相对论的。不存在“非量子”的统计力学。我很不喜欢人们管“量子”和“相对论性”的反义词都叫经典这回事。)它本身也是QFT里面一个很有用的技巧。
假设在一个D = d + 1 D=d+1 D = d + 1 维闵氏时空中有一个实值的标量场。它的作用量是
S = ∫ d D x L ( Φ , ∂ μ Ψ ) S=\int d^{D} x \mathcal{L}\left(\Phi, \partial_{\mu} \Psi\right) S = ∫ d D x L ( Φ , ∂ μ Ψ ) ,
其中d D x ≡ d x 0 d d x d^{D} x \equiv d x_{0} d^{d} x d D x ≡ d x 0 d d x 。现在把时间x 0 x_0 x 0 延拓到复平面,定义虚时间x 0 ↦ − i x D x_{0} \mapsto-i x_{D} x 0 ↦ − i x D ,这就是Wick转动。在这个变化下,
i S ≡ i ∫ d x 0 d d x L ( Φ , ∂ 0 Ψ , ∂ j Φ ) ↦ ∫ d D x L ( Φ , − i ∂ D Φ , ∂ j Φ ) i S \equiv i \int d x_{0} d^{d} x \mathcal{L}\left(\Phi, \partial_{0} \Psi, \partial_{j} \Phi\right) \mapsto \int d^{D} x \mathcal{L}\left(\Phi,-i \partial_{D} \Phi, \partial_{j} \Phi\right) i S ≡ i ∫ d x 0 d d x L ( Φ , ∂ 0 Ψ , ∂ j Φ ) ↦ ∫ d D x L ( Φ , − i ∂ D Φ , ∂ j Φ ) 。
大多数情况下,闵氏时空的拉氏量形如L = 1 2 ( ∂ μ Φ ) 2 − V ( Φ ) ≡ 1 2 ( ∂ 0 Φ ) 2 − 1 2 ( ∇ Φ ) 2 − V ( Φ ) \mathcal{L}=\frac{1}{2}\left(\partial_{\mu} \Phi\right)^{2}-V(\Phi) \equiv \frac{1}{2}\left(\partial_{0} \Phi\right)^{2}-\frac{1}{2}(\nabla \Phi)^{2}-V(\Phi) L = 2 1 ( ∂ μ Φ ) 2 − V ( Φ ) ≡ 2 1 ( ∂ 0 Φ ) 2 − 2 1 ( ∇ Φ ) 2 − V ( Φ ) ,而这在做Wick转动之后会得到一个形如L ( Φ , − i ∂ D Ψ , ∇ Φ ) = − 1 2 ( ∂ D Φ ) 2 − 1 2 ( ∇ Φ ) 2 − V ( Φ ) \mathcal{L}\left(\Phi,-i \partial_{D} \Psi, \nabla \Phi\right)=-\frac{1}{2}\left(\partial_{D} \Phi\right)^{2}-\frac{1}{2}(\nabla \Phi)^{2}-V(\Phi) L ( Φ , − i ∂ D Ψ , ∇ Φ ) = − 2 1 ( ∂ D Φ ) 2 − 2 1 ( ∇ Φ ) 2 − V ( Φ ) 的玩意,这是我们熟悉的自由能。可以看到,闵氏度规下的最小作用量原理同经典度规下的自由能鞍点近似是一样的。这启发我们从经典统计物理的角度去理解场论。假如我们手上有一个场论的问题,我们可以写出它对应的统计物理问题的配分函数:Z = ∫ D Φ e i S ( Φ , ∂ μ Φ ) / h \mathcal{Z}=\int \mathcal{D} \Phi e^{i S\left(\Phi, \partial_{\mu} \Phi\right) / h} Z = ∫ D Φ e i S ( Φ , ∂ μ Φ ) / h 。这是个啥?这就是场的路径积分量子化。形式上,h → 0 h \rightarrow 0 h → 0 的近似正对应统计物理的低温情形,这时系统的行为是没有涨落的,是确定的——也就是经典(非量子)物理的情形。
Chapt 3
进入一些细节性的讨论,用一些例子来展示
我们从系统中观察到对称性和别的数学结构,我们用代数结构来刻画它们,用表示论来让它们可计算。
到底是在干啥。
对称性有几种。首先可以分类为时空对称性和内部(internal)对称性。后者是没有经典对应的——它们的意义在QFT中才能体现出来。然后,还有global和local对称性的区分。下面会解释清楚这些都是啥。首先我们看看当年人们最开始把对称性放到这么重要位置的原因:
连续对称性与诺特定理
每一个连续 的全局 对称性对应一个全局 守恒量。
首先,我们注意到局部守恒流和运动常数之间的关系。对于守恒流j j j ,∂ μ j μ ( x ) = 0 \partial_{\mu} j^{\mu}(x)=0 ∂ μ j μ ( x ) = 0 ,在闵氏时空下有0 = ∫ Ω d 4 x ∂ μ j μ ( x ) = ∮ ∂ Ω d S μ j μ ( x ) 0=\int_{\Omega} d^{4} x \partial_{\mu} j^{\mu}(x)=\oint_{\partial \Omega} d S_{\mu} j^{\mu}(x) 0 = ∫ Ω d 4 x ∂ μ j μ ( x ) = ∮ ∂ Ω d S μ j μ ( x ) ,如果令该流在无穷远处为0,那么取一个扁而无穷宽大的圆柱形面,在该面上得到0 = ∫ V ( T + Δ T ) d S 0 j 0 ( x , T + Δ T ) − ∫ V ( T ) d S 0 j 0 ( x , T ) 0=\int_{V(T+\Delta T)} d S_{0} j^{0}(\boldsymbol{x}, T+\Delta T)-\int_{V(T)} d S_{0} j^{0}(\boldsymbol{x}, T) 0 = ∫ V ( T + Δ T ) d S 0 j 0 ( x , T + Δ T ) − ∫ V ( T ) d S 0 j 0 ( x , T ) ,可知
Q ( T ) ≡ ∫ V ( T ) d 3 x j 0 ( x , T ) Q(T) \equiv \int_{V(T)} d^{3} x j^{0}(\boldsymbol{x}, T) Q ( T ) ≡ ∫ V ( T ) d 3 x j 0 ( x , T )
是运动常数。我们称之为诺特荷 。现在我们将守恒量的事情转为了守恒流的事情,接下来我们分别对internal和时空对称性证明诺特定理。
内部(internal)对称性
我们到底为什么要这样区分内部与时空对称性,它们有什么不同?我看到的材料都没有好好解释这个问题,但我的一个粗浅的理解是,后者是时空坐标 的对称性/不变性,它长什么样是由度规决定的。而前者是场本身 的对称性/不变性,它是由场的形式决定的。想象一下,所有的场的函数形式构成一个流形。如果我沿着某一个方向做一个无穷小的扰动,而场方程的形式不变,那说明这个方向是特殊的。现在我们考虑这个流形上每一点都有这么一个方向,形成一个向量场,我们可以把这个向量场理解成附加的一种代数结构,它刻画了我们这个场的描述的冗余度。拿这个流形“除“掉这个向量场(我的数学很差,我也不知道数学家怎么形容这个事, 我曾经看过fiber bundle的资料,但转眼又飘散如烟),就得到“不冗余”的描述,而你除掉的这个结构就是这个internal对称性的代数结构。特别的,如果这个结构是显式跟时空坐标couple起来的,也就是说,是局域的,那么这种局域的、内部的 对称性叫做规范对称性 。
现在比如说我们有一个场,他有一个全局的内部对称性 ,比如说实值标量场、U ( 1 ) U(1) U ( 1 ) 对称性。
\begin{aligned} \phi(x) & \mapsto \phi^{\prime}(x)=e^{i \alpha} \phi(x) \\ \phi^{\*}(x) & \mapsto \phi^{\prime \*}(x)=e^{-i \alpha} \phi^{\*}(x) \end{aligned}
利用变换后最小作用量原理仍成立这一点,得到
\delta \mathcal{L}=\partial_{\mu}\left[i\left(\frac{\delta \mathcal{L}}{\delta \partial_{\mu} \phi} \phi-\frac{\delta \mathcal{L}}{\delta \partial_{\mu} \phi^{\*}} \phi^{\*}\right) \alpha\right]=0
那就自然有了一个守恒流
j^{\mu}=i\left(\frac{\delta \mathcal{L}}{\delta \partial_{\mu} \phi} \phi-\frac{\delta \mathcal{L}}{\delta \partial_{\mu} \phi^{\*}} \phi^{\*}\right) 。
对于全局内部对称性的一般情形,人们用N*N矩阵λ k \lambda^{k} λ k 作为对应的李群的生成元的表示(复习:N是表示的维数,而k的最大值是群的秩,这俩没啥关系),场的对称性写作
ϕ a ′ ( x ) = ( exp [ i λ k θ k ] ) a b ϕ b ( x ) \phi_{a}^{\prime}(x)=\left(\exp \left[i \lambda^{k} \theta^{k}\right]\right)_{a b} \phi_{b}(x) ϕ a ′ ( x ) = ( exp [ i λ k θ k ] ) a b ϕ b ( x )
λ k \lambda^{k} λ k 对应一个李代数[ λ j , λ k ] = i f j k l λ l \left[\lambda^{j}, \lambda^{k}\right]=i f^{j k l} \lambda^{l} [ λ j , λ k ] = i f j k l λ l 。(已经归一化为tr λ a λ b = 1 2 δ a b \operatorname{tr} \lambda^{a} \lambda^{b}=\frac{1}{2} \delta^{a b} t r λ a λ b = 2 1 δ a b ),我们比较关心的系数f f f 称作李群的结构常数。比如说,对于角动量的S U ( 2 ) S U(2) S U ( 2 ) 对称性,有[ J i , J j ] = i ϵ i j k J k \left[J_{i}, J_{j}\right]=i \epsilon_{i j k} J_{k} [ J i , J j ] = i ϵ i j k J k ,tr ( J i J j ) = 1 2 δ i j \operatorname{tr}\left(J_{i} J_{j}\right)=\frac{1}{2} \delta_{i j} t r ( J i J j ) = 2 1 δ i j 。
总之呢,对于这种一般情形,我们可以一样的写出守恒流。注意到生成元的数目等于守恒流的数目。如果是个实值场,那么
j μ k ( x ) = δ L δ ∂ μ ϕ a ( x ) λ a b k ϕ b ( x ) j_{\mu}^{k}(x)=\frac{\delta \mathcal{L}}{\delta \partial_{\mu} \phi^{a}(x)} \lambda_{a b}^{k} \phi_{b}(x) j μ k ( x ) = δ ∂ μ ϕ a ( x ) δ L λ a b k ϕ b ( x )
如果是个复值场,那么
j_{\mu}^{k}(x)=i\left(\frac{\delta \mathcal{L}}{\delta \partial_{\mu} \phi^{a}(x)} \lambda_{a b}^{k} \phi_{b}(x)-\frac{\delta \mathcal{L}}{\delta \partial_{\mu} \phi^{a}(x)^{\*}} \lambda_{a b}^{k} \phi_{b}(x)^{\*}\right) 。
稍微复杂些,对于规范对称性 ,分量θ k \theta_k θ k 成为时空坐标的函数,即
ϕ a ( x ) → ϕ a ′ ( x ) = ( exp [ i λ k θ k ( x ) ] ) a b ϕ b ( x ) \phi_{a}(x) \rightarrow \phi_{a}^{\prime}(x)=\left(\exp \left[i \lambda^{k} \theta^{k}(x)\right]\right)_{a b} \phi_{b}(x) ϕ a ( x ) → ϕ a ′ ( x ) = ( exp [ i λ k θ k ( x ) ] ) a b ϕ b ( x )
问题来了,我们拉氏量无论如何也没法不变啊,因为拉氏量里面通常会有一阶导,而即使考虑最简单的规范对称性,也会发现
∂ μ ϕ ( x ) → ∂ μ ϕ ′ ( x ) = ∂ μ [ e i θ ( x ) ϕ ( x ) ] = e i θ ( x ) [ ∂ μ ϕ + i ϕ ∂ μ θ ] \partial_{\mu} \phi(x) \rightarrow \partial_{\mu} \phi^{\prime}(x)=\partial_{\mu}\left[e^{i \theta(x)} \phi(x)\right]=e^{i \theta(x)}\left[\partial_{\mu} \phi+i \phi \partial_{\mu} \theta\right] ∂ μ ϕ ( x ) → ∂ μ ϕ ′ ( x ) = ∂ μ [ e i θ ( x ) ϕ ( x ) ] = e i θ ( x ) [ ∂ μ ϕ + i ϕ ∂ μ θ ]
这有一个相位差消不掉。为啥?因为我们在局部确定ϕ ( x ) \phi(x) ϕ ( x ) 的相位的时候总是要找一个局部坐标系,它在每个地方都不一样,我们有选择的自由度,但这个自由度是冗余的,因为系统的物理性质并不依赖于这些局部坐标系的选取。比如说,把一只猫从窗户扔出去,众所周知,猫会一顿操作然后稳稳四脚着地。如果猫真是终结者那样的“液体”,那它飞在天上的时候,可以缩骨改变自己的形状,也可以旋转自己的方向。描述猫的默认方向的局部坐标系选取不同,则测量者认为的“改变形状”和“旋转方向”的测量数值就不同。但猫的运动是确定的。一个更实际的例子见之前写的这篇 。
所以,为了描述局部坐标系的影响,我们得做些准备工作。
首先,可以用数学结构(一个向量场)把相邻的局部坐标系联系起来,这就是联络。比如,可以记作δ ϕ ( x ) = i A μ ( x ) d x μ ϕ ( x ) \delta \phi(x)=i A_{\mu}(x) d x^{\mu} \phi(x) δ ϕ ( x ) = i A μ ( x ) d x μ ϕ ( x ) ,A就是联络。考虑联络因素后,我们将导数改写成协变导数,D μ ϕ ≡ ∂ μ ϕ ( x ) − i e A μ ( x ) ϕ ( x ) ≡ ( ∂ μ − i e A μ ) ϕ D_{\mu} \phi \equiv \partial_{\mu} \phi(x)-i e A_{\mu}(x) \phi(x) \equiv\left(\partial_{\mu}-i e A_{\mu}\right) \phi D μ ϕ ≡ ∂ μ ϕ ( x ) − i e A μ ( x ) ϕ ( x ) ≡ ( ∂ μ − i e A μ ) ϕ ,其中e是所谓“耦合常数”。我们之后会看到,在物质场和规范场耦合的情况下,这个量具有物理意义。
为了让协变导数真的协变,我们可以得到联络在ϕ → e i θ ϕ \phi \rightarrow e^{i \theta} \phi ϕ → e i θ ϕ 下变换为A μ → A μ ′ = A μ + 1 e ∂ μ θ A_{\mu} \rightarrow A_{\mu}^{\prime}=A_{\mu}+\frac{1}{e} \partial_{\mu} \theta A μ → A μ ′ = A μ + e 1 ∂ μ θ 。协变导数为零的解称之为测地线:D μ ϕ c = ( ∂ μ − i e A μ ) ϕ c ≡ 0 D_{\mu} \phi_{c}=\left(\partial_{\mu}-i e A_{\mu}\right) \phi_{c} \equiv 0 D μ ϕ c = ( ∂ μ − i e A μ ) ϕ c ≡ 0 。测地线上,
ϕ c ( x ) = e − i e ∫ Γ ( x , y ) d z μ A μ ( z ) ϕ c ( y ) \phi_{c}(x)=e^{-i e \int_{\Gamma(x, y)} d z_{\mu} A^{\mu}(z)} \phi_{c}(y) ϕ c ( x ) = e − i e ∫ Γ ( x , y ) d z μ A μ ( z ) ϕ c ( y ) 。
注意,沿着测地线走一圈,相位的变化为
Δ γ = − e ∫ Γ 1 d z μ A μ + e ∫ Γ 2 d z μ A μ ≡ − e ∮ Γ + d z μ A μ \Delta \gamma=-e \int_{\Gamma_{1}} d z_{\mu} A^{\mu}+e \int_{\Gamma_{2}} d z_{\mu} A^{\mu} \equiv-e \oint_{\Gamma^{+}} d z_{\mu} A^{\mu} Δ γ = − e ∫ Γ 1 d z μ A μ + e ∫ Γ 2 d z μ A μ ≡ − e ∮ Γ + d z μ A μ
这东西当然不一定是0。它反映了啥呢?它反映了这一圈里面的流形表面上对着旋度积分,结果非零,或者说,流形表面在这里有可能鼓起来或者凹下去了。用斯托克斯公式将这个东西写为
Δ γ = − e 2 ∫ Σ + d S μ ν F μ ν = − e Φ ( Σ ) \Delta \gamma=-\frac{e}{2} \int_{\Sigma^{+}} d S_{\mu \nu} F^{\mu \nu}=-e \Phi(\Sigma) Δ γ = − 2 e ∫ Σ + d S μ ν F μ ν = − e Φ ( Σ )
其中F μ ν = ∂ μ A ν − ∂ ν A μ F^{\mu \nu}=\partial^{\mu} A^{\nu}-\partial^{\nu} A^{\mu} F μ ν = ∂ μ A ν − ∂ ν A μ 就是联络A的曲率,物理学上叫他规范场A的场强,如果A是电磁学里的矢势,那么F就是电磁场张量。一般的曲率F满足关系F μ ν = i e [ D μ , D μ ] F^{\mu \nu}=\frac{i}{e}\left[D^{\mu}, D^{\mu}\right] F μ ν = e i [ D μ , D μ ] 。
一个有名的实验,Aharonov-Bohm效应,就对矢势版本的A测了一把相位差。当然是测出来了,这也表明以前人们一直当做是假想、辅助概念的“矢势”真有物理意义,侧面也说明电磁场这玩意不是法拉第幻想出来的,它是一个物理实体。
现在再回来看规范对称性下的场(一般情况)。
为了方便,之前的ϕ a ( x ) → ϕ a ′ ( x ) = ( exp [ i λ k θ k ( x ) ] ) a b ϕ b ( x ) \phi_{a}(x) \rightarrow \phi_{a}^{\prime}(x)=\left(\exp \left[i \lambda^{k} \theta^{k}(x)\right]\right)_{a b} \phi_{b}(x) ϕ a ( x ) → ϕ a ′ ( x ) = ( exp [ i λ k θ k ( x ) ] ) a b ϕ b ( x ) 重写为ϕ a ′ ( x ) = U a b ϕ b ( x ) \phi_{a}^{\prime}(x)=U_{a b} \phi_{b}(x) ϕ a ′ ( x ) = U a b ϕ b ( x ) 。假设我们现在有一个普通的拉氏量L = ∂ μ ϕ a ∗ ∂ μ ϕ a − V ( ∣ ϕ ∣ 2 ) \mathcal{L}=\partial_{\mu} \phi_{a}^{*} \partial^{\mu} \phi^{a}-V\left(|\phi|^{2}\right) L = ∂ μ ϕ a ∗ ∂ μ ϕ a − V ( ∣ ϕ ∣ 2 ) 。
首先搞协变导数。这是一个N*N的算符:D μ = I ∂ μ − i g A μ ( x ) D_{\mu}=I \partial_{\mu}-i g A_{\mu}(x) D μ = I ∂ μ − i g A μ ( x ) ,g是耦合常数。规范场的分量记作( A μ ( x ) ) a b = A μ k ( x ) λ a b k \left(A_{\mu}(x)\right)_{a b}=A_{\mu}^{k}(x) \lambda_{a b}^{k} ( A μ ( x ) ) a b = A μ k ( x ) λ a b k 。为了达成协变性,一番操作得到
A μ ′ ( x ) = U ( x ) A μ ( x ) U − 1 ( x ) − i g ( ∂ μ U ( x ) ) U − 1 ( x ) A_{\mu}^{\prime}(x)=U(x) A_{\mu}(x) U^{-1}(x)-\frac{i}{g}\left(\partial_{\mu} U(x)\right) U^{-1}(x) A μ ′ ( x ) = U ( x ) A μ ( x ) U − 1 ( x ) − g i ( ∂ μ U ( x ) ) U − 1 ( x )
对于非阿贝尔规范场,两边的U U U 和U − 1 U^{-1} U − 1 是消不掉的。假设我们取一个无穷小的U,
( U ( x ) ) a b = [ exp ( i λ k θ k ( x ) ) ] a b ≅ δ a b + i λ a b k θ k ( x ) + … (U(x))_{a b}=\left[\exp \left(i \lambda^{k} \theta^{k}(x)\right)\right]_{a b} \cong \delta_{a b}+i \lambda_{a b}^{k} \theta^{k}(x)+\ldots ( U ( x ) ) a b = [ exp ( i λ k θ k ( x ) ) ] a b ≅ δ a b + i λ a b k θ k ( x ) + …
那么标量场的变化是
δ ϕ a ( x ) ≅ i λ a b k ϕ b ( x ) θ k ( x ) + … \delta \phi_{a}(x) \cong i \lambda_{a b}^{k} \phi_{b}(x) \theta^{k}(x)+\ldots δ ϕ a ( x ) ≅ i λ a b k ϕ b ( x ) θ k ( x ) + …
而规范场的变化是
δ A μ k ( x ) ≅ i f k s j A μ j ( x ) θ s ( x ) + 1 g ∂ μ θ k ( x ) + … \delta A_{\mu}^{k}(x) \cong i f^{k s j} A_{\mu}^{j}(x) \theta^{s}(x)+\frac{1}{g} \partial_{\mu} \theta^{k}(x)+\ldots δ A μ k ( x ) ≅ i f k s j A μ j ( x ) θ s ( x ) + g 1 ∂ μ θ k ( x ) + …
像之前一样,我们看看测地线的性质。仍然有ϕ ( y ) = ϕ ( x ) + i g ∫ 0 1 d t d z μ d t A μ ( z ( t ) ) ϕ ( z ( t ) ) \phi(y)=\phi(x)+i g \int_{0}^{1} d t \frac{d z_{\mu}}{d t} A^{\mu}(z(t)) \phi(z(t)) ϕ ( y ) = ϕ ( x ) + i g ∫ 0 1 d t d t d z μ A μ ( z ( t ) ) ϕ ( z ( t ) ) ,通过不断的迭代,得到
ϕ ( y ) = ϕ ( x ) + i g ∫ 0 1 d t d z μ ( t ) d t A μ ( z ( t ) ) ϕ ( x ) \phi(y)=\phi(x)+i g \int_{0}^{1} d t \frac{d z_{\mu}(t)}{d t} A^{\mu}(z(t)) \phi(x) ϕ ( y ) = ϕ ( x ) + i g ∫ 0 1 d t d t d z μ ( t ) A μ ( z ( t ) ) ϕ ( x )
+ ( i g ) 2 ∫ 0 1 d t 1 ∫ 0 t 1 d t 2 d z μ 1 ( t 1 ) d t 1 d z μ 2 ( t 2 ) d t 2 A μ 1 ( z ( t 1 ) ) A μ 2 ( z ( t 2 ) ) ϕ ( x ) +(i g)^{2} \int_{0}^{1} d t_{1} \int_{0}^{t_{1}} d t_{2} \frac{d z_{\mu_{1}}\left(t_{1}\right)}{d t_{1}} \frac{d z_{\mu_{2}}\left(t_{2}\right)}{d t_{2}} A^{\mu_{1}}\left(z\left(t_{1}\right)\right) A^{\mu_{2}}\left(z\left(t_{2}\right)\right) \phi(x) + ( i g ) 2 ∫ 0 1 d t 1 ∫ 0 t 1 d t 2 d t 1 d z μ 1 ( t 1 ) d t 2 d z μ 2 ( t 2 ) A μ 1 ( z ( t 1 ) ) A μ 2 ( z ( t 2 ) ) ϕ ( x )
+ … + ( i g ) n ∫ 0 1 d t 1 ∫ 0 t 1 d t 2 … ∫ 0 t n − 1 d t n ∏ j = 1 n ( d z μ j ( t j ) d t j A μ j ( z ( t j ) ) ) ϕ ( x ) +\ldots+(i g)^{n} \int_{0}^{1} d t_{1} \int_{0}^{t_{1}} d t_{2} \ldots \int_{0}^{t_{n-1}} d t_{n} \prod_{j=1}^{n}\left(\frac{d z_{\mu_{j}}\left(t_{j}\right)}{d t_{j}} A^{\mu_{j}}\left(z\left(t_{j}\right)\right)\right) \phi(x) + … + ( i g ) n ∫ 0 1 d t 1 ∫ 0 t 1 d t 2 … ∫ 0 t n − 1 d t n ∏ j = 1 n ( d t j d z μ j ( t j ) A μ j ( z ( t j ) ) ) ϕ ( x )
+ … +\ldots + …
定义一个记号,
I n = ( i g ) n ∫ 0 1 d t 1 ∫ 0 t 1 d t 2 … ∫ 0 t n − 1 d t n F ( t 1 ) ⋯ F ( t n ) I_{n}=(i g)^{n} \int_{0}^{1} d t_{1} \int_{0}^{t_{1}} d t_{2} \ldots \int_{0}^{t_{n-1}} d t_{n} F\left(t_{1}\right) \cdots F\left(t_{n}\right) I n = ( i g ) n ∫ 0 1 d t 1 ∫ 0 t 1 d t 2 … ∫ 0 t n − 1 d t n F ( t 1 ) ⋯ F ( t n )
≡ ( i g ) n n ! P ^ [ ( ∫ 0 1 d t F ( t ) ) n ] \equiv \frac{(i g)^{n}}{n !} \widehat{P}\left[\left(\int_{0}^{1} d t F(t)\right)^{n}\right] ≡ n ! ( i g ) n P [ ( ∫ 0 1 d t F ( t ) ) n ]
这样就把上式变成类似于幂函数的泰勒展开的形式。于是就把它写成
ϕ ( y ) = P ^ [ exp ( i g ∫ Γ ( x , y ) d z μ A μ ( z ) ) ] ϕ ( x ) \phi(y)=\widehat{P}\left[\exp \left(i g \int_{\Gamma(x, y)} d z_{\mu} A^{\mu}(z)\right)\right] \phi(x) ϕ ( y ) = P [ exp ( i g ∫ Γ ( x , y ) d z μ A μ ( z ) ) ] ϕ ( x ) 。
这个相位变化在规范变换下满足
P ^ [ exp ( i g ∫ Γ ( x , y ) d z μ A μ ′ ( z ( t ) ) ) ] \widehat{P}\left[\exp \left(i g \int_{\Gamma(x, y)} d z^{\mu} A_{\mu}^{\prime}(z(t))\right)\right] P [ exp ( i g ∫ Γ ( x , y ) d z μ A μ ′ ( z ( t ) ) ) ]
≡ U ( y ) P ^ [ exp ( i g ∫ Γ ( x , y ) d z μ A μ ( z ) ) ] U − 1 ( x ) \quad \equiv U(y) \hat{P}\left[\exp \left(i g \int_{\Gamma(x, y)} d z^{\mu} A_{\mu}(z)\right)\right] U^{-1}(x) ≡ U ( y ) P ^ [ exp ( i g ∫ Γ ( x , y ) d z μ A μ ( z ) ) ] U − 1 ( x ) 。
于是我们仍然可以绕一圈,得到 W ^ Γ ( x , x ) = P ^ [ exp ( i g ∫ Γ ( x , x ) d z μ A μ ( z ) ) ] \widehat{W}_{\Gamma(x, x)}=\widehat{P}\left[\exp \left(i g \int_{\Gamma(x, x)} d z^{\mu} A_{\mu}(z)\right)\right] W Γ ( x , x ) = P [ exp ( i g ∫ Γ ( x , x ) d z μ A μ ( z ) ) ] ,对于非阿贝尔规范场,这玩意就不是协变的。
这个时候,斯托克斯定理给出场强:
W ^ Γ ( x , x ′ ) ≈ I + i g 2 ∬ Σ d x μ ∧ d x ν F μ ν + O ( a ( Σ ) 2 ) \widehat{W}_{\Gamma\left(x, x^{\prime}\right)} \approx I+\frac{i g}{2} \iint_{\Sigma} d x^{\mu} \wedge d x^{\nu} F_{\mu \nu}+O\left(a(\Sigma)^{2}\right) W Γ ( x , x ′ ) ≈ I + 2 i g ∬ Σ d x μ ∧ d x ν F μ ν + O ( a ( Σ ) 2 )
其中F μ ν ≡ ∂ μ A ν − ∂ ν A μ − i g [ A μ , A ν ] = i [ D μ , D ν ] F_{\mu \nu} \equiv \partial_{\mu} A_{\nu}-\partial_{\nu} A_{\mu}-i g\left[A_{\mu}, A_{\nu}\right]=i\left[D_{\mu}, D_{\nu}\right] F μ ν ≡ ∂ μ A ν − ∂ ν A μ − i g [ A μ , A ν ] = i [ D μ , D ν ] 。它也继承了W的性质,不是协变,而是F μ ν ′ ( x ) = U ( x ) F μ ν ( x ) U − 1 ( x ) F_{\mu \nu}^{\prime}(x)=U(x) F_{\mu \nu}(x) U^{-1}(x) F μ ν ′ ( x ) = U ( x ) F μ ν ( x ) U − 1 ( x ) 。一个最简单的把它变成协变的办法就是tr ( F μ ν F μ ν ) \operatorname{tr}\left(F_{\mu \nu} F^{\mu \nu}\right) t r ( F μ ν F μ ν ) 。所以,对于定域、规范不变、非阿贝尔的场,一个最自然的拉氏量选择就是杨-米尔斯拉氏量
L = − 1 4 tr F μ ν F μ ν \mathcal{L}=-\frac{1}{4} \operatorname{tr} F_{\mu \nu} F^{\mu \nu} L = − 4 1 t r F μ ν F μ ν 。
规范不变性和最小耦合
我们试着把规范场(例如电磁场)和物质场耦合起来。浮光掠影地看一些例子。
QED
量子电动力学是描述电子和光子的理论。电子的场是狄拉克的旋量场ψ α ( x ) \psi_{\alpha}(x) ψ α ( x ) ,光子的场就是一个U ( 1 ) U(1) U ( 1 ) 规范场,记作A μ A_{\mu} A μ 。电子的拉氏量L Dirac ( ψ , ψ ˉ ) = ψ ˉ ( i ϕ − m ) ψ \mathcal{L}_{\text {Dirac }}(\psi, \bar{\psi})=\bar{\psi}(i \phi-m) \psi L Dirac ( ψ , ψ ˉ ) = ψ ˉ ( i ϕ − m ) ψ 满足全局的规范不变性,但不满足局域的。光子的L gauge ( A ) = − 1 4 F μ ν F μ ν ≡ − 1 4 F 2 \mathcal{L}_{\text {gauge }}(A)=-\frac{1}{4} F_{\mu \nu} F^{\mu \nu} \equiv-\frac{1}{4} F^{2} L gauge ( A ) = − 4 1 F μ ν F μ ν ≡ − 4 1 F 2 当然没问题。我们所说的最小耦合就是一种办法,让总的场能够满足局域的规范不变性。
为了做到这个,当然是首先把导数换成协变导数,协变导数里面的规范场直接用光子的场。于是
L Q E D = ψ ˉ ( i D̸ − m ) ψ − 1 4 F 2 \mathcal{L}_{\mathrm{QED}}=\bar{\psi}(i \not D-m) \psi-\frac{1}{4} F^{2} L Q E D = ψ ˉ ( i D − m ) ψ − 4 1 F 2 。
我们对拉氏量变分,看一看守恒流长什么样。
δ L = δ L δ ψ δ ψ + δ L δ ∂ μ ψ δ ∂ μ ψ + ( ψ ↔ ψ ˉ ) + δ L δ ∂ μ A ν δ ∂ μ A ν + δ L δ A μ δ A μ \delta \mathcal{L}=\frac{\delta \mathcal{L}}{\delta \psi} \delta \psi+\frac{\delta \mathcal{L}}{\delta \partial_{\mu} \psi} \delta \partial_{\mu} \psi+(\psi \leftrightarrow \bar{\psi})+\frac{\delta \mathcal{L}}{\delta \partial_{\mu} A_{\nu}} \delta \partial_{\mu} A_{\nu}+\frac{\delta \mathcal{L}}{\delta A_{\mu}} \delta A_{\mu} δ L = δ ψ δ L δ ψ + δ ∂ μ ψ δ L δ ∂ μ ψ + ( ψ ↔ ψ ˉ ) + δ ∂ μ A ν δ L δ ∂ μ A ν + δ A μ δ L δ A μ
可以写成δ L = ∂ μ [ j μ ( x ) θ ( x ) ] − 1 e F μ ν ( x ) ∂ μ ∂ ν θ ( x ) + δ L δ A μ 1 e ∂ μ θ ( x ) \delta \mathcal{L}=\partial_{\mu}\left[j^{\mu}(x) \theta(x)\right]-\frac{1}{e} F^{\mu \nu}(x) \partial_{\mu} \partial_{\nu} \theta(x)+\frac{\delta \mathcal{L}}{\delta A_{\mu}} \frac{1}{e} \partial_{\mu} \theta(x) δ L = ∂ μ [ j μ ( x ) θ ( x ) ] − e 1 F μ ν ( x ) ∂ μ ∂ ν θ ( x ) + δ A μ δ L e 1 ∂ μ θ ( x ) ,然后上式第二项由于F的反对称的性质消掉了。
第一项的j μ = i ( ∂ L δ ∂ μ ψ ψ − ψ ˉ δ L δ ∂ μ ψ ˉ ) j^{\mu}=i\left(\frac{\partial \mathcal{L}}{\delta \partial_{\mu} \psi} \psi-\bar{\psi} \frac{\delta \mathcal{L}}{\delta \partial_{\mu} \bar{\psi}}\right) j μ = i ( δ ∂ μ ψ ∂ L ψ − ψ ˉ δ ∂ μ ψ ˉ δ L ) 是电子数流 。
第三项的J μ ( x ) ≡ δ L δ A μ ( x ) J^{\mu}(x) \equiv \frac{\delta \mathcal{L}}{\delta A_{\mu}(x)} J μ ( x ) ≡ δ A μ ( x ) δ L 是规范流 ,拉氏量的变分告诉我们,电子数的守恒 ——Q 0 = ∫ d 3 x j 0 ( x ) ≡ ∫ d 3 x ψ † ( x ) ψ ( x ) Q_{0}=\int d^{3} x j_{0}(x) \equiv \int d^{3} x \psi^{\dagger}(x) \psi(x) Q 0 = ∫ d 3 x j 0 ( x ) ≡ ∫ d 3 x ψ † ( x ) ψ ( x ) 即代表着电荷的守恒 ——Q ≡ − e Q 0 = − e ∫ d 3 x ψ † ( x ) ψ ( x ) Q \equiv-e Q_{0}=-e \int d^{3} x \psi^{\dagger}(x) \psi(x) Q ≡ − e Q 0 = − e ∫ d 3 x ψ † ( x ) ψ ( x ) 。
这样看,耦合常数e的意义就明确的很。他就是电子的电量。从这个角度,电子的电量e可被认为是某种量子数。
QCD
量子色动力学是描述强相互作用的规范理论。在这里,耦合的是夸克(狄拉克旋量场ψ α i ( x ) \psi_{\alpha}^{i}(x) ψ α i ( x ) )以及胶子(规范场A μ a ( x ) A_{\mu}^{a}(x) A μ a ( x ) )。前者的角标是狄拉克分量α = 1 , … , 4 \alpha=1, \ldots, 4 α = 1 , … , 4 ,以及“色”的分量i = 1 , … , N c i=1, \ldots, N_{c} i = 1 , … , N c 。色就是空……不对,色就是强相互作用的力荷。在QCD里面,它对应一个S U ( 3 ) S U(3) S U ( 3 ) 对称性的规范场,也就是胶子的规范场。共有三种色,它们造成的强相互作用由胶子来传递。数学上,D ( S U ( N c ) ) = N c 2 − 1 D\left(S U\left(N_{c}\right)\right)=N_{c}^{2}-1 D ( S U ( N c ) ) = N c 2 − 1 ,即A μ A_{\mu} A μ 有这么多个分量。
L matter ( ψ , ψ ˉ , A ) = ψ ˉ ( i D̸ − m ) ψ \mathcal{L}_{\text {matter }}(\psi, \bar{\psi}, A)=\bar{\psi}(i \not D-m) \psi L matter ( ψ , ψ ˉ , A ) = ψ ˉ ( i D − m ) ψ
L gauge ( A ) = − 1 4 tr F μ ν F μ ν ≡ − 1 4 F μ ν a F a μ ν \mathcal{L}_{\text {gauge }}(A)=-\frac{1}{4} \operatorname{tr} F_{\mu \nu} F^{\mu \nu} \equiv-\frac{1}{4} F_{\mu \nu}^{a} F_{a}^{\mu \nu} L gauge ( A ) = − 4 1 t r F μ ν F μ ν ≡ − 4 1 F μ ν a F a μ ν
老实说,反正我也没有概念,我觉得这东西即使有物理意义对我也意义不大。总而言之,最小耦合可以得到守恒的色荷Q a ≡ ∫ d 3 x ψ † ( x ) λ a ψ ( x ) Q^{a} \equiv \int d^{3} x \psi^{\dagger}(x) \lambda^{a} \psi(x) Q a ≡ ∫ d 3 x ψ † ( x ) λ a ψ ( x ) 。
时空对称性
现在,别忘了我们的对称性是针对作用量来说的。之前我们只考虑拉氏量(的密度)的对称性,是因为反正都是一样的积分出作用量。现在我们必须考虑时空坐标的影响,因此我们将要考察作用量而非拉氏量在坐标变化下的不变性。我们考虑的变化是:时空平移、旋转。
变化以后,场的变换是这样的:ϕ ( x ) → ϕ ′ ( x ′ ) = ϕ ( x ) + δ ϕ ( x ) + ∂ μ ϕ δ x μ \phi(x) \rightarrow \phi^{\prime}\left(x^{\prime}\right)=\phi(x)+\delta \phi(x)+\partial_{\mu} \phi \delta x^{\mu} ϕ ( x ) → ϕ ′ ( x ′ ) = ϕ ( x ) + δ ϕ ( x ) + ∂ μ ϕ δ x μ 。积分元的变化取决于jacobian,而
J = ∣ det ( ∂ x μ ′ ∂ x ν ) ∣ = ∣ det ( g μ ν + ∂ ν δ x μ ) ∣ ≈ 1 + tr ( ∂ ν δ x μ ) + O ( δ x 2 ) = 1 + ∂ μ δ x μ + O ( δ x 2 ) J=\left|\operatorname{det}\left(\frac{\partial x_{\mu}^{\prime}}{\partial x_{\nu}}\right)\right|=\left|\operatorname{det}\left(g_{\mu}^{\nu}+\partial^{\nu} \delta x_{\mu}\right)\right| \approx 1+\operatorname{tr}\left(\partial^{\nu} \delta x_{\mu}\right)+O\left(\delta x^{2}\right)= 1+\partial^{\mu} \delta x_{\mu}+O\left(\delta x^{2}\right) J = ∣ ∣ ∣ ∣ d e t ( ∂ x ν ∂ x μ ′ ) ∣ ∣ ∣ ∣ = ∣ ∣ ∣ d e t ( g μ ν + ∂ ν δ x μ ) ∣ ∣ ∣ ≈ 1 + t r ( ∂ ν δ x μ ) + O ( δ x 2 ) = 1 + ∂ μ δ x μ + O ( δ x 2 )
我们再定义一个”场的总变分“,由场的变化和坐标系的变化共同产生,记为δ T ϕ ≡ δ ϕ + ∂ μ ϕ δ x μ \delta_{T} \phi \equiv \delta \phi+\partial_{\mu} \phi \delta x^{\mu} δ T ϕ ≡ δ ϕ + ∂ μ ϕ δ x μ 。现在,可以(经过计算)将作用量的变分写出来:
δ S = ∫ d 4 x { ∂ μ [ ( g ν μ L − δ L δ ∂ μ ϕ ∂ ν ϕ ) δ x ν ] + ∂ μ [ δ L δ ∂ μ ϕ δ T ϕ ] } \delta S=\int d^{4} x\left\{\partial_{\mu}\left[\left(g_{\nu}^{\mu} \mathcal{L}-\frac{\delta \mathcal{L}}{\delta \partial_{\mu} \phi} \partial_{\nu} \phi\right) \delta x^{\nu}\right]+\partial_{\mu}\left[\frac{\delta \mathcal{L}}{\delta \partial_{\mu} \phi} \delta_{T} \phi\right]\right\} δ S = ∫ d 4 x { ∂ μ [ ( g ν μ L − δ ∂ μ ϕ δ L ∂ ν ϕ ) δ x ν ] + ∂ μ [ δ ∂ μ ϕ δ L δ T ϕ ] } 。
时空的平移
在极小的平移δ x μ = a μ \delta x_{\mu}=a_{\mu} δ x μ = a μ 之下,δ T ϕ = 0 \delta_{T} \phi=0 δ T ϕ = 0 ,可以看到我们需要第一项是0,或者说
T μ ν ≡ − g μ ν L + δ L δ ∂ μ ϕ ∂ ν ϕ T^{\mu \nu} \equiv-g^{\mu \nu} \mathcal{L}+\frac{\delta \mathcal{L}}{\delta \partial_{\mu} \phi} \partial^{\nu} \phi T μ ν ≡ − g μ ν L + δ ∂ μ ϕ δ L ∂ ν ϕ
是守恒量。∂ μ T μ ν = 0 \partial_{\mu} T^{\mu \nu}=0 ∂ μ T μ ν = 0 。这个张量T叫做能量动量张量。为什么呢?将T作为诺特定理中的守恒流,得到一组运动常数P ν = ∫ d 3 x T 0 ν ( x , x 0 ) P^{\nu}=\int d^{3} x T^{0 \nu}\left(\boldsymbol{x}, x_{0}\right) P ν = ∫ d 3 x T 0 ν ( x , x 0 ) 。其中,第一个分量正好是:
P 0 = ∫ d 3 x T 00 ( x , x 0 ) ≡ ∫ d 3 x [ − L + δ L δ ∂ 0 ϕ ∂ 0 ϕ ] P 0 = ∫ d 3 x H P^{0}=\int d^{3} x T^{00}\left(\boldsymbol{x}, x_{0}\right) \equiv \int d^{3} x\left[-\mathcal{L}+\frac{\delta \mathcal{L}}{\delta \partial_{0} \phi} \partial^{0} \phi\right]P^{0}=\int d^{3} x \mathcal{H} P 0 = ∫ d 3 x T 0 0 ( x , x 0 ) ≡ ∫ d 3 x [ − L + δ ∂ 0 ϕ δ L ∂ 0 ϕ ] P 0 = ∫ d 3 x H
最后一步用了勒让德变换。总之这就是能量。
其他的分量是:
P j = ∫ d 3 x T 0 j = ∫ d 3 x [ − g 0 j L + δ L δ ∂ j ϕ ∂ j ϕ ] P^{j}=\int d^{3} x T^{0 j}=\int d^{3} x\left[-g^{0 j} \mathcal{L}+\frac{\delta \mathcal{L}}{\delta \partial_{j} \phi} \partial^{j} \phi\right] P j = ∫ d 3 x T 0 j = ∫ d 3 x [ − g 0 j L + δ ∂ j ϕ δ L ∂ j ϕ ]
注意到,闵氏度规的g 0 j = 0 g^{0 j}=0 g 0 j = 0 。所以这几个分量正好是动量P = ∫ d 3 x Π ( x ) ∂ ϕ ( x ) \boldsymbol{P}=\int d^{3} x \Pi(x) \boldsymbol{\partial} \phi(x) P = ∫ d 3 x Π ( x ) ∂ ϕ ( x ) 。
旋转
在极小的旋转δ x μ = ω μ ν x ν \delta x_{\mu}=\omega_{\mu}^{\nu} x_{\nu} δ x μ = ω μ ν x ν 之下,δ T ϕ = 0 \delta_{T} \phi=0 δ T ϕ = 0 。我们这时候得到的是
δ S = 0 = ∫ d 4 x ∂ μ [ ( g μ ν L − δ L δ ∂ μ ϕ ∂ ν ϕ ) ω ν ρ x ρ ] \delta S=0=\int d^{4} x \partial_{\mu}\left[\left(g^{\mu \nu} \mathcal{L}-\frac{\delta \mathcal{L}}{\delta \partial_{\mu} \phi} \partial^{\nu} \phi\right) \omega^{\nu \rho} x_{\rho}\right] δ S = 0 = ∫ d 4 x ∂ μ [ ( g μ ν L − δ ∂ μ ϕ δ L ∂ ν ϕ ) ω ν ρ x ρ ] ,
而我们的守恒流这回是
M μ ν ρ ≡ T μ ν x ρ − T μ ρ x ν M^{\mu \nu \rho} \equiv T^{\mu \nu} x^{\rho}-T^{\mu \rho} x^{\nu} M μ ν ρ ≡ T μ ν x ρ − T μ ρ x ν 。
对应的运动常数是L ν ρ ≡ ∫ d 3 x M 0 ν ρ ( x , x 0 ) L^{\nu \rho} \equiv \int d^{3} x M^{0 \nu \rho}\left(\boldsymbol{x}, x_{0}\right) L ν ρ ≡ ∫ d 3 x M 0 ν ρ ( x , x 0 ) ,而如果定义L j ≡ 1 2 ϵ j k l L k l L_{j} \equiv \frac{1}{2} \epsilon_{j k l} L_{k l} L j ≡ 2 1 ϵ j k l L k l ,那么可以看到这就是角动量,因为
L j ≡ ∫ d 3 x ϵ j k l x k P l ( x ) ≡ ∫ d 3 x ℓ j ( x ) L_{j} \equiv \int d^{3} x \epsilon_{j k l} x_{k} \mathcal{P}_{l}(x) \equiv \int d^{3} x \ell_{j}(x) L j ≡ ∫ d 3 x ϵ j k l x k P l ( x ) ≡ ∫ d 3 x ℓ j ( x ) 。
例子:电磁场的能动量张量
电磁场的能动量张量是
T μ ν = − g μ ν L + δ L δ ∂ ν A λ ∂ μ A λ = 1 4 g μ ν F α β F α β − F ν λ ∂ μ A λ \begin{aligned} T^{\mu \nu} &=-g^{\mu \nu} \mathcal{L}+\frac{\delta \mathcal{L}}{\delta \partial_{\nu} A_{\lambda}} \partial^{\mu} A_{\lambda} \\ &=\frac{1}{4} g^{\mu \nu} F^{\alpha \beta} F_{\alpha \beta}-F^{\nu \lambda} \partial^{\mu} A_{\lambda} \end{aligned} T μ ν = − g μ ν L + δ ∂ ν A λ δ L ∂ μ A λ = 4 1 g μ ν F α β F α β − F ν λ ∂ μ A λ
但是它不具有规范不变性。我们往里添加一个守恒的带F的项把它变成规范不变的
T ~ μ ν = 1 4 g μ ν F 2 − F λ ν F μ λ \tilde{T}^{\mu \nu}=\frac{1}{4} g^{\mu \nu} F^{2}-F_{\lambda}^{\nu} F^{\mu \lambda} T ~ μ ν = 4 1 g μ ν F 2 − F λ ν F μ λ ,
现在不仅规范不变,还是对称的,看起来使人欢喜。事实上,这个时候确有
P 0 = ∫ x 0 fixed d 3 x T ~ 00 = ∫ x 0 fixed d 3 x 1 2 ( E 2 + B 2 ) P^{0}=\int_{x_{0} \text { fixed }} d^{3} x \tilde{T}^{00}=\int_{x_{0} \text { fixed }} d^{3} x \frac{1}{2}\left(\boldsymbol{E}^{2}+\boldsymbol{B}^{2}\right) P 0 = ∫ x 0 fixed d 3 x T ~ 0 0 = ∫ x 0 fixed d 3 x 2 1 ( E 2 + B 2 ) ,
以及
P i = ∫ x 0 fixed d 3 x T ~ i 0 = ∫ x 0 fixed d 3 x ( E × B ) i P^{i}=\int_{x_{0} \text { fixed }} d^{3} x \tilde{T}^{i 0}=\int_{x_{0} \text { fixed }} d^{3} x(\boldsymbol{E} \times B)_{i} P i = ∫ x 0 fixed d 3 x T ~ i 0 = ∫ x 0 fixed d 3 x ( E × B ) i 。
我们从这个例子看到,我们有办法改变这个能动量张量,让它守恒的同时,还能对称。这是好的。是不是总有办法呢?它的定义里面有模糊的地方,就像规范一样,有冗余度。我们能不能规定一个最好的定义呢?
让我们换一个角度。考虑系统的几何,它由度规决定。我们看看系统的几何对作用量有什么影响,或者说这个影响是什么(剧透:对橡皮球来说,一般的几何变换总会让它的能量增加的,除非你做的是时空平移或旋转)。坐标变化下度规张量的变化是
δ g μ ν = − 1 2 ( g μ λ ∂ ν δ x λ + g λ ν ∂ μ δ x λ + ∂ λ g μ ν δ x λ ) \delta g_{\mu \nu}=-\frac{1}{2}\left(g_{\mu \lambda} \partial^{\nu} \delta x_{\lambda}+g_{\lambda \nu} \partial^{\mu} \delta x_{\lambda}+\partial^{\lambda} g_{\mu \nu} \delta x_{\lambda}\right) δ g μ ν = − 2 1 ( g μ λ ∂ ν δ x λ + g λ ν ∂ μ δ x λ + ∂ λ g μ ν δ x λ )
我们有一个不变的体积元d 4 x g d^{4} x \sqrt{g} d 4 x g ,于是我们可以用字母T记录这个作用量的变化:
δ S = ∫ d 4 x g T μ ν ( x ) δ g μ ν ( x ) \delta S=\int d^{4} x \sqrt{g} T^{\mu \nu}(x) \delta g_{\mu \nu}(x) δ S = ∫ d 4 x g T μ ν ( x ) δ g μ ν ( x ) ,T μ ν ( x ) ≡ δ S δ g μ ν ( x ) T^{\mu \nu}(x) \equiv \frac{\delta S}{\delta g_{\mu \nu}(x)} T μ ν ( x ) ≡ δ g μ ν ( x ) δ S 。
实际上,可以证明,这样定义的T是一个对平移变换不变的量,它是一个守恒流,符合能动量张量的定义。并且,这样定义的T是唯一、对称的。于是我们知道,能动量张量可以理解成能量在时空几何下的变化率。这是一个闵氏空间下的应变 。