量子场论中的几类 Lorentz 变换

量子场论中的几类 Lorentz 变换

前言

『要是场论不用做 Lorentz 变换就好了. 』
ーーーーーーー 某本科仔当着我面发表的感想.

这次的话题比较微妙, 对称变换相关的内容一直都有点儿新人杀手的味道, 这是因为对称变换涉及了多个视角, 不能像从前那样明确完要解决的问题然后老老实实地推进就完事了. 对称变换的内容重点不在于解决问题而在于理解什么是对称变换, 而变换的方式与看待变换的观点, 很不幸地, 并不唯一. 此即问题所在之处, 不同的书籍会采取截然不同的观点, 更过分的还有像 Weinberg 这样自己写的量子力学和自己写的量子场论中的变换形式还不统一的情况. 所以, you know, you just know.

本文会直接给出重要的数学关系与变换公式而不会再像从前那样给出全部的证明过程, 因为首先这些数学关系的证明是十分简单的, 你翻任何一本量子场论的教科书都会给出详细的推导过程, 无论他们如何看待对称变换无论他们采取怎样的观点, 强行嗯推导最后得出来的数学构造肯定是相似的 [1] . 所以一本不负责任的教科书很可能会只把重要公式都给你细致推导出来就草草收尾完全不告诉你发生了啥, 再过分点儿的话过程中可能也不会告诉你他在干嘛. 这样你确实可以嗯套公式去搬砖了, 但你可能真的不知道自己在干嘛. 其次就是这些推导过程极其繁琐冗长, 全写出来只会平添十几二十页纸让人头昏眼花迷失主线又变成一本哈人的场论书. 总之就是这些内容你随便找本书都能翻到答案, 所以我直接就不写了.

本文的重点就是讲讲我是怎么去理解这些过程的, 就是说当我们在做 Lorentz 变换时, 我们到底在做什么. 关于这些东西的观点从来就不太统一, 而且大多数资料都持着我不讲你自己悟的态度, 这可能也是导致观点不统一甚至错误观点横行的原因之一. 实际上当你跟物理系的人谈这些问题的时候, 除非他是教过场论课或者搞的是超对称弦论之类偏数学化方向的教授, 那有可能跟你唠上两句, 否则他直接就不知道你在说啥, 然后告诉你『物理嘛, 看感觉就好了』. 也就是说大多数人采取的策略可能就是想个办法骗着自己把正确的结论给背下来.

当然, 觉得下面的观点有问题的话可以评论区讨论.

我还是相当有自信能一篇文给你彻底整明白的, 如果你不知该信哪本书不如干脆就跟我混算了.
简洁起见只讲 Lorentz 变换, 其实 Poincaré 变换也差不多就是一回事, 平移大家反而还更熟悉.

目録

0. 前置内容 [2] - 线性空间上的张量与群的表示

0.1. 线性空间与张量
0.2. Lorentz 群的矢量表示及变换的两种观点
0.3. 群的表示

1. 量子场论中的 Lorentz 变换

1.1. 量子场论中常见的 Lorentz 群表示
1.2. 量子场论中的 Lorentz 变换

2. 场的 Lorentz 变换

2.1. 矢量场的 Lorentz 变换
2.2. 一般场的 Lorentz 变换

3. 量子 Lorentz 变换

3.1. Lorentz 群唯一的幺正表示
3.2. 量子 Lorentz 变换的性质
3.3. 经典回顾之 \[{\text{SU}(2)}\] \[{\text{SO}(3)}\]

4. 常见疑惑点与方程的协变性

4.1. 以 Dirac 方程为例谈谈方程的 Lorentz 协变性
4.2. 常见疑惑之 gamma 矩阵为啥不变
4.3. 常见疑惑之量子场变几次



全文默认 \[{x}'=\Lambda x\to {{{{x}'}}^{\mu }}={{\Lambda }^{\mu }}_{\nu }{{x}^{\nu }}\] , 同时变换后的参考系下的事物都带撇.


0. 前置内容 [2] - 线性空间上的张量与群的表示

有人说学场论不需要群论, 其实也没错, 但这就像制冰前不学化学, 我是说虽然 Jesse Pinkman 确实办到了, 但不管怎么想这都有些自虐. 群论的框架就像一台书桌, 让你能把场论中关于对称性的知识都整齐地装订分类摆好, 而缺少这台书桌你将面对的就是一地的碎纸片.

0.1. 线性空间与张量:

线性空间 V 的概念是简单的, 然后全体 V 到数域的映射的集合就构成了对偶空间 {V^ * }.

进而以可定义多重线性映射:

T:\underbrace {V \times \cdots \times V}_n \times \underbrace {{V^ * } \times \cdots \times {V^ * }}_m \to {\text{number}}\;{\text{field}},
而这个多重线性映射就被称为一个 (m,n) 型的张量.

在由始终条件 {e^a}({e_b}) = {\delta ^a}_b 联系着的基矢 \left\{ {{e^a }} \right\} 与对偶基矢 \left\{ {{e_a }} \right\} 下,

可以将矢量 v \in V 做展开 v = {v^a}{e_a},
类似地可以将对偶矢量 {u^ * } \in {V^ * } 做展开 {u^ * } = {u_a}{e^a},
(m,n) 型的张量的则可以做展开 T = T\overbrace {^{a \cdots b}}^m\underbrace {_{c \cdots d}}_n{e_a} \cdots {e_b}{e^c} \cdots {e^d}.

不过在重复指标的求和约定的帮助下, 基矢与对偶基矢基本上就没啥出场机会了:

0.2. Lorentz 群的矢量表示及变换的两种观点:

究竟啥是 Lorentz 变换? 最捞的答案咱就不讲了, 而入门级的理解可能就是这篇:

就是说最狭义的 Lorentz 变换就是 Lorentz 群矢量表示中的那些 4 \times 4 的表示矩阵 \Lambda.

场论中的 Lorentz 矢量就是在特指 Lorentz 群矢量表示空间中的元素, 而 Lorentz 张量指的就是矢量表示空间上的张量. 一般来说你的老师或者教科书在介绍它们的时候还会特别指出了它们的分量系数在 Lorentz 变换下满足如下变换规则:

\[A\overset{\Lambda }{\mathop{\to }}\,{{{A}'}^{\mu }}={{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }},\]
\[{{T}^{\mu \cdots \nu }}_{\rho \cdots \sigma }\overset{\Lambda }{\mathop{\to }}\,{{{{T}'}}^{\mu \cdots \nu }}_{\rho \cdots \sigma }={{\Lambda }^{\mu }}_{\tau }{{\Lambda }^{\nu }}_{\eta }{{\Lambda }_{\rho }}^{\delta }{{\Lambda }_{\sigma }}^{\varepsilon }{{T}^{\tau \cdots \eta }}_{\delta \cdots \varepsilon }\]
\,\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = {\Lambda ^\mu }_\tau {\Lambda ^\nu }_\eta {(g{\Lambda ^{\text{T}}}{g^{ - 1}})^\delta }_\rho {(g{\Lambda ^{\text{T}}}{g^{ - 1}})^\varepsilon }_\sigma {T^{\tau \cdots \eta }}_{\delta \cdots \varepsilon }
\,\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = {\Lambda ^\mu }_\tau {\Lambda ^\nu }_\eta {({\Lambda ^{ - 1}})^\delta }_\rho {({\Lambda ^{ - 1}})^\varepsilon }_\sigma {T^{\tau \cdots \eta }}_{\delta \cdots \varepsilon }.

而它们会如此变换是因为 Lorentz 变换的本质是转动了表示空间的基矢, 而矢量与张量本身都是物理实在, 不会随着基矢的不同选择而发生变化, 这就导致它们在不同基矢下的系数要发生相应的变换, 变换规则如上所示.

而看待这些变换过程的观点则又分为主动观点与被动观点:

本文将采用被动观点, 事实上我一直都偷偷地在使用被动观点, 因为我觉得这个观点更为物理.

0.3. 群的表示:

G 的表示由表示空间 V 与表示映射 R 构成, 表示空间 V 就只是一个线性空间, 然后表示空间的维度就是群表示的维度, 而表示映射 R 就是一个从所研究群 G 到表示空间上的一般线性群 \[\text{GL}\left( V \right)\] 的一个同态映射.

笼统来讲就是说群 G 是个抽象的数学概念, 只是个定义了二元运算 [3] 的集合罢了, 所以群元也就只能与群元相作用. 而空间 V 上的全体线性变换在连续映射作为群乘法的情况下也可以构成一个群, 即线性空间上的一般线性群 \[\text{GL}\left( V \right)\] . 那么如果找到了一个同态映射 \[R:G\to \text{GL}\left( V \right)\] 的话就等于说是给每个本只是抽象概念的群元赋予了一个实体甚至具体的矩阵形式, 因为同态映射是一个保群结构的映射. 噢, 同态映射下有 \[R\left( {{g}^{-1}} \right)={{R}^{-1}}\left( g \right)\] , 怕你不知道跟你提一嘴.

所以当我们说某个群作用在某个的线性空间上时, 那其实指的就是该群在这个空间上的表示矩阵或者说表示线性变换作用在了这个空间上. 所以如果你希望让某个群作用在所研究的空间上时, 所需要做的就是找到相应的表示映射.


1. 量子场论中的 Lorentz 变换

1.1. 量子场论中常见的 Lorentz 群表示:

平直时空量子场论的底流形就是 Minkowski 时空流形, 即欧式平直 \[{{\mathbb{R}}^{4}}\] 配上 Lorentz 度规 g , 然后这个流形的切空间就是 Lorentz 群的矢量表示空间. 这块儿内容还是在这篇里讲得最详细:

東雲正樹:从 Boost 到洛伦兹群, ようこそ Minkowski パークへ

那类似地, 其实我们可以把 Lorentz 群··· 呃··· 其实是固有保时相 Lorentz 群 \[\text{S}{{\text{O}}^{+}}\left( 1,3 \right)\] 的覆盖群 \[\text{SL}\left( 2,\mathbb{C} \right)\] 的全体表示空间 [4] 都粘在量子场论底流形的每一个点上. 所以从这个意义上来讲, 量子场论中的 Hilbert 空间其实也是长在底流形上的线性空间.

其实我们也用不到那么多的表示, Lorentz 群在量子场论中常见的非平庸表示就仨, 分别为量子幺正表示 U:{\text{O}}\left( {1,3} \right) \to {\text{GL}}\left( {{L^2}} \right) , 旋量表示 D:{\text{O}}\left( {1,3} \right) \to {\text{GL}}\left( {{\text{Dirac spinor}}\;{\text{space}}} \right) 与表示矩阵 \Lambda \in {\text{GL}}\left( {{\mathbb{R}^4},g} \right) 的矢量表示 [5] . 然后这仨表示对应的表示空间就分别为量子态空间、旋量场的值域空间与矢量场的值域空间, 那标量场的值域空间自然就是平庸的零维表示空间了. 更详细的说法可参考下面这篇回答:

1.2. 量子场论中的 Lorentz 变换:

讲到这里你其实也应该能感觉到了, 所谓的做一个群对称变换其实指的就是这个群的所有表示空间中的基矢与对偶基矢都要发生一个对称变换. 具体到做 Lorentz 变换就是 Lorentz 群的所有表示空间的基底与对偶基底都要在 Lorentz 变换在该空间中的表示矩阵的作用下发生转动或 Boost. 故相应地, 所有表示空间上的矢量与张量的系数都要做相应的变换以保证这些量在流形上是不依赖于基矢的绝对量.

2. 场的 Lorentz 变换

2.1. 矢量场的 Lorentz 变换:

又到了经典新人杀手环节··· 其实这个问题很简单的. 对于矢量的 Lorentz 变换, 我想大家应该都再熟悉不过了, 不就是 \[A\overset{\Lambda }{\mathop{\to }}\,{{{A}'}^{\mu }}={{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }}\] 嘛. 如果是转动一下或者 Boost 一下的话, 那就是一个转动矩阵或者 Boost 矩阵作用上来就是了.

但是到了矢量场似乎就烧脑了一丢丢 (?) [6] . 这里我们不妨这么想, 其实在大多数这种变来变去的过程中, 不变的东西反而是问题的本质. 具体而言矢量场 \[{{A}^{\mu }}(x)\] 其实就是个将时空坐标 x 映射到矢量表示空间中的矢量 \[{{A}^{\mu }}\] 的一个映射罢了. 而它在 Lorentz 变换下会变成 \[{{{A}'}^{\mu }}({x}')\] , 即带撇参考系下观察到的场, 其作用是将带撇参考系下看到的时空坐标映射到带撇参考系看到的矢量上去.

那撇开这一切, 总要有个不变的东西吧?

你总不能说在描述同一个场的 \[{{A}^{\mu }}(x)\] \[{{{A}'}^{\mu }}({x}')\] 之间会一点儿联系都没有吧? 那这个联系其实就是 \[{{{{A}'}}^{\mu }}({x}')={{{{A}'}}^{\mu }}(\Lambda x)={{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }}(x)\] , 就这么简单.

哎··· 我还是画个图吧:

上图就是以逆时针旋转 \[{\pi }/{6}\] 为例的 Lorentz 变换,
简单起见我只研究一个点, 画一块儿场你可能反而还不容易想通.
那么在变换前, 就是在坐标 x 处矢量场的取值为 A , 这里的 x A 都有四个分量.
然后旋转后呢, 矢量还是那个矢量, 点还是那个点, 但是参考系变了,
所以点的坐标就变成了 \[{x}'=\Lambda x\] 而点上的矢量的四个新分量就是 \[{{{A}'}^{\mu }}={{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }}.\]
你可以很清晰地看到, 原来的矢量是与纵轴平行的, 所以没有水平分量, 但旋转后却有了.
就是说, 旋转前后这矢量的分量肯定会有变化, 所以要乘个变换矩阵.

就这么简单, 写成分量式就是 \[{{{{A}'}}^{\mu }}({x}')={{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }}(x)\] , 这个式子的详细解读如下:

在变换后原来的点 \[x\to {{x}^{\mu }}\] 有了一组新的坐标 \[{x}'\to {{{{x}'}}^{\mu }}\] , 但它还是原来那个点.
而变换后的场 \[{{{{A}'}}^{\mu }}(x)\] 在这个老点 \[{{x}'}\] 上的取值和原来的场在这个点的取值是相同的,
即取 \[{{A}^{\mu }}(x)\] , 虽然取的是同一个矢量, 但是呢, 在新的参考系下那个矢量的描述要发生改变,
所以取值要乘个旋转矩阵变成 \[{{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }}(x)\] , 然后连起来就是 \[{{{{A}'}}^{\mu }}({x}')={{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }}(x).\]

所以就是说, 矢量场 \[{{A}^{\mu }}(x)\] 在变换后被描述为了 \[{{{{A}'}}^{\mu }}(x)\] .

而这个 \[{{{{A}'}}^{\mu }}(x)\] 的定义就是 \[{{{{A}'}}^{\mu }}({x}')={{{{A}'}}^{\mu }}(\Lambda x)\equiv {{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }}(x),\]
然后做一个变量替换 \[x\to {{\Lambda }^{-1}}y\] 就有 \[{{{{A}'}}^{\mu }}(y)\equiv {{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }}({{\Lambda }^{-1}}y),\]
然后再做一个变量替换得到的可能就是你书上最喜欢的 \[{{{{A}'}}^{\mu }}(x)\equiv {{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }}({{\Lambda }^{-1}}x)\] 了.

说实在的如果你的书真的就直接一步给出最后这个式子, 呃··· 那确实多少沾点儿.

一定要说这里有啥不好理解的地方也只能还是物理人自己的锅···
物理人眼里的场、映射和函数值在记号上都你妈不做区分, 然后就嗯混乱呗.

2.2. 一般场的 Lorentz 变换:

前面是以矢量场为例, 我们得到了下面两个等价的表述:

\[{{A}^{\mu }}(x)\overset{\Lambda }{\mathop{\to }}\,{{{{A}'}}^{\mu }}({x}')\equiv {{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }}(x),\]
\[{{A}^{\mu }}(x)\overset{\Lambda }{\mathop{\to }}\,{{{{A}'}}^{\mu }}(x)\equiv {{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }}({{\Lambda }^{-1}}x).\]
场就是个映射罢了, 宗量的形式是无关紧要的.

类似地我们就可以由此类比到以 Lorentz 群的任何表示空间作为值域的场.

矢量表示是四维表示所以矢量场有四个分量, 其实 Dirac 旋量表示也是四维的,
所以旋量场的 Lorentz 变换就是下面这样的 [7] :
\[{{\psi }^{a}}\overset{\Lambda }{\mathop{\to }}\,{{{{\psi }'}}^{a}}({x}')\equiv {{D}^{a}}_{b}(\Lambda ){{\psi }^{b}}(x)\] , 其中 \[a,b\in \left\{ 1,2,3,4 \right\}.\]
不过旋量指标通常不会写出来, 因为大家都约定好了旋量就写成列矩阵 [8] ,
所以一般写为 \[\psi (x)\overset{\Lambda }{\mathop{\to }}\,{\psi }'({x}')\equiv D(\Lambda )\psi (x),\]
其中的 \[D(\Lambda )\] 是旋量表示下的 Lorentz 变换的表示矩阵.
如果是标量场的话就更简单了, 标量场的取值是个数, 没有分量,
也就没有方向的概念, 所以有 \[\phi (x)\overset{\Lambda }{\mathop{\to }}\,{\phi }'({x}')=\phi (x)\] ,
就是说只要新的场在原来那个点的取值和旧场在那个点的取值相同就完事了,
取的值本身不需要再做什么变换了, 因为取的就是个数, 只有一个分量.

写在一起观察一下:

\[{{A}^{\mu }}(x)\overset{\Lambda }{\mathop{\to }}\,{{{{A}'}}^{\mu }}({x}')\equiv {{\Lambda }^{\mu }}_{\nu }{{A}^{\nu }}(x),\]
\[\psi (x)\overset{\Lambda }{\mathop{\to }}\,{\psi }'({x}')\equiv D(\Lambda )\psi (x),\]
\[\phi (x)\overset{\Lambda }{\mathop{\to }}\,{\phi }'({x}')=\phi (x).\]

所以总结出来的结论就是, 一个有 n 个分量的场 \[{{\Phi }^{a}}(x),\ a\in \left\{ 1,2,\cdots ,n \right\}\] 是一个将时空点 x 映射到 Lorentz 群某 n 维表示空间内的元素的一个映射, 然后它的 Lorentz 变换形式就存在着如下所示的两个完全等价的表述:

\[{{\Phi }^{a}}(x)\overset{\Lambda }{\mathop{\to }}\,{{{{\Phi }'}}^{a}}({x}')\equiv {{R}^{a}}_{b}(\Lambda ){{\Phi }^{b}}(x),\]
\[{{\Phi }^{a}}(x)\overset{\Lambda }{\mathop{\to }}\,{{{{\Phi }'}}^{a}}(x)\equiv {{R}^{a}}_{b}(\Lambda ){{\Phi }^{b}}({{\Lambda }^{-1}}x).\]
其中的 \[{{R}^{a}}_{b}(\Lambda )\] 就是 Lorentz 群在这个 n 维表示下的表示矩阵.
这说明矢量表示下的表示矩阵就是儿时的 Lorentz 变换矩阵, 而标量表示的表示矩阵就是 1.
证明我就懒得证明了, 其实也不难, 就是无穷小变换展开那一套, 写出来有点儿繁琐.

3. 量子 Lorentz 变换

3.1. Lorentz 群唯一的幺正表示:

其实看到这里, 你也差不多是个懂哥了. 相信用屁股想也能猜到啥是量子 Lorentz 变换对吧? 就是 Hilbert 空间作为表示空间的表示下的变换矩阵嘛 [9] . 但也没这么简单, 因为实际上这是一个射影表示 \[U:\text{O}(1,3)\to \text{GL}({{L}^{2}})\] , 而所谓的射影表示并不是真正的表示, 它在连续的变换下会产生额外的相位 \[U({{\Lambda }_{2}})U({{\Lambda }_{1}})={{\text{e}}^{\text{i}\phi ({{\Lambda }_{1}},{{\Lambda }_{2}})}}U({{\Lambda }_{2}}{{\Lambda }_{1}})\] . 不过问题不大, 我们总可以通过做一个替换解决这个问题. 但我懒得讲, 你好奇的话可以去看看 Weinberg 的量子场论, 他分析地很详尽.

首先我们知道 Hilbert 空间中的一个矢量 \[\left| \psi \right\rangle \] 表征的是一个量子态对吧? 但其实这个态要归一化然后取消掉一个全局相位, 也就是说乘除一个复系数并不影响啥, 所以从这个意义上来讲, 表征量子态的应该是 Hilbert 空间的一条射线 [10] .

所以量子 Lorentz 变换被视为 Hilbert 空间上射线到射线的变换, 在不考虑射影表示带来的额外相位的情况下, 若再在每条射线上取一个零相位的单位矢作代表元的话, 量子 Lorentz 变换就是应该是一个单位矢到单位矢的线性变换. 不同的观测者或许会看到系统处于不同的态, 但观测到转化的概率必须相同, 这就要求了量子 Lorentz 变换算符的幺正性或反幺正性:

\[\ \ \ \ \ \ P\equiv {{\left| \left\langle \varphi |\psi \right\rangle \right|}^{2}}\overset{\Lambda }{\mathop{\to }}\,{{\left| \left\langle {\varphi }'|{\psi }' \right\rangle \right|}^{2}}=\left| \langle \varphi |{{U}^{\dagger }}(\Lambda )U(\Lambda )\left| \psi \right\rangle \right|\equiv {P}'=P={{\left| \left\langle \varphi |\psi \right\rangle \right|}^{2}}\]
\[\Rightarrow {{U}^{\dagger }}(\Lambda )={{U}^{-1}}(\Lambda ).\]

不过如果研究的是经过单位元的固有保时向 Lorentz 变换的话, 则其显然对应着幺正算符, 因为单位元对应的恒等变换是幺正的. 其实 Lorentz 群的幺正表示就只有这个无穷维的表示, 因为 Lorentz 群是个非紧致群. 而幺正性实际上是必须的, 因为 Lorentz 群的生成元甚至到 Poincaré 群的生成元都是物理量算符, 就必须是厄米的.

而反幺正算符其实很罕见, 一般来说就是牵扯到了时间反演的变换才会反幺正, 我懒得进一步讲这个问题了, 因为我平时很少碰到时间反演, 就没啥兴趣. 如果以后我突然想讲 CPT 定理了的话可能会再回来讲讲这个问题, 但说实在的我感觉 CPT 定理其实也没啥难理解的地方··· 就不一定讲.

3.2. 量子 Lorentz 变换的性质:

在经过一大堆的推导之后呢, 我们发现这个幺正表示 \[U:\text{O}(1,3)\to \text{GL}({{L}^{2}})\] 十分之神奇, 用它的表示矩阵来夹着正则量子化后的量子场算符能得到场算符作为经典场的 Lorentz 逆变换, 即:

标量场: \[U(\Lambda )\phi (x){{U}^{\dagger }}(\Lambda )=\phi (\Lambda x).\]
矢量场: \[U(\Lambda ){{A}^{\mu }}(x){{U}^{\dagger }}(\Lambda )={{({{\Lambda }^{-1}})}^{\mu }}_{\nu }{{A}^{\nu }}(\Lambda x).\]
旋量场: \[U(\Lambda )\psi (x){{U}^{\dagger }}(\Lambda )=D({{\Lambda }^{-1}})\psi (\Lambda x).\]
甚至对 Lorentz 群的生成元算符: \[U(\Lambda ){{L}^{\mu \nu }}{{U}^{\dagger }}(\Lambda )={{({{\Lambda }^{-1}})}^{\mu }}_{\rho }{{({{\Lambda }^{-1}})}^{\nu }}_{\sigma }{{L}^{\rho \sigma }}.\]

为啥量子 Lorentz 变换作用在场上面要夹着作用? 这是因为在 Hilbert 空间里这些场都不是矢量了, 以前矢量场是矢量表示空间的矢量, 旋量场是旋量表示空间的矢量, 但现在大家在 Hilbert 空间里都是线性算符, 相当于说都是 Hilbert 空间的 (1,1) 型张量, 所以要一正一逆俩变换矩阵乘上来.

但为啥是逆的? 其实必须得是逆的才合理:

回想量子力学, 场算符的对应物其实是坐标算符 X .
然后在坐标本征态下有 \[\left\langle {{x}_{0}} \right|X\left| {{x}_{0}} \right\rangle ={{x}_{0}}.\]
在量子场论里也是类似的, 其实场的本征位形 \[\left| \varphi \right\rangle \] 就相当于是量子力学的坐标本征态.
以一般的场为例也会类似的有 \[\left\langle \varphi \right|\Phi (x)\left| \varphi \right\rangle =\varphi (x)\] , 而等号右边的就是经典场.
进一步则有 \[\varphi (x)=\left\langle \varphi \right|\Phi (x)\left| \varphi \right\rangle \]
\[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =\left\langle \varphi \right|{{U}^{\dagger }}(\Lambda )U(\Lambda )\Phi (x){{U}^{\dagger }}(\Lambda )U(\Lambda )\left| \varphi \right\rangle \]
\[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =\left\langle {{\varphi }'} \right|U(\Lambda )\Phi (x){{U}^{\dagger }}(\Lambda )\left| {{\varphi }'} \right\rangle \]
\[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =\left\langle {{\varphi }'} \right|R({{\Lambda }^{-1}})\Phi (x)\left| {{\varphi }'} \right\rangle \]
\[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =R({{\Lambda }^{-1}})\left\langle {{\varphi }'} \right|\Phi (\Lambda x)\left| {{\varphi }'} \right\rangle \]
\[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =R({{\Lambda }^{-1}}){\varphi }'(\Lambda x)=R({{\Lambda }^{-1}})R(\Lambda )\varphi (x)=\varphi (x).\]
看到了吗? 如果不是逆着变的话, 反而是要闹矛盾的.

3.3. 经典回顾之 \[\bold{\text{SU}(2)}\] \[\bold{\text{SO}(3)}\] :

虽然我还是懒得给你证明量子 Lorentz 变换满足那些性质, 但我想提一下其实以前我们学群论的时候就见识过类似的东西了, 当时我们有一个二重覆盖映射:

\[{{{S}'}^{i}}={{\mathcal{R}}^{i}}_{j}{{S}^{j}}=\frac{1}{2}\text{tr}\left( {{\sigma }^{i}}U{{\sigma }_{j}}{{U}^{-1}} \right){{S}^{j}},\]
其中 \[\mathcal{R}=\mathcal{R}\left( \vec{n},\omega \right)\in \text{SO}\left( 3 \right),\ U=U\left( \vec{n},\omega \right)\in \text{SU}\left( 2 \right)\] , 这俩的 \[\left( \vec{n},\omega \right)\] 相同.
那么这里的角动量算符实际上就相当于是前面讨论的矢量场,
就是说 \[{{S}^{i}}\] 在三维空间是个矢量而在二维 Hilbert 空间 [11] 则是算符.
我们发现它就是在二重覆盖映射下得到了 \[U{{S}^{i}}{{U}^{\dagger }}={{({{\mathcal{R}}^{-1}})}^{i}}_{j}{{S}^{j}}\] 这样的结论.

更详细的推导过程在下文的 19.4 节处:

其实更像的还是旋量表示与矢量表示之间的联系, 这就要搬出我们的 Dirac gamma 矩阵了:

Dirac gamma 矩阵即具有旋量指标又具有 Lorentz 指标, 所以也和这种情况就很类似,
然后也确实存在着下面这些关系:
\[D(\Lambda ){{\gamma }^{\mu }}{{D}^{-1}}(\Lambda )={{({{\Lambda }^{-1}})}^{\mu }}_{\nu }{{\gamma }^{\nu }},\]
\[D(\Lambda ){{\sigma }^{\mu \nu }}{{D}^{-1}}(\Lambda )={{({{\Lambda }^{-1}})}^{\mu }}_{\rho }{{({{\Lambda }^{-1}})}^{\nu }}_{\tau }{{\sigma }^{\rho \tau }}.\]
所以这都不是什么陌生玩应, 好好地回味一下罢.

4. 常见疑惑点与方程的协变性

4.1. 以 Dirac 方程为例谈谈方程的 Lorentz 协变性:

首先 Dirac 方程属于是街上抓个人就会写, 就是 \[(\text{i}{{\gamma }^{\mu }}{{\partial }_{\mu }}-m)\psi (x)=0\] 对吧?

那啥叫具有 Lorentz 协变性呢? 其实就是先做 Lorentz 变换, 即各个量做如下替换:

\[{{\partial }_{\mu }}\overset{\Lambda }{\mathop{\to }}\,{{{{\partial }'}}_{\mu }}={{({{\Lambda }^{-1}})}^{\nu }}_{\mu }{{\partial }_{\nu }},\]
\[m\overset{\Lambda }{\mathop{\to }}\,{m}'=m,\]
\[\psi (x)\overset{\Lambda }{\mathop{\to }}\,{\psi }'({x}')=D(\Lambda )\psi (x).\]

然后如果变换完的各个量放一起还满足 Dirac 方程的话, 这就叫方程具有协变性:

即若有 \[(\text{i}{{\gamma }^{\mu }}{{{{\partial }'}}_{\mu }}-{m}'){\psi }'({x}')=0\] 则说明 Dirac 方程是 Lorentz 协变的.
那就代进去看看呗:
\[(\text{i}{{\gamma }^{\mu }}{{{{\partial }'}}_{\mu }}-{m}'){\psi }'({x}')=\left[ \text{i}{{\gamma }^{\mu }}{{({{\Lambda }^{-1}})}^{\nu }}_{\mu }{{\partial }_{\nu }}-m \right]D(\Lambda )\psi (x)\]
\[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =\left[ \text{i}{{\gamma }^{\mu }}{{({{\Lambda }^{-1}})}^{\nu }}_{\mu }{{\partial }_{\nu }}D(\Lambda )-mD(\Lambda ) \right]\psi (x)\]
\[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =\left[ \text{i}D(\Lambda ){{D}^{-1}}(\Lambda ){{\gamma }^{\mu }}{{({{\Lambda }^{-1}})}^{\nu }}_{\mu }{{\partial }_{\nu }}D(\Lambda )-mD(\Lambda ) \right]\psi (x)\]
\[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =D(\Lambda )\left[ \text{i}{{D}^{-1}}(\Lambda ){{\gamma }^{\mu }}D(\Lambda ){{({{\Lambda }^{-1}})}^{\nu }}_{\mu }{{\partial }_{\nu }}-m \right]\psi (x)\]
\[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =D(\Lambda )\left[ \text{i}{{\Lambda }^{\mu }}_{\rho }{{\gamma }^{\rho }}{{({{\Lambda }^{-1}})}^{\nu }}_{\mu }{{\partial }_{\nu }}-m \right]\psi (x)\]
\[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =D(\Lambda )\text{(i}{{\delta }^{\nu }}_{\rho }{{\gamma }^{\rho }}{{\partial }_{\nu }}-m\text{)}\psi (x)=D(\Lambda )\cdot 0=0\] 说明满足.

这就是说, Dirac 方程的形式在不同的参考系下都是一样的, 一个正确的物理方程必须得具有这种最基本的空间变换协变性, 因为一个只对某个特殊参考系才成立的方程是没有意义的. 协变性的证明也是很简单的, 所以我说群论是必须得学的, 没学群论之前研究个协变性可能都半天整不明白啥叫方程的形式不变.

4.2. 常见疑惑之 gamma 矩阵为啥不变:

这是一个学得比较认真的人才会产生的疑惑, 因为我们前面说了就是在 Lorentz 变换下所有的表示空间内的元素与表示空间上的张量都要发生相应的变换, 那为啥研究协变性的时候 gamma 矩阵不用做替换? 但如果你一开始就根本不吊数学框架的话, 那你根本不会往这方面想, 也就不会有啥疑惑.

有这个疑惑是对的, 虽然几乎每一本场论书都告诉你 \[{{\gamma }^{\mu }}\] 是 Lorentz 矢量或旋量空间的二阶张量, 但我要告诉你其实他们都说错了··· 在 Lorentz 变换下 {\gamma ^\mu } 不会变为 {\Lambda ^\mu }_\nu {\gamma ^\nu } 是因为 {\gamma ^\mu } 既不是矢量表示空间中的矢量又不是旋量表示空间中的 (1,1) 型张量. 它仅仅只是有三个指标的三维数组 \left\{ {\left. {{{({\gamma ^\mu })}^a}_b} \right|\mu = 0,1,2,3;\;a,b = 1,2,3,4} \right\} , 可以说是 64 个常数或是 4 个常矩阵. 但无论如何 gamma 矩阵都不会被写成 \gamma = {\gamma ^\mu }\frac{{\text{d}}}{{{\text{d}}{x^\mu }}} [12] \gamma = {({\gamma ^\mu })^a}_b\frac{{\text{d}}}{{{\text{d}}{x^\mu }}}{e_a}{e^b} 等形式, 前面的 {e_a}{e^b} 指的是旋量空间基矢与对偶基矢的张量积.

就是说即使形式上存在着 {D^{ - 1}}(\Lambda ){\gamma ^\mu }D(\Lambda ) = {\Lambda ^\mu }_\nu {\gamma ^\nu } 这样的式子也并不表明 gamma 矩阵是 Lorentz 矢量或旋量空间的 (1,1) 型张量. 就是说 Lorentz 变换被解释为表示空间基底的变动, 而 gamma 矩阵根本就没有基底, 所以不受影响. 类似地其实在被动观点下 Lorentz 变换矩阵 \Lambda 本身也只是一个变换矩阵而非 Lorentz 张量.

另外需要提一下的是, 旋量双线性型整体来看确实是个 Lorentz 张量, 虽然它的 Lorentz 指标是源于 gamma 矩阵的. 说它是 Lorentz 张量不是因为它的旋量指标被 trace 掉了, 而是因为夹在两边的旋量提供了 Lorentz 变换的表示矩阵.

举个例子的话就是说虽然 {\gamma ^\mu } 不是 Lorentz 矢量,
但旋量双线性型 \[\bar{\psi }{{\gamma }^{\mu }}\psi \] 却整体能构成 Lorentz 矢量,
因为在 Lorentz 变换下是这样的一个过程:
\[\bar{\psi }{{\gamma }^{\mu }}\psi \overset{\Lambda }{\mathop{\to }}\,\left[ \bar{\psi }{{D}^{-1}}(\Lambda ) \right]{{\gamma }^{\mu }}\left[ D(\Lambda )\psi \right]=\bar{\psi }\left[ {{D}^{-1}}(\Lambda ){{\gamma }^{\mu }}D(\Lambda ) \right]\psi ={{\Lambda }^{\mu }}_{\nu }\bar{\psi }{{\gamma }^{\mu }}\psi.\]
于是整体来看就有 \[\left( \bar{\psi }{{\gamma }^{\mu }}\psi \right)\overset{\Lambda }{\mathop{\to }}\,{{\Lambda }^{\mu }}_{\nu }\left( \bar{\psi }{{\gamma }^{\mu }}\psi \right)\] , 所以说它是一个 Lorentz 矢量.

4.3. 常见疑惑之量子场变几次:

其实最后这节我也没啥根据, 就纯粹迷思一下, 但好消息是不管怎么诠释, 算出来都是一样的.
总之是先别信我, 等有空我还要找资料求证下的.

矢量场算符 {A^\mu } 是矢量表示空间中的 Lorentz 矢量, 然而它同时又是 Hilbert 空间中的线性算符或者说 (1,1) 型张量, 那它在 Lorentz 变换下究竟变几次?

是只变一次得到 {A'^\mu } = {\Lambda ^\mu }_\nu {A^\nu } 吗?
还是 {A'^\mu } = {\Lambda ^\mu }_\nu U(\Lambda ){A^\nu }{U^\dag }(\Lambda ) = {\Lambda ^\mu }_\nu {\left( {{\Lambda ^{ - 1}}} \right)^\nu }_\rho {A^\rho } = {A^\mu } 这样变两次又变回去呢?
类似地, 旋量场量子化后也会产生同样的问题.

故当研究类似于 \[{{P}^{\mu }}\equiv \langle \varphi |{{A}^{\mu }}\left| \psi \right\rangle \] 的情形时, 若只写出下面这种式子来就要叫人疑惑:

\[\left\langle {{A}^{\mu }} \right\rangle \equiv \langle \varphi |{{A}^{\mu }}\left| \varphi \right\rangle \overset{\Lambda }{\mathop{\to }}\,\langle {\varphi }'|{{A}^{\mu }}\left| {{\varphi }'} \right\rangle =\langle \varphi |{{U}^{\dagger }}(\Lambda ){{A}^{\mu }}U(\Lambda )\left| \varphi \right\rangle \]
\[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ ={{\Lambda }^{\mu }}_{\nu }\langle \varphi |{{A}^{\nu }}\left| \varphi \right\rangle \equiv \left\langle {{{{A}'}}^{\mu }} \right\rangle \ne \left\langle {{A}^{\mu }} \right\rangle .\]

疑惑点就在于为何进行 Lorentz 变换后, 既是矢量又是 (1,1) 型张量的 {A^\mu } 会这样无动于衷.

故我认为要讨论这个问题最直观的做法应该是先将 {{A^\mu }\left| \varphi \right\rangle } 整体视为一个物理态:

\[\left\langle {{A}^{\mu }} \right\rangle \equiv \langle \varphi |{{A}^{\mu }}\left| \varphi \right\rangle \]
\[\ \ \ \ \ \ \ =\left\langle \varphi |{{A}^{\mu }}\varphi \right\rangle \overset{\Lambda }{\mathop{\to }}\,\langle \varphi |{{U}^{\dagger }}(\Lambda )U(\Lambda )\left| {{{{A}'}}^{\mu }}\varphi \right\rangle \]
\[\ \ \ \ \ \ \ =\langle \varphi |{{U}^{\dagger }}(\Lambda )U(\Lambda ){{{A}'}^{\mu }}\left| \varphi \right\rangle \]
\[\ \ \ \ \ \ \ =\langle \varphi |{{U}^{\dagger }}(\Lambda )U(\Lambda ){{{A}'}^{\mu }}{{U}^{\dagger }}(\Lambda )U(\Lambda )\left| \varphi \right\rangle \]
\[\ \ \ \ \ \ \ ={{({{\Lambda }^{-1}})}^{\mu }}_{\nu }\langle \varphi |{{U}^{\dagger }}(\Lambda ){{{A}'}^{\nu }}U(\Lambda )\left| \varphi \right\rangle \]
\[\ \ \ \ \ \ \ ={{({{\Lambda }^{-1}})}^{\mu }}_{\nu }{{\Lambda }^{\nu }}_{\rho }\langle \varphi |{{{A}'}^{\rho }}\left| \varphi \right\rangle \]
\[\ \ \ \ \ \ \ =\langle \varphi |{{{A}'}^{\mu }}\left| \varphi \right\rangle ={{\Lambda }^{\mu }}_{\nu }\langle \varphi |{{A}^{\nu }}\left| \varphi \right\rangle \equiv \left\langle {{{{A}'}}^{\mu }} \right\rangle \ne \left\langle {{A}^{\mu }} \right\rangle .\]

最后出现的 \[\left\langle {{{{A}'}}^{\mu }} \right\rangle \ne \left\langle {{A}^{\mu }} \right\rangle \] 也是好理解的, 因为在不同的参考系下, \mu 指代的方向并不相同, 所以它们并不是在观测同一个事件的概率.

就是说最初就有 \[\left\langle \varphi |{{A}^{\mu }}\varphi \right\rangle \ne \langle \varphi |{{U}^{\dagger }}(\Lambda )U(\Lambda )\left| {{{{A}'}}^{\mu }}\varphi \right\rangle =\left\langle \varphi |{{{{A}'}}^{\mu }}\varphi \right\rangle ,\]
这是因为在两个不同的参考系下选择的作用在右矢上的矢量算符分量的方向是不同的.

如果不先将 {{A^\mu }\left| \psi \right\rangle } 整体视为一个物理态其实也不会有矛盾:

\[\left\langle {{A}^{\mu }} \right\rangle \equiv \langle \varphi |{{A}^{\mu }}\left| \varphi \right\rangle \overset{\Lambda }{\mathop{\to }}\,\left[ \langle \varphi |{{U}^{\dagger }}(\Lambda ) \right]\left[ U(\Lambda ){{{{A}'}}^{\mu }}{{U}^{\dagger }}(\Lambda ) \right]\left[ U(\Lambda )\left| \varphi \right\rangle \right]\]
\[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =\langle \varphi |{{{A}'}^{\mu }}\left| \varphi \right\rangle ={{\Lambda }^{\mu }}_{\nu }\langle \varphi |{{A}^{\nu }}\left| \varphi \right\rangle \equiv \left\langle {{{{A}'}}^{\mu }} \right\rangle \ne \left\langle {{A}^{\mu }} \right\rangle .\]
Pretty good, right?

那最后一个问题就是, 在量子化前, Lorentz 矢量在 Lorentz 变换下应该满足 {A'^\mu } = {\Lambda ^\mu }_\nu {A^\nu } , 而量子化后难道真的就如 {A'^\mu } = {\Lambda ^\mu }_\nu U(\Lambda ){A^\nu }{U^\dag }(\Lambda ) = {\Lambda ^\mu }_\nu {\left( {{\Lambda ^{ - 1}}} \right)^\nu }_\rho {A^\rho } = {A^\mu } 这样不发生任何改变吗?

对此我个人的理解就是, 量子化后生成的 Hilbert 空间在 Lorentz 变换后也发生了转动,
即量子态全体发生了变换 \left| {\varphi '} \right\rangle = U(\Lambda )\left| \varphi \right\rangle , 所以最后要测量概率的时候还是会有:
\left\langle {\varphi '} \right|{A^\mu }\left| {\varphi '} \right\rangle = \left\langle {\varphi '} \right|{U^\dag }(\Lambda ){A^\mu }U(\Lambda )\left| {\varphi '} \right\rangle = {\Lambda ^\mu }_\nu \left\langle \varphi \right|{A^\nu }\left| \varphi \right\rangle,
就是说这个变换比较隐性, 如果不把量子态写出来的话则看起就会好像没发生任何变化.

所以当你讨论方程的协变性时, 其实讨论的还是经典场论层面上的东西, 没必要考虑 Hilbert 空间.

参考

  1. ^ 顶多差个负号差个逆之类的, 这种约定上的不统一也是无法避免的.
  2. ^ a b 就是说我觉得你可以跳过.
  3. ^ 群乘法.
  4. ^ 或者你可以认为是 Lorentz 群的全体表示空间与全体旋量表示空间或射影表示空间.
  5. ^ 其中的 L^2 指的是 Hilbert 空间.
  6. ^ 其实也没啥烧脑的.
  7. ^ 我分了上下标是因为我喜欢上下重复指标求和, 但其实旋量空间上下标是完全一样的, 就是说它的度规就是个单位阵, 所以一般人都只写下标.
  8. ^ 为啥你妈的矢量就要把写出分量指标而旋量又用矩阵表示呢? 为啥你妈的不统一呢? 答案就是大家都这么搞, 你也别想独善其身.
  9. ^ 其实不是矩阵, 是量子算符, 但差不多是一个意思.
  10. ^ 或者从实二维的角度来看也可是个复平面.
  11. ^ SO(3) 的射影表示空间, 同时也是 SU(2) 的矢量表示空间.
  12. ^ 这里的 d/dx 你可以理解为坐标基矢或矢量空间基矢, 这是微分几何里的记号.
编辑于 2022-07-01 02:02

文章被以下专栏收录