杨振宁与粒子物理标准模型
标签:
转载 |
分类: 心得•人物 |
杨振宁与粒子物理标准模型
已有 181 次阅读
自2015年开始一直有动笔来写这么一篇文章的想法。不过,一是由于手头上的其它工作太多,二是由于已经有7年没有再动过粒子物理和广义相对论方面的课题,难免有所生疏,所以写作的想法被一再搁置。自2009年开始,笔者对物理学的兴趣被转移到凝聚态方向,这可能源自粒子物理和广义相对论最近几十年很难再取得实验上突破进展的看法。在凝聚态方面笔者做过自旋
20世纪前半叶,物理江湖中人才辈出,让笔者佩服的物理学家数不胜数,当然首数爱因斯坦。但若论20世纪后半叶,笔者却只真正佩服2个半人。这2个人分别是创立非阿贝尔规范场的杨振宁和创立路径积分的费曼,而那半个人却是创立“重整化群分析”的K.G.Wilson。不过在这篇文章中,笔者不打算谈及另外两人,而只想说说杨振宁,原因只有一点,因为他结束了粒子物理的“战国时代”。当然,笔者写作此文的主要目的是想更深入的解释杨振宁的工作到底如何导致了现代粒子物理标准模型的诞生。
时间首先要回溯到1922年。此时,O.Stern和W.Gerlach做了一个非常有趣的实验:他们让未被极化的电子气体束穿过非均匀的磁场,结果这一束电子分成了两束电子。这个实验让物理学家们震惊不已,因为它意味着电子具有“自旋”磁矩这一自由度,并且该自由度没有经典对应。我们知道空间有三个方向xyz,但是电子的自旋却不能同时取其中的两个空间方向(比如z和y),电子只能对其中一个方向取两个相反的值(比如-z和+z)。当时人们还无法理解这个事情,但是1925年海森堡创立量子力学的“矩阵版本”之后,泡利立即认识到电子自旋不能同时取两个空间方向这一事实可以被认为是“不对易”的特征。在类比海森堡的“不对易关系”后,泡利马上发现电子的自旋可以用SU(2)群的2维矩阵表示来描述。
什么是SU(2)群的2维矩阵表示呢?我们可以停下来稍作一点解释,因为这个概念会贯穿整个粒子物理发展的灵魂。
简单来说,SU(2)群的所有2维矩阵表示形成了4维空间中的一个3维球面,而其中每一个矩阵都代表该球面上的一个点。对于2维球面我们是比较熟悉了,比如地球的表面就可以被看作是一个2维球面,但是在现实中我们却没有见过3维的球面。尽管没有见过,但是拓扑学家们借助逻辑还是可以想象3维球面的样子。拓扑学家们的逻辑很简单:首先考虑1维圆圈和2维球面是如何构造的。1维圆圈可以考虑为将2个0维的点连接起来形成一个封闭的回路,这样,1维圆圈就是2维圆盘的“边界”。同理,2维球面可以考虑为将2个圆盘的“边界”无缝的粘合起来形成的封闭图形的“边缘”,这样,2维球面就是3维球体的“边界”。以此类推,3维球面可以考虑为将2个3维球体的边界(2个2维球面)无缝的粘合起来形成的封闭图形的“边缘”,当然这种“粘合”在我们的3维空间已经无法做到。但是从这个构造的过程,我们至少可以看到3维球面很独特的一点:那就是3维球面是两个2维球面无缝粘合起来形成的图形,因此与2维球面转一圈是360度不同,在3维球面转一圈是720度。这就意味着从SU(2)群的一个2维矩阵表示回到自身需要经过720度的旋转。那么如何做到这一点呢?泡利考虑了如下3个矩阵:
http://image.sciencenet.cn/album/201610/19/111952hcyw00w5ww6w83z6.png
这3个矩阵恰好构成了SU(2)群的一个2维基础表示:这3个矩阵的线性组合可以构成3维球面上的任何一点。
好了,数学到这里就打住了。读者们只需要知道:由于是2维表示,电子的波函数至少需要是2分量的向量,一个分量描述电子自旋向上的状态,另一个分量描述自旋向下的状态,并且我们可以从一个分量连续变化到另一个分量。(当然,后来狄拉克发现完整的电子波函数需要一个4分量的向量来描述,这个4分量向量是洛伦兹群的4维表示的基,被称为“旋量”。多出的2个分量形成的向量用于描述正电子,该向量也可被看作SU(2)群的2维表示的基。事实上,洛伦兹群恰好可以被看作2个SU(2)群的张量积)。
泡利的思想是超前,他的工作暗示所谓上、下“自旋”不过是电子所处的两个不同状态而已。这为后来海森堡核子理论的发展铺平了道路。
时间进入到1932年,刚刚因创立量子力学而获得诺贝尔物理学奖的海森堡可谓意气风发,将其目光转向了尚待开发核物理领域
在故事进入到20世纪50年代之前,还有两个故事要讲。
第一个故事当然是关于爱因斯坦的相对论。有不少人相信就算爱因斯坦没有发明狭义相对论,很快也会有人发现它。但是如果爱因斯坦没有发明广义相对论的话,能否还有其他人能够发现它就不好说了。那么爱因斯坦到底做了什么,使得广义相对论具有如此特殊的地位呢?为了弄清楚这一点,我们首先来看狭义相对论。狭义相对论简单来说就是要保证:麦克斯韦电磁方程组在匀速的运动之下保持其形式不变。为了做到这一点,时间坐标和空间坐标会融入一个常数矩阵L的变换,这个矩阵的变换可以保证光速在不同惯性系是不变的。而这个矩阵L正是洛伦兹群的一个4维表示。但是接下来爱因斯坦做了一个疯狂的举动,他认为常数矩阵L可以不必真的是一个常数,而可以是时间坐标和空间坐标的函数。但如此一来,我们就不能保证麦克斯韦方程在矩阵L变换下保持形式不变了。为了克服这一困难,爱因斯坦重新考虑了空间导数的定义,并用Levi-Civita“协变导数”代替了“牛顿-莱布尼兹导数”,这意味着对空间任意两点做测量必须要依据“定域”的原则。这很可能是人类历史上“定域性原则”这一重要理念第一次进入到物理学领域。下图不难看出,从牛顿-莱布尼兹导数变化到“协变导数”只是多增加一项函数而已,这个函数叫做Levi-Civita联络。
http://image.sciencenet.cn/album/201610/19/112012xyzzllp488fwgtoo.png
依赖于“定域性原则”,爱因斯坦认为所有物理法则都应该在矩阵L变换下保持形式不变。由于矩阵L的形式可以是任意的,因此爱因斯坦将此原则命名为“广义协变原则”,以此原则为指导的理论被称为“广义相对论”。为了保证引力理论也具有广义协变性,1915年爱因斯坦重新建立了引力场方程。由于引力质量与惯性质量相等的原因,引力效应本身可以被等价为时空坐标的变换L,并且由于引力导致的变换矩阵L的普适作用性(任何物体都受到引力作用),后来广义相对论几乎被物理学界等价为“爱因斯坦引力场方程”。正因为这个原因,“广义协变原则”晚至20世纪50年代才又重新被进一步发展。
接下来的第二个故事是一个小插曲。它讲的是大数学家希尔伯特的一位学生H. Weyl,后者后来也成为了一名伟大的数学家。1918年时H.Weyl受到爱因斯坦通过修改“牛顿-莱布尼兹导数”为“协变导数”来推出引力理论工作的影响,开始考虑是否可以通过改变“导数”为更广义的“协变导数”的方式来推出“电磁场”理论,从而使得引力和电磁力都只是一种“几何效应”[3]。如果可行的话,那么从某种意义上来说,引力与电磁力可以被统一认定为时空的“几何效应”。有意思的是,H.Weyl发现如果在“牛顿-莱布尼兹导数”上不光加上Levi-Civita联络,还加上电磁势作为“联络”的话(见下图),那么麦克斯韦方程组就可以自动出现。
http://image.sciencenet.cn/album/201610/19/11204162a36auxxtdn3lhj.png
但是问题马上就来了,Levi-Civita联络的出现是为了保证物理方程在坐标变换下保持形式不变,那么电磁势作为“联络”保证的是什么不变性呢?H.Weyl经过深入的研究后发现,电磁势作为“联络”可以保证物理量在标度(尺度)变换下的不变性,H.Weyl称之为“规范变换”。但任意的变换尺度意味着,物理世界的长度会受到电磁场的影响而不确定,爱因斯坦在看过H.Weyl的理论后批评道:“如果我们每次围着一个圆周跳舞时量杆都伸长了,那长度就没有意义了”。因为爱因斯坦的批评,物理学界暂时放弃了H.Weyl的规范理论。不过,在薛定谔1926年创立量子力学的“波动版本”之后,情况发生了改变。此时电子被认为可以用一个复数波函数来描述,因为是复数,那么该复数波函数可以经历任意一个模为1的复数变换U而保证波函数的模不变(这并不会影响波函数的概率解释)。首先意识到这一点是F.London(此人后来与其兄弟H.London做出了解释超导电性的“二流体模型”),他在1929年指出如果H.Weyl所考虑的“标度变换”被复数变换U所代替的话,那么麦克斯韦方程组就可以在量子力学中自动的出现,如此一来电磁场就可以被解释为“规范场”
时间该要进入到20世纪50年代了。此时,那位曾身在昆明的年轻物理研究生已经来到了美国布鲁克海文实验室做研究员,这个年轻人就是后来大名鼎鼎的杨振宁。多年之后的杨振宁曾回忆起布鲁克海文的时光([6],19页):
“当我还在昆明和芝加哥做研究生的时候就被泡利那篇场论的综述论文所吸引,我对其中电荷守恒被联系到电子波函数的相位(规范)不变性所深深的震撼……在芝加哥时我尝试将(核子)同位旋守恒也纳入规范变换的范畴……越来越多的介子和各类相互作用被陆续发现,我开始意识到有必要建立一个原则来统一描述它们……”
杨振宁首先注意到了海森堡曾于1932年发展的SU(2)核子理论,在这个理论中质子和中子被看作“核子”的两种同位旋状态,这与电子具有两种电荷状态的精神是完全一致的。既然电子的电荷守恒可以归结为电子波函数的规范不变性,从而导致电磁场的出现。那么核子的同位旋守恒是否也可以由规范不变性决定呢?答案是肯定的。按照海森堡的核子理论,质子和中子可以被考虑为核子的两个不同状态,所以核子波函数可以用2维的向量来表示,它是SU(2)表示的基。这个2维向量在常值的SU(2)矩阵变换之下的不变性可以导致核子的同位旋守恒。这非常类似于狭义相对论的情形。
事情到这里并没有完,接下来杨振宁问了一个更加深刻的问题:要是我们把常值的SU(2)矩阵换成依赖于时空坐标的SU(2)矩阵,那么核子的同位旋守恒性还成立吗?
各位读者应该还记得之前笔者在谈及广义相对论时提到爱因斯坦曾问过一个问题:洛伦兹矩阵L若是时空坐标的函数,那么麦克斯韦方程在L变换下是否保持形式不变呢?这个问题导致了广义相对论的诞生。杨振宁在这里实际上问了与爱因斯坦相同的问题,只不过洛伦兹矩阵L的角色被SU(2)矩阵替换了。一旦思考到这一层意思,“广义协变性”就呼之欲出了,这一次广义协变的思想被推广到了波函数的内部空间而不再仅仅限于时空坐标的变换。与爱因斯坦处理广相对论的“定域化”思维一致,杨振宁考虑将“牛顿-莱布尼兹导数”修改为“协变导数”。好在这种协变导数的构造并不困难,因为H.
Weyl已经在电磁场的规范理论中构造了如此一种协变导数。将协变导数的构造从电磁场的复数情形(所谓U(1)规范群)推广到SU(2)矩阵的情形是平凡,只需要添加一个矩阵“场”函数作为“联络”就可以了。杨振宁所面临的真正困难在于如何构造一个麦克斯韦方程的SU(2)“矩阵版本”。杨振宁曾被这个难题困扰多年,直到1954年才在R.Mills的协助下解决了这一难题。从这一时刻开始,非阿贝尔规范场理论正式被创立,此时的杨振宁踌躇满志,他在其那篇著名的论文中雄心勃勃的写道
“同位旋守恒意味着所有相互作用应该在同位旋的变换下保持不变”。
这一观点正是爱因斯坦“广义协变原则”的自然扩展。但是仅从上面的这一句话读者可能还是不太清楚杨振宁到底想说什么。为了理解他的真实想法,我们需要了解到同位旋不变性这一说法后来被规范不变性这一术语所替代。事实上,杨振宁的SU(2)规范场“矩阵版本”反映的是所有矩阵类型规范场的统一数学结构(后来被意识到这就是李群结构),所以还是沿用了H.Weyl规范场的提法,把包括复数和矩阵在内的导致波函数内部空间变换的全体称之为“规范变换”,增加的相应“联络”被称为“规范场”。
因此如果我们将杨振宁上面的话翻译为现代语言那么就好理解了:
“所有相互作用应该在规范变换下保持不变”。
显然,杨振宁的目标是所有的相互作用。那时候核的强相互作用与弱相互作用都已经被发现,杨振宁寄希望于他的规范场理论可以描述这些相互作用。因为电磁场本身就是规范场,如果弱相互作用也是规范场,那么规范不变性很可能导致相互作用之间的统一。这就展现出了非常诱人的前景。
杨振宁首先想到他的SU(2)
尽管杨振宁的SU(2)
在统一弱相互作用和电磁作用的研究上真正做出重要一步的是史温格的学生格拉肖,他开始意识到质子和中子都不是基本粒子,因此将它们作为核子的两种不同状态并不严格。这就是说,核子的SU(2)同位旋不变性并不准确。格拉肖于1961年开始考虑严格的SU(2)对称性的情形
为了得到完全正确的弱电统一理论,还需要7个人上场:杨振宁、李政道、费曼、盖尔曼、朗道、南部阳一郎和希格斯。
1956年杨振宁和李政道发现弱相互作用下宇称不守恒后(他们因此而于1957年获得诺贝尔物理学奖)
在另一条道路上,为了对超导电性进行解释,凝聚态大家朗道提出“对称性自发破缺”的概念来构造场论模型以描述超导电性。1960年南部阳一郎进一步意识到所谓超导的“对称性自发破缺”事实上是破坏掉了超导电子的“电荷守恒”(因为超导电子对数目的不确定,所以超导电子的电荷总量是不确定的)
好了,万事俱备,只欠东风了。离统一电磁力和弱相互作用的终点已经近在咫尺。
将格拉肖的“弱电统一模型”、“普适V-A理论”以及“希格斯机制”结合起来的有两位物理学家,他们分别是温伯格和萨拉姆。
在吸收了格拉肖关于电子和中微子是弱相互作用下轻子的不同状态的想法,以及只存在左旋中微子和右旋反中微子(即宇称不守恒)的想法后,温伯格在1967年指出,弱电统一的正确做法是把左旋电子和左旋中微子看作同一种左旋轻子的两种不同状态,而右旋轻子只有一种右旋电子的状态
20世纪80年代初,CERN发现了W+、W-、Z这三个弱相互作用粒子,鼓舞人心的是,实验测量的粒子质量与理论预言完全一致。从此由温伯格、格拉肖、萨拉姆敲板定音的弱电统一模型成为粒子物理的标准模型。
据说,在实验证实了弱电统一模型之后,杨振宁在一次晚宴上打开香槟,说一句:“over”。这似乎既预示着粒子物理盛宴的结束也预示着规范场理论的巨大胜利(结束了粒子物理的“战国时代”)。笔者不知道这件事情是否属实,但是笔者相信在以非阿贝尔规范场理论为基础的弱电统一模型被证实之后,杨振宁的内心一定是充满万丈豪情的。弱电统一模型所需要的三个要素:非阿贝尔规范场、宇称不守恒、希格斯机制,被他发现了其中的两个,您说的他的内心会不狂喜吗?
至少笔者相信是这样的。
最后,在这里仍旧留下了的一个历史疑问:既然杨振宁发现了非阿贝尔规范场、宇称不守恒,并敲定了中微子的正确旋量描述,那么为什么他没有发现弱电统一模型呢?
历史已经过去,真实的事情全貌我们也无法了解,但是下面的故事也许可以为我们洞悉此问题提供一个可能的答案。
在1961年时,物理学家J. A.Tarski(此人将非阿贝尔规范场用于描述强相互作用)曾给杨振宁写了一封信([6],49页):
“您常常告诫年轻的理论物理学家们:‘理论家最主要的任务之一是建议一个好的实验’。但是在您1954年建立Yang-Mills理论后却没有鼓励实验家去搜寻Yang-Mills粒子。这到底是为什么?”
按照杨振宁自己的回忆,当他收到这封信时久久不知如何回复,以至于多年后忘记当时到底做了怎样的回信。不过,当我们回顾杨振宁的科研历程却不难发现,1961年收到这封信时他刚刚才和N.Byers在PRL合作发表了一篇解释超导环磁通量量子化的论文[16],也就是说此时杨振宁的研究兴趣已经转向凝聚态领域了。而发现粒子物理标准模型的其他几位物理学家同时期又在做什么呢?不管是盖尔曼、格拉肖、温伯格还是萨拉姆,他们的兴趣一直都处于粒子物理和场论领域的亢奋阶段,并没有文献显示此阶段他们在其它物理领域有所建树,这与杨振宁的研究风格形成鲜明的对比。
就像爱因斯坦最终没有发现薛定谔方程一样,尽管为建立量子力学提供了必要的理论基础,但是爱因斯坦的研究兴趣往往过于分散在各个不同的领域,以致错失发现量子力学基本方程的机会。杨振宁在这一点上倒比较接近爱因斯坦的风格,分散于不同领域,并留下自己“无与伦比”的足迹,让后来人更容易发现攀登高峰的正确方向。
就像物理学家戴森所比喻的《鸟与青蛙》一样:鸟翱翔在高高的天空,而青蛙生活在天空下的泥地里;鸟俯瞰延伸至遥远地平线的广袤的数学远景,而青蛙乐于探索特定问题的细节,一次只解决一个问题。
等青蛙解决问题之后,却不会忘记鸟早已飞过。
【文献列表】:
[1].Heisenberg, W., Z. Physik 77 (1932): 1
[2].Fermi, E., Z. Physik 88 (1934): 161
[3].Weyl, H., Ann der Phisik 59 (1919): 101
[4].London, F., Z. Physik 42 (1927): 375
[5].Pauli, W., Review of Modern Physics 13 (1941): 203
[6].杨振宁,《杨振宁论文选集(1945-1980)》,世界图书出版公司,1994
[7].Yang, C. N. and Mills, R. L., Physical Review 96 (1954): 191
[8].Glashow, S. L., Nuclear Physics 22 (1961): 579
[9].Lee, T. D. and Yang, C. N., Physical Review 104 (1956): 254
[10].Feynman, R. and Gell-mann, M., Physical Review 109 (1958): 193
[11].Nambu, Y. Physical Review Letters 4 (1960):1264
[12].Higgs, P. W., Physics Letters 12 (1964): 132
[13].Higgs, P. W., Physical Review Letters 13 (1964): 508
[14].Weinberg, S., Physical Review Letters 19 (1967):1264
[15].Glashow, S. L. et al., Physical Review D 2 (1970): 1285
[16].Byers, N. and Yang, C. N., Physical Review Letters 7 (1961):46
未经授权,请勿转载。
http://blog.sciencenet.cn/blog-1253715-1009642.html

加载中…