【理解黎曼几何】8. 处处皆几何 (力学几何化)
By 苏剑林 | 2016-11-02 | 62991位读者 |黎曼几何在广义相对论中的体现和应用,虽然不能说家喻户晓,但想必大部分读者都有所听闻。一谈到黎曼几何在物理学中的应用,估计大家的第一反应就是广义相对论。常见的观点是,广义相对论的发现大大推动了黎曼几何的发展。诚然,这是事实,然而,大多数人不知道的事,哪怕经典的牛顿力学中,也有黎曼几何的身影。
本文要谈及的内容,就是如何将力学几何化,从而使用黎曼几何的概念来描述它们。整个过程事实上是提供了一种框架,它可以将不少其他领域的理论纳入到黎曼几何体系中。
黎曼几何的出发点就是黎曼度量,通过黎曼度量可以通过变分得到测地线。从这个意义上来看,黎曼度量提供了一个变分原理。那反过来,一个变分原理,能不能提供一个黎曼度量呢?众所周知,不少学科的基础原理都可以归结为一个极值原理,而有了极值原理就不难导出变分原理(泛函极值),如物理中就有最小作用量原理、最小势能原理,概率论中有最大熵原理,等等。如果有一个将变分原理导出黎曼度量的方法,那么就可以用几何的方式来描述它。幸运的是,对于二次型的变分原理,是可以做到的。
从作用量原理到黎曼几何 #
我们来考虑经典力学的最小作用量原理,为了更清晰地说明要义,我们以二维系统为例。一个二维保守系统的运动轨迹,是如下作用量的极值曲线:
S=∫{12[(dxdt)2+(dydt)2]−U(x,y)}dt
这里已经假定了m=1,导出的运动方程是
d2xdt2=−∂U∂x,d2ydt2=−∂U∂y
由于是保守系统,那么满足能量守恒
12[(dxdt)2+(dydt)2]+U=E
我们可以用它来消去式(70)中的dt参数,利用式(72),得到
U=E−12[(dxdt)2+(dydt)2]
代入S,得到:
S=∫[(dxdt)2+(dydt)2−E]dt
从变分的角度看,Edt这一项是全微分,不会带来任何实际效应,因此等效的作用量为
S=∫[(dxdt)2+(dydt)2]dt=∫dx2+dy2dt
再次利用式(72),可以得到
dt2=dx2+dy22(E−U)
消去dt,得到
S=∫√2(E−U)(dx2+dy2)
变分的结果跟常数因子无关,因此最后可以作用量等效于
S=∫√(E−U)(dx2+dy2)
这个作用量变分得到的结果,就是得到运动曲线的形状(相轨迹)了,而它本身具有黎曼度量的形式,即
ds2=(E−U)(dx2+dy2)
结果是一个等温参数。
从黎曼几何到运动方程 #
为了反过来证明这个度量的测地线确实是运动曲线的形状,我们变分式(78),得到
δS=∫√(E−U)(dx2+dy2)=∫δ√(E−U)(dx2+dy2)=∫δ[(E−U)(dx2+dy2)]2√(E−U)(dx2+dy2)
习惯上我们会用自然参数ds=√(E−U)(dx2+dy2)为参数,但如果使用自然参数,则没法回到经典力学中。因此,这里使用式(76)的时间参数,那么
δS=∫δ[(E−U)(dx2+dy2)]2√2(E−U)dt=∫−(∂U∂xδx+∂U∂yδy)(dx2+dy2)+2(E−U)(dxdδx+dydδy)]2√2(E−U)dt=1√2∫[−(∂U∂xδx+∂U∂yδy)dx2+dy22(E−U)dt+(dxdtdδx+dydtdδy)]
再次利用式(76),然后利用分步积分法,得到
δS∼∫[−(∂U∂xδx+∂U∂yδy)dt+(dxdtdδx+dydtdδy)]=∫[−(∂U∂xδx+∂U∂yδy)dt−(d2xdt2δx+d2ydt2δy)dt]=−∫[(d2xdt2+∂U∂x)δxdt+(d2ydt2+∂U∂y)δydt]
因此d2xdt2+∂U∂x=0,d2ydt2+∂U∂y=0,重新得到了运动方程(71),这也表明两者确实可以相互转换。
一般结果 #
以上结果可以一般化,即如下作用量的保守系统
S=∫[12gμνdxμdtdxνdt−U(x)]dt
的能量为E的运动曲线的形状(相轨线),等价于黎曼度量
ds2=[E−U(x)]gμνdxμdxν
下的测地线,其推导过程是类似的。这样我们就实现了将力学的问题几何化,或者说将二次型的变分问题几何化了。可能让人意外的是,以上结果在1837年就由雅可比完成了。
上面结果告诉我们,广义相对论不再是黎曼几何在物理中的代名词,即便没有广义相对论,物理中也有黎曼几何。将力学几何化,有助于我们将力学、场论等与几何联系起来。黎曼几何其实就是一套几何的研究框架,只要能够对应地转换,就可以直接应用黎曼几何的很多结论,并且可能导出更丰富、更全面的内容。
求解测地线 #
上述结果不仅仅具有理论价值,有时候还具有实用价值,比如帮助我们求测地线方程。让我们继续考虑等温参数ds2=f(x,y)(dx2+dy2),在自然参数ds=√f(x,y)(dx2+dy2)下,它的测地线方程是:
d2xds2=−12f∂f∂x(dxds)2+12f∂f∂x(dyds)2−1f∂f∂ydxdsdydsd2yds2=−12f∂f∂y(dyds)2+12f∂f∂y(dxds)2−1f∂f∂xdxdsdyds
除非一些非常特殊的情况,否则求解这个方程不是容易的事情,哪怕是对于f(x,y)=12(x2+y2)这样特殊情形。然而,根据我们前面所探索的结果,我们知道可以使用时间参数
dt=√dx2+dy22f(x,y)
就可以将系统等价于势能U=−f(x,y)的保守系统在E=0时的相轨迹,也就是测地线方程为
d2xdt2=∂f∂x,d2ydt2=∂f∂y
这就大大简化了测地线方程的形式。这时,我们所举的例子f(x,y)=12(x2+y2)时的测地线,只不过是两个已经分离好变量的线性微分方程罢了,完全可解。
转载到请包括本文地址:https://kexue.fm/archives/4046
更详细的转载事宜请参考:《科学空间FAQ》
如果您还有什么疑惑或建议,欢迎在下方评论区继续讨论。
如果您觉得本文还不错,欢迎分享/打赏本文。打赏并非要从中获得收益,而是希望知道科学空间获得了多少读者的真心关注。当然,如果你无视它,也不会影响你的阅读。再次表示欢迎和感谢!
如果您需要引用本文,请参考:
苏剑林. (Nov. 02, 2016). 《【理解黎曼几何】8. 处处皆几何 (力学几何化) 》[Blog post]. Retrieved from https://kexue.fm/archives/4046
@online{kexuefm-4046,
title={【理解黎曼几何】8. 处处皆几何 (力学几何化)},
author={苏剑林},
year={2016},
month={Nov},
url={\url{https://kexue.fm/archives/4046}},
}
July 8th, 2017
好文。但其中肯定有什么不对。因为如此计算推论,岂不是作用量原理等价或等效于广义相对论?请指正。或者指出有什么不一样?
广义相对论中的测地线,是时空测地线,指的是引力不是实在的力,而是时空几何性质。
这里的测地线,仅仅是空间的测地线,说的是在某个势能作用下的物体的运动轨迹,是某个流形上的测地线。
两者都是测地线,但物理意义不一样,并非测地线就肯定是广义相对论了。
July 8th, 2017
该文理解起来就好像黎曼几何就是曲线积分,是这样吗?这是我问题二,望解惑。
你这句话我不大理解。不过你可以粗糙地认为“黎曼几何就是研究测地线的学科”。
September 22nd, 2019
苏神,能不能给我你的QQ,交流一下
自己在网站找~在容易找到的地方。