变分法的一个技巧及其“误用”
By 苏剑林 | 2013-07-30 | 36138位读者 |不可否认,变分法是非常有用而绝妙的一个数学工具,它“自动地”为我们在众多函数中选出了最优的一个,而免除了具体的分析过程。物理中的最小作用量原理则让变分法有了巨大的用武之地,并反过来也推动了变分法的发展。但是变分法的一个很明显的特点就是在大多数情况下计算相当复杂,甚至如果“蛮干”的话我们几乎连微分方程组都列不出来。因此,一些有用的技巧是很受欢迎的。本文就打算介绍这样的一个小技巧,来让某些变分问题得到一定的化简。
我是怎么得到这个技巧的呢?事实上,那是几个月前我在阅读《引力与时空》时,读到变分原理那一块时我怎么也读不懂,想不明白。明明我觉得是错误的东西,为什么可以得到正确的结果?我的数学直觉告诉我绝对是作者的错,可是我又想不出作者哪里错了,所以就一直把这个问题搁置着。最近我终于得到了自己比较满意的答案,并且窃认为是本文所要讲的这个技巧却被物理学家“误用”了。
技巧
首先来看通常我们是怎么处理变分问题的,以一元函数为例,对于求
$$S=\int L(x,\dot{x},t)dt$$
的极值曲线,我们通常是直接将其代入欧拉-拉格朗日方程:
$$\frac{\partial L}{\partial x}-\frac{d}{dt}(\frac{\partial L}{\partial \dot{x}})=0$$
这总是会奏效的,但是通常都不会简单。我们来看一个特例,即很多变分问题的被积函数都是根号的形式的,如狭义相对论的作用量是$S=-\int mc\sqrt{c^2 dt^2-dx^2-dy^2-dz^2}$,短程线问题的弧长是$l=\int\sqrt{g_{\mu\nu}dx^{\mu}dx^{\nu}}$等等,这一类问题如果直接把其中一个变量作为自变量,其他变量作为函数,代入欧拉-拉格朗日方程,就会得到非常复杂的结果,变量之间“纠缠”在一起,以至于甚至我们连微分方程都列不出来。
可是我们仔细注意就会发现,复杂性的来源是根号,而根号里边的表达式通常并不是非常复杂,要是有个方法让我们将其平方一下就好了。这确实是可以实现的,但是要找到它,却不能从欧拉-拉格朗日方程出发,要从变分法最根本的运算出发。
$$\begin{aligned}\delta S &=\delta \int Ldt \\&=\int \delta(Ldt)\\&=\int \delta\sqrt{(Ldt)^2}\\&=\int \frac{\delta (L^2 dt^2)}{2\sqrt{(Ldt)^2}}\end{aligned}$$
设$ds=\sqrt{(Ldt)^2}=Ldt$,就变成了
$$\int \frac{\delta (L^2 dt^2)}{2ds}=\int \frac{\delta (L^2 dt^2)}{2ds^2}ds$$
此时,如果我们在变分过程(要注意,是仅仅在变分过程中)中,将ds看成与x,y无关的、纯粹的参数,那么我们可以改写为
$$\int \frac{1}{2}\delta [L^2 (\frac{dt}{ds})^2]ds$$
这样子也就是说,如果以$ds=Ldt$作为参量,那么$S=\int Ldt$的变分与$S=\int \frac{1}{2} [L^2 (\frac{dt}{ds})^2]ds$的变分所给出的结果(微分方程组)是等效的。这样一来,我们只需要将$L'=\frac{1}{2} L^2 (\frac{dt}{ds})^2$代入到欧拉-拉格朗日方程中即可,通常来说这会比直接代入L简单一些。
比如,在考虑短程线时,我们要变分$l=\int\sqrt{g_{\mu\nu}dx^{\mu}dx^{\nu}}$,设$ds=\sqrt{g_{\mu\nu}dx^{\mu}dx^{\nu}}$,那么
$$l=\int g_{\mu\nu}\frac{dx^{\mu}}{ds}\frac{dx^{\nu}}{ds}ds$$
记$L'=\frac{1}{2} g_{\mu\nu}\frac{dx^{\mu}}{ds}\frac{dx^{\nu}}{ds}$,代入欧拉-拉格朗日方程就得到:
$$\frac{d}{ds}(g_{\mu\nu}\frac{dx^{\nu}}{ds})=\frac{\partial g_{\alpha\beta}}{\partial x^{\nu}}(\frac{dx^{\alpha}}{ds})(\frac{dx^{\beta}}{ds})$$
误用
然而,这种技巧有可能会被误用。狭义相对论中的自由粒子作用量是$S=-\int mc\sqrt{c^2 dt^2-dx^2-dy^2-dz^2}$,根据上面的结论,它和$S=-\int \frac{1}{2}mc[c^2 (\frac{dt}{ds})^2-(\frac{dx}{ds})^2-(\frac{dy}{ds})^2-(\frac{dz}{ds})^2]ds$的效果是等价的,其中$ds=\sqrt{c^2 dt^2-dx^2-dy^2-dz^2}$。这在没有考虑相互作用时是正确的,但是如果加入了势能项的作用量时,我们很容易也产生这样的错觉:同样把自由粒子项换成是$S=-\int \frac{1}{2}mc[c^2 (\frac{dt}{ds})^2-(\frac{dx}{ds})^2-(\frac{dy}{ds})^2-(\frac{dz}{ds})^2]ds$,但这将会导致错误的结果。因为我们所说的技巧,是将整个拉格朗日函数平方,而不是部分平方。
比如我们之前考虑过的
$$S= -mc^2 \int \sqrt{1-\frac{v^2}{c^2}}dt-\alpha \phi \sqrt{1-\frac{v^2}{c^2}}dt$$
不可以简单地将作用量变换成:
$$S=-\int \frac{1}{2}mc[c^2 (\frac{dt}{ds})^2-(\frac{dx}{ds})^2-(\frac{dy}{ds})^2-(\frac{dz}{ds})^2]ds-\frac{\alpha}{c} \phi ds$$
这将会给出错误的结果。事实上这也不存在任何简单的方法,最好的方法就是直接将其变分,而不是利用欧拉-拉格朗日方程。
“只要在多走一小步,仿佛是向同一方向迈的一小步,真理便会变成错误。”我想,这也是这句话的体现之一。
转载到请包括本文地址:https://kexue.fm/archives/2040
更详细的转载事宜请参考:《科学空间FAQ》
如果您还有什么疑惑或建议,欢迎在下方评论区继续讨论。
如果您觉得本文还不错,欢迎分享/打赏本文。打赏并非要从中获得收益,而是希望知道科学空间获得了多少读者的真心关注。当然,如果你无视它,也不会影响你的阅读。再次表示欢迎和感谢!
如果您需要引用本文,请参考:
苏剑林. (Jul. 30, 2013). 《变分法的一个技巧及其“误用” 》[Blog post]. Retrieved from https://kexue.fm/archives/2040
@online{kexuefm-2040,
title={变分法的一个技巧及其“误用”},
author={苏剑林},
year={2013},
month={Jul},
url={\url{https://kexue.fm/archives/2040}},
}
August 3rd, 2015
变分所给出的结果(微分方程组)是等效的。这句话前面的表达式少了狄拉克函数的符号。
February 7th, 2020
推导方法的过程是不是用广义坐标而不是t比较好呢,方便和实际应用作比较,比如您在【理解李曼几何3】里边的实际应用,广义坐标与r,θ,φ对应
本文涉及的内容的实际应用就是运动方程呀,所以以$t$为标准是比较实际的。