哈密顿原理和拉格朗日函数的由来是怎样的?

哈密顿原理这个乍一眼看过去如此反人类直觉的原理是怎么发现的?的确应该有一个量在实际运动情况下取极值 这我可以接受 但是凭什么这个量就应该是这样的数学形…
关注者
1,209
被浏览
335,741

21 个回答

最小作用量原理的历史沿革

原创

所有参考资料来自wikipedia和清华大学李岩松老师的讲义


光学中的“ 最短路程原理 ”,早在古希腊时代,欧几里得和海伦(就是三角形海伦公式的那个海伦)等人就提出过。

但早期的“最短路程原理”更多是一种哲学概念,真正将之变为科学理论,并应用其解决实际问题的是费马(1601~1665),他应用“最短路程原理”准确地解释了光在连续变化介质中的光路。因此,后来最短光程原理又被称为 费马原理

费马原理影响了包括莱布尼茨(1649~1716)和欧拉(1707~1783)在内的一大批数学家。成为了变分法出现的一个重要契机。

事实上,变分法出现的契机除费马原理以外,更重要的是当时风靡一时的 最速降线问题 。约翰·伯努利(1667~1748)可能本来只是想装个逼,他应该也没想到这个问题后来引起了泛函和分析力学的革命。在这个问题的解答上,伯努利、莱布尼茨等人已经很接近变分法的大门了。

一般认为现代变分法是1744年由欧拉提出的,他提出了著名的欧拉方程:

\frac{\mathrm{d}}{\mathrm{d}x}(\frac{\partial{F}}{\partial{y'}})-\frac{\partial{F}}{\partial{y}}=0

到这里,后续的拉格朗日、哈密顿等人做的事情所需要的数学基础都已经有了。剩下的工作就是把这些数学应用到解释世界上,赋予方程物理意义。

简单概括一下:从“ 某个量取极值 ”这个角度来考虑问题(泛函极值),这种思想从古希腊时期就有了。费马成功将其应用到光学上并有所成就。这种思想在解决最速降线问题上也派了用场。

最速降线问题是牛顿时代的著名问题(牛顿本人也是最早解出这一问题的几位大牛之一),牛顿定律是人类首次得到力学的 第一性原理 ,是人类用科学方法解释世界的一大成功。

此时,那个叫欧拉的人把之前这些零散的泛函极值问题用数学语言说清楚了。

那么,把变分法这个最新的数学工具应用到解释世界上,应该是一个很自然的思路了吧。

实际上,早在欧拉之前,莱布尼茨就曾经这样做过了(虽然他并没有完全确立变分法的数学基础)。别以为莱布尼茨只是个纯数学家,只在微积分的发明上和牛顿叫板,其实他也是做过力学第一性原理的尝试的。是他最早提出了“作用量”的概念,他定义的作用量:

S=\int_{t_0}^{t_1}mv^2\mathrm{d}t

(至于为啥莱布尼茨定义的作用量是对时间积分而不是对路程积分,那我就不知道了)

莱布尼茨声称: 在所有可能的运动轨迹中, 真实轨迹的作用量取极值(极大或极小)

不难发现,如果理想完整约束下系统是稳定且保守的(加上这么一大堆理想化的条件之后):

mv^2=2T=T+E-V=L+E

也就是说,莱布尼茨的作用量和后来哈密顿的作用量只差一个积分号里面的能量E。

莱布尼茨的作用量极值原理是错误的,并没有得到广泛的认可。但或许人们收到了他的启发,开始有人去思考 能量相同轨道的作用量 。这种想法是否自然呢?

我们今天当然知道,哈密顿原理是正确的,这是事实验证的。为啥当时没人鸟莱布尼茨?因为他的原理有时候会出错。然而,这时人们发现,在能量一定的时候,莱布尼茨原理会给出正确的结果(那是当然,因为这个时候它和哈密顿原理的结果是一样的)。

那么,这个时候,来研究能量一定的情况下的作用量似乎是比较自然的思路。

以此为基础,L. Maupertuis(中文一般是翻译成莫陪督?)于1747 年提出了力学中最早的(正确的) 最小作用量原理 ,史称莫陪督原理。莫陪督的作用量定义为:

S=\int_{q_0}^{q_1}p\mathrm{d}q ,其中q是坐标,p是动量。(你看,莫陪督作用量就是对路程积分的!)

莫陪督原理的叙述是: 在位形空间的给定两点间所有能量相同的轨迹中,实际轨迹的莫陪督作用量取极小值。

为啥莫陪督作用量对路程积分,而不是对时间积分了?很简单,因为给定两点间能量相同的轨迹,经过始末点的时间是不一样的,因此作用量变分时,两端时间不能固定。

可以证明莫陪督原理和哈密顿原理是等价的。莫陪督原理是很有用的,它适合用来解决 两固定点间的轨迹 变分问题。

至此,将变分法应用到力学中的尝试已经部分成功了。

不过,莫陪督解决的这类问题并不是力学问题的全部。他还没有给出一个第一性原理。


花开两朵,各表一枝。下面我们从牛顿定律出发,换个方向来考虑这个问题。

那时人类所掌握的力学第一性原理是伟大的牛顿定律。

什么叫第一性原理?就是说,原则上运用牛顿定律可以解决一切力学问题。一切!

但,为什么要说原则上?

因为实际上,有一些问题是复杂到你用牛顿那一套方法解不出来的。

牛顿定律是一套强大的工具,但并不是万能的。例如有很复杂的约束的情况(比如说,研究一个放在表明已知凹凸不平的桌面上的小球的运动),用受力分析和加速度那一套来解会麻烦死的。

人们应对约束这个问题,想了很多办法,虚功原理就是其中非常有效的一种。其中虚位移的概念,其实已经很有一些变分的味道了。

达朗贝尔(1717~1783)第一次将虚功原理和牛顿定律结合起来,于1743年《动力学》一书中提出了达朗贝尔原理:

\Sigma_i(F_i-m_i \ddot{r_i})\delta r_i=0

叙述为: 主动力和惯性力在系统任何虚位移下所做的元功之和为零。

这个原理和牛顿定律是完全等价的。但实际上稍加观察就会发现,这完全就是虚功原理加上牛顿第二定律,并没有什么创新性嘛,只是把它们写成一个方程比较好看而已(很像数学家干的事哦)。

接下来,拉格朗日(1736~1813)在达朗贝尔的基础上,于1788年发表了《分析力学》一书(据说,他很骄傲地说:“我整本力学书没用一张图!”),这被看作是分析力学的开端。书中提出了拉格朗日方程:

\frac{\mathrm{d}}{\mathrm{d}t}(\frac{\partial{L}}{\partial{\dot{q}}})-\frac{\partial{L}}{\partial{q}}=0 ,其中 L=T-V ,q是广义坐标

这不是和前面的欧拉方程长得一模一样吗?

没错。不难想象,他就是为了凑这个形式,才这样定义拉格朗日函数L的。

为什么要凑这个形式?因为这个形式的变分前人已经研究清楚了,只要把方程写成这个形式,就把未知问题转化为已知问题了。可以省去自己大量的计算工作,谁不想偷点懒呢?

这样,大概拉格朗日函数L的奇怪定义就不那么难理解了吧。

可以证明,拉格朗日方程和达朗贝尔原理是等价的,而达朗贝尔原理和牛顿定律是等价的。因此,拉格朗日方程就和牛顿定律一样是力学的第一性原理了。

大家发现,这个方程很有用。对于复杂约束问题,它比牛顿定律方便多了!

因此,拉格朗日这哥们儿一下子就牛逼了。

欧拉-拉格朗日方程是一个跟变分法有关的方程,但到这里仍然不是大家最熟悉的那个最小作用量原理。

大家熟悉的最小作用量原理是哈密顿(1805~1865)在1834年提出的。哈密顿作用量定义为:

S=\int_{t_0}^{t_1}L\mathrm{d}t ,L就是上面那个拉格朗日函数

哈密顿声称: 满足约束的 所有可能的运动轨迹中, 真实轨迹的作用量取最小值。

也即,写成泛函变分的形式: \delta S=0

可以证明,它和拉格朗日方程是等价的。也就是说,它和牛顿定律也是等价的,也是力学第一性原理。

觉不觉得哈密顿原理长得和之前的莱布尼茨原理和莫陪督原理很像?

不难想象,哈密顿一定是受了两方面的启发, 用最小作用量的数学语言,叙述一个和已知正确的拉格朗日方程等价的结论。

至此,一开始看起来不自然的一切,是不是都显得自然了许多?

一贯地,数学工具(变分法)是先于物理原理出现的。变分法这个数学工具是受到之前费马伯努利等人的启发而出现的。

人们研究泛函变分的初衷是从宏观上(或者说从积分意义上)来解决问题。这种意识是从光学中来的,最早可追溯到古希腊。

在有了数学工具以后,人们迫不及待地将之投入力学问题中,但没有完全成功了(结论错误,或者不全面)。

相反,这个时候另一批人从微观(或者说从微分意义上)出发,一步一脚印地寻找牛顿定律的等价描述,直到拉格朗日获得成功。

(其实,欧拉-拉格朗日方程虽然是从微分出发的,但也是变分法的产物。这是由于,虚功原理就已经包含了变分的思想。)

此时,时机已成熟,哈密顿才得以将两方的成果综合起来, 用最小作用量原理的形式描述了一个力学第一性定律 。或者说, 拉格朗日方程是微分变分原理,哈密顿原理是积分变分原理 。如果没有前人的那些尝试,哈密顿的最小作用量原理就如同空中楼阁,是不可能建起来的。