标签极值下的文章 - 科学空间|Scientific Spaces

15 Feb

积分估计的极值原理——变分原理的初级版本

By 苏剑林 | 2016-02-15 | 38391位读者 | 引用

如果一直关注科学空间的朋友会发现，笔者一直对极值原理有偏爱。比如，之前曾经写过一系列《自然极值》的文章，介绍一些极值问题和变分法；在物理学中，笔者偏爱最小作用量原理的形式；在数据挖掘中，笔者也因此对基于最大熵原理的最大熵模型有浓厚的兴趣；最近，在做《量子力学与路径积分》的习题中，笔者也对第十一章所说的变分原理产生了很大的兴趣。

对于一样新东西，笔者的学习方法是以一个尽可能简单的例子搞清楚它的原理和思想，然后再逐步复杂化，这样子我就不至于迷失了。对于变分原理，它是估算路径积分的一个很强大的方法，路径积分是泛函积分，或者说，无穷维积分，那么很自然想到，对于有限维的积分估计，比如最简单的一维积分，有没有类似的估算原理呢？事实上是有的，它并不复杂，弄懂它有助于了解变分原理的核心思想。很遗憾，我并没有找到已有的资料描述这个简化版的原理，可能跟我找的资料比较少有关。

从高斯型积分出发

变分原理本质上是Jensen不等式的应用。我们从下述积分出发
$$\begin{equation}\label{jifen}I(\epsilon)=\int_{-\infty}^{\infty}e^{-x^2-\epsilon x^4}dx\end{equation}$$

点击阅读全文...

分类：数学研究标签：不等式, 积分, 极值阅读全文 2 评论

11 Dec

“熵”不起：从熵、最大熵原理到最大熵模型（二）

By 苏剑林 | 2015-12-11 | 91656位读者 | 引用

上集回顾

在第一篇中，笔者介绍了“熵”这个概念，以及它的一些来龙去脉。熵的公式为
$$S=-\sum_x p(x)\log p(x)\tag{1}$$
或
$$S=-\int p(x)\log p(x) dx\tag{2}$$
并且在第一篇中，我们知道熵既代表了不确定性，又代表了信息量，事实上它们是同一个概念。

说完了熵这个概念，接下来要说的是“最大熵原理”。最大熵原理告诉我们，当我们想要得到一个随机事件的概率分布时，如果没有足够的信息能够完全确定这个概率分布（可能是不能确定什么分布，也可能是知道分布的类型，但是还有若干个参数没确定），那么最为“保险”的方案是选择使得熵最大的分布。

最大熵原理

承认我们的无知

很多文章在介绍最大熵原理的时候，会引用一句著名的句子——“不要把鸡蛋放在同一个篮子里”——来通俗地解释这个原理。然而，笔者窃以为这句话并没有抓住要点，并不能很好地体现最大熵原理的要义。笔者认为，对最大熵原理更恰当的解释是：承认我们的无知！

点击阅读全文...

分类：数学研究标签：概率, 极值, 最大熵, 熵阅读全文 19 评论

2 May

寻求一个光滑的最大值函数

By 苏剑林 | 2015-05-02 | 148321位读者 | 引用

在最优化问题中，求一个函数的最大值或最小值，最直接的方法是求导，然后比较各阶极值的大小。然而，我们所要优化的函数往往不一定可导，比如函数中含有最大值函数$\max(x,y)$的。这时候就得求助于其他思路了。有一个很巧妙的思路是，将这些不可导函数用一个可导的函数来近似它，从而我们用求极值的方法来求出它近似的最优值。本文的任务，就是探究一个简单而有用的函数，它能够作为最大值函数的近似，并且具有多阶导数。下面是笔者给出的一个推导过程。

在数学分析中，笔者已经学习过一个关于最大值函数的公式，即当$x \geq 0, y \geq 0$时，我们有
$$\max(x,y)=\frac{1}{2}\left(|x+y|+|x-y|\right)\tag{1}$$
那么，为了寻求一个最大值的函数，我们首先可以考虑寻找一个能够近似表示绝对值$|x|$的函数，这样我们就把问题从二维降低到一维了。那么，哪个函数可以使用呢？

点击阅读全文...

分类：数学研究标签：函数, 极值, 光滑阅读全文 46 评论

19 Aug

势能最小问题的探讨

By 苏剑林 | 2013-08-19 | 18144位读者 | 引用

本文我们来探讨下列积分的极值曲线：
$$S=\int f(x,y)\sqrt{dx^2+dy^2}=\int f(x,y)ds$$

这本质上也是一个短程线问题。但是它形式比较简答，物理含义也更加明显。比如，如果$f(x,y)$是势函数的话，那么这就是一个求势能最小的二维问题；如果$f(x,y)$是摩擦力函数，那么这就是寻找摩擦力最小的路径问题。不管是哪一种，该问题都有相当的实用价值。下面将其变分：

$$\begin{aligned} \delta S =&\int \delta[f(x,y)\sqrt{dx^2+dy^2}] \\ =&\int [ds\delta f(x,y)+f(x,y)\frac{\delta (dx^2+dy^2)}{2ds}]\\ =&\int ds(\frac{\partial f}{\partial x}\delta x+\frac{\partial}{\partial y}\delta y)+f \frac{dx d(\delta x)+dy d(\delta y)}{ds} \\=&\int ds(\frac{\partial f}{\partial x}\delta x+\frac{\partial}{\partial y}\delta y)+f \frac{dx}{ds} d(\delta x)+\frac{dy}{ds} d(\delta y) \end{aligned}$$

点击阅读全文...

分类：物理化学标签：势能, 极值, 变分阅读全文抢沙发

3 Feb

关于“平衡态公理”的更正与思考

By 苏剑林 | 2013-02-03 | 21316位读者 | 引用

在《自然极值》系列文章中，我引用了《数学方法论与解题研究》（张雄，李得虎编著）中提到的“平衡态公理”，并用它来解决了一些数学物理问题。平衡态公理讲的是系统的平衡状态总是在势能取极（小）值时取到，简单来讲就是自然界总向势能更低的方向发展，比如“水往低处流”。这在经典力学中本身是没有任何问题的，但在有些时候，我们在应用的时候可能会不自觉地将它想象成为“系统的平衡状态总是在总能量取极（小）值时取到”。然而，这却是不正确的。本文就是要探讨这个问题。

先来看看平衡态公理的来源。从最小作用量原理出发，考虑保守系统，每一个系统都应该对应着一个取极值的作用量S：
$$S=\int_{t_1}^{t_2} L(x,\dot{x})dt$$

点击阅读全文...

分类：物理化学标签：平衡, 极值, 公理阅读全文抢沙发

15 May

地球引力场的悬链线方程

By 苏剑林 | 2011-05-15 | 67129位读者 | 引用

之前曾在《自然极值》系列文章中提到过均匀重力场下的悬链线形状问题，并且在那文章中向读者提出：在一个质点（地球）引力场中的悬链线形状会是怎么样的。说实话，提出这个问题的时候，我还不懂怎么解答这个问题，不过现在会了，回头一看，已经几个月了，时间过得真快...

与之前的思路一样，我们依旧采用的是“平衡态公理”，即总势能最小。从天体力学中我们知道，任意两个质点间的势能为$-\frac{Gm_1 m_2}{r}$。对于本题的悬链线问题，我们可以把地球放到坐标原点位置，而悬链的两个固定点分别为$(x_1,y_1)$和$(x_2,y_2)$，链的总长度为l。即
$$\int_{x_1}^{x_2} \sqrt{dx^2+dy^2}=l$$

点击阅读全文...

分类：物理化学标签：势能, 平衡, 极值, 公理阅读全文 13 评论

5 Apr

重提“旋转弹簧伸长”问题（变分解法）

By 苏剑林 | 2011-04-05 | 21219位读者 | 引用

感谢Awank-Newton读者的来信，本文于2013.01.30作了修正，主要是弹性势能的正负号问题。之前连续犯了两个错误，导致得出了正确答案。现在已经修正。参考《平衡态公理的修正与思考》

在下面的两篇文章中，BoJone已经介绍了这个“旋转弹簧伸长”的问题，并从两个角度提供了两种解答方法。前者列出了一道积分方程，然后再转变为微分方程来解；后者直接从弹性力学的角度来列出一道二阶微分方程，两者殊途同归。
http://kexue.fm/archives/782/

http://kexue.fm/archives/826/

今天，再经过一段时间的变分法涉猎后，BoJone尝试从变分的角度（总能量最小）来给出一种新的解法。同样设r为旋转达到平衡后弹簧上一点到旋转中心的距离，该点的线密度为$\lambda =\lambda (r)$，该点到中心的弹簧质量为$m=m(r)$，旋转前的长度为$l_0$，旋转平衡后的长度为$l_1$。由于弹簧旋转后已经达到了平衡状态，由平衡态公理（参看《自然极值》系列），平衡意味着~~总能量~~“动能-势能”取极值。

点击阅读全文...

分类：物理化学标签：旋转, 弹性, 极值, 变分, 作用量阅读全文抢沙发

4 Apr

变分与理论力学略览

By 苏剑林 | 2011-04-04 | 36629位读者 | 引用

拉格朗日

BoJone在之前的《自然极值》系列已经花了一定篇幅来讲述“极值”在自然界中是多么的普遍，它能够引导我们进行某些问题的思考，从而获得简单快捷的解答。接下来，我要说的一个更加令人惊讶的“事实”：“极值”不仅仅在某些数学或物理问题上给予我们创造性的思考，它甚至构建了整个经典力学乃至于整个物理学！这不是夸大其辞，这是物理学中被称为“最小作用量原理”的一个原理，很多物理学家（如费恩曼）被它深深吸引着，甚至认为它就是“上帝创造世界的终极公式”！（关于做小作用量原理，大家不妨看一下范翔所写的《最小作用量原理与物理之美》系列文章）

话说在18世纪，欧拉和拉格朗日开创了一条独特的道路，即用变分法来研究经典力学，从而使经典力学焕发出了新的活力，也由此衍生出了一个叫“理论力学”或“分析力学”的分支。用变分法研究力学有很多的好处，变分的对象一般都是标量函数，我们只需要写出动力系统的动能与势能表达式，就可以进行一系列的研究，比如列出质点的运动方程、判断平衡点的稳定性、求周期轨道等等（由于BoJone对理论力学研究还不够深入，无法举太多例子，但请相信，其作用远远不止这些），省去了不少繁琐的矢量性分析，这些都是在变分法发明前难以研究的。

点击阅读全文...

分类：物理化学标签：极值, 变分, 理论力学, 特解, 作用量阅读全文 2 评论

SEARCH

MENU

CATEGORIES

NEWPOSTS

COMMENTS

USERLOGIN

科学空间|Scientific Spaces

积分估计的极值原理——变分原理的初级版本

从高斯型积分出发

“熵”不起：从熵、最大熵原理到最大熵模型（二）

上集回顾

最大熵原理

承认我们的无知

寻求一个光滑的最大值函数

势能最小问题的探讨

关于“平衡态公理”的更正与思考

地球引力场的悬链线方程

重提“旋转弹簧伸长”问题（变分解法）

变分与理论力学略览

关于站长

智能搜索

热门标签

随机文章

最近评论

友情链接