生成扩散模型漫谈(十三):从万有引力到扩散模型
By 苏剑林 | 2022-10-18 | 55084位读者 | 引用对于很多读者来说,生成扩散模型可能是他们遇到的第一个能够将如此多的数学工具用到深度学习上的模型。在这个系列文章中,我们已经展示了扩散模型与数学分析、概率统计、常微分方程、随机微分方程乃至偏微分方程等内容的深刻联系,可以说,即便是做数学物理方程的纯理论研究的同学,大概率也可以在扩散模型中找到自己的用武之地。
在这篇文章中,我们再介绍一个同样与数学物理有深刻联系的扩散模型——由“万有引力定律”启发的ODE式扩散模型,出自论文《Poisson Flow Generative Models》(简称PFGM),它给出了一个构建ODE式扩散模型的全新视角。
万有引力
中学时期我们就学过万有引力定律,大概的描述方式是:
两个质点彼此之间相互吸引的作用力,是与它们的质量乘积成正比,并与它们之间的距离成平方反比。
调侃:万有引力与爱因斯坦的理论
By 苏剑林 | 2016-05-18 | 49551位读者 | 引用我不是研究引力的,也没有很好地学习过引力。在理论物理方面,我学习经典力学和量子力学比学习广义相对论要多得多。因此,本来我是不应该谈引力的,以免误人子弟。不过,在一次坐车的途中,司机的刹车和加速让我联想到了一些跟引力有关的东西,自我感觉比较有趣,所以发给大家分享一下,也请大家指正。
等效原理
引力,准确来说应该是“万有引力”。所谓“万有”,有两个含义:1、所有物体都能够产生引力;2、所有物体都被引力影响。一个力居然是“万有”的,这让爱因斯坦感觉到非常奇怪,这也是四种基本力之中,引力跟其他力区别最明显的地方。相比之下,电磁相互作用力就只能存在于有“电”的地方,弱相互作用只存在于费米子,等等。
除了引力之外,我们平时还遇到过什么“万有”的力吗?貌似没有。但是我们想象一下,当你坐在一辆长途大巴匀速前进时,突然司机来了一个急刹车,在刹车的那一瞬间,所有人都往前倾了,不仅如此,可能你的行李箱、你的随身物品都往前移的,事实上,车上所有东西都受到了一个往前的力!对于那辆车上的人和物来说,刹车的那一瞬间,就存在着一个“万有”的力!
《虚拟的实在(4)》——质量是什么
By 苏剑林 | 2013-07-22 | 58279位读者 | 引用笔者很少会谈到定义性的东西,原因很简单,因为我也不见得会比大家清楚,或者说也未必比大家所知道的准确。不过,刚刚与同好讨论过与质量相关的问题,就跟大家分享一下。
最初的问题是能量能不能转化为物质,我觉得根据$E=mc^2$,是显然可以的,例子嘛,我首先想到在量子场论中的真空是会不断产生和湮灭正负电子对的,因此这可以作为一个证据。但是这个感觉上太遥远了,所以我在互联网搜索了一下,不过搜到的内容大同小异:
当辐射光子能量足够高时,在它从原子核旁边经过时,在核库仑场作用下,辐射光子可能转化成一个正电子和一个负电子,这种过程称作电子对效应。
(正负电子对效应)
哈哈,我的“《圣经》”到了
By 苏剑林 | 2013-06-27 | 55639位读者 | 引用《虚拟的实在(2)》——为什么引力如此复杂?
By 苏剑林 | 2013-06-07 | 32742位读者 | 引用上一篇文章里我已经从我自己的理解角度简单说了一下场论的必要性,这次让我们再次谈到这个话题,企图在文字层面上得到更深入的认识。
上一两周的时间,我一直在找资料,主要是线性引力的资料,并且发现了很多有趣的东西,在此一并与大家分享一下。首先,当我在Google中输入“线性引力”时,我发现了一本“奇书”,一本名副其实的“巨著”——《引力论》!洋洋1300多页的大作,三位“超级巨星”——C.W.麦思纳(Charles W.Misner)、K.S.索恩(Kip S.Thorne)、J.A.惠勒(John Archibald Wheeler)——联合编写,恐怕再也找不到哪本书可以PK它的“全明星阵容”了。该书英文名为Gravitation,中文是由台湾翻译的,繁体中文版。全书讲述了引力的研究历史和发展情况,更重要的是几乎每一处历史都给出了数学论证!最最重要的,作者惠勒还是跟爱因斯坦同一个研究时代的人,我们可以最真实的感受到那年代的研究。看到这里,我就迫不及待地想买了,由于各种原因,我们很难买到,到图书馆找,发现有英文版的,就马上借过来了,另外因为买不到中文版,我只好到网上买了电子版,然后打印出来了。不过不是很清晰,而且自我感觉中文翻译不是很好(当然,已经够我们阅读了)。
《虚拟的实在(1)》——为什么需要场?
By 苏剑林 | 2013-05-24 | 40213位读者 | 引用这段时间我接触的物理学都是场论,从各种方面为广义相对论奠基。自我感觉,我的数学基础还算可以的,但是物理“底蕴”就不够了,通常是能够把物理理论的数学描述看懂,但是对每一步的物理基础和来源却不甚了解,真是“数学有余而物理不足”呀。陶醉在场论的海洋一段时间之后,对场论也有了个大概的印象。但是有一个最基础的问题,直到今天我才算是得到了比较满意的解答——为什么要引入场?
在传统的牛顿力学中并没有“场”这一概念,比如天体力学我们只需要考虑天体之间的相互作用力就可以完美解决很多问题,根本不需要场。估计广大读者首次接触到“场”的概念是在高中学习电学的时候,那时教科书给我们带来了电场、场线等诸多诡异的概念。事实上就是如此,可以这样说,历史上“场”是为了电磁学而诞生的——法拉第首次引入的场线具有独特的魅力。
很早以前我就对这个问题感兴趣了,但是一直搁置着,没有怎么研究。最近在阅读《引力与时空》的“潮汐力”那一节时重新回到了这个问题上,决定写点什么东西。在这里不深究流体静力平衡的定义,顾名思义地理解,它就是流体在某个特定的力场下所达到的平衡状态。流体静力学告诉我们:
达到流体静力平衡时,流体的面必定是一个等势面。
这是为什么呢?我们从数学的角度来简单分析一下:只考虑二维情况,假如等势面方程是$U(x,y)=C$,那么两边微分就有
$$0=dU=\frac{\partial U}{\partial x}dx+\frac{\partial U}{\partial y}dy=(\frac{\partial U}{\partial x},\frac{\partial U}{\partial y})\cdot (dx,dy)$$
这意味着向量$(\frac{\partial U}{\partial x},\frac{\partial U}{\partial y})$和向量$(dx,dy)$是垂直的,前者便是力的函数,后者就是一个切向量(三维就是一个切平面)。也就是说合外力必然和流体面垂直,这样才能提供一个相等的方向相反的内力让整个结构体系处于平衡状态!
这已经是去年写的稿件了,刊登在今年二月份的《天文爱好者》上,本文的标题还登载了该期天爱的封面上,当时甚是高兴呢!在此与大家分享、共勉。
相信许多天文爱好者都知道第一、第二、第三宇宙速度的概念,也会有不少的天爱自己动手计算过它们。我们道,只要发射速度达到7.9km/s,宇宙飞船就可以绕地球运行了;超过11.2km/s,就可以抛开地球,成为太阳系的一颗“人造行星”;再大一点,超过16.7km/s,那么就连太阳也甩掉了,直奔深空。
16.7km/s,咋看上去并不大,因为地球绕太阳运行的速度已经是30km/s了,这个速度在宇宙中实在是太普通了。但是对于我们目前的技术来说,它大得有点可怕。维基百科上的资料显示,史上最强劲的火箭土星五号在运送阿波罗11号到月球时,飞船最终也只能加速到接近逃逸速度,即11.2km/s,而事实上第三宇宙速度已经是是目前人造飞行器的速度极限了。可是没有速度,我们就不能发射探测器去探索深空,那些科幻小说中的“星际移民”,就永远只能停留在小说上了。
最近评论