10 Oct

从费马大定理谈起(十):x^3+y^3=z^3+w^3

Ramanujan

Ramanujan

在正式开始数学之前,我们不妨先说一个关于印度著名数学天才——拉马努金的轶事。拉马努金病重,哈代前往探望。哈代说:“我乘出租车来,车牌号码是1729,这数真没趣,希望不是不祥之兆。”拉马努金答道:“不,那是个有趣得很的数。可以用两个立方之和来表达而且有两种表达方式的数之中,1729是最小的。”(即$1729 = 1^3+12^3 = 9^3+10^3$,后来这类数称为的士数。)利特尔伍德回应这宗轶闻说:“每个整数都是拉马努金的朋友。”(来自维基百科

从这则轶事中,我们发现,确实存在的某些整数,可以表示为两种不同的立方和,换句话说,不定方程:
$$x^3+y^3=z^3+w^3$$

点击阅读全文...

12 Nov

实数域上有限维可除代数只有四种

今天上近世代数课,老师谈到除环,举了一个非交换的除环的粒子,也就是四元数环,然后谈到“实数域上有限维可除代数只有4种”,也就是实数本身、复数、四元数和八元数(这里的可除代数就是除环)。这句话我听起来有点熟悉,又好像不大对劲。我记得在某本书上看过,定义为实数上的超复数系,如果满足模的积性,那么就只有以上四种。但是老师的那句话表明即使去掉模的积性,也只有四种。我自然以为老师记错了,跟老师辩论了一翻,然后回到宿舍又找资料,最终确定:实数域上有限维可除代数真的只有四种!下面简单谈谈我对这个问题的认识。

当然,这里不可能给出这个命题的证明,因为这个证明相当不简单,笔者目前也没有弄懂,但是粗略感觉一下为什么,还是有可能的。看到这个命题,我们一下子的感觉可能是:怎么会这么少!我们这里通过例子简单说明一下,确实不会多!

我们已经对复数系很熟悉了,也就是定义在实数上的向量空间,基为$\{1,i\}$,并且给定乘法为
$$1\times i=i \times 1=i,\quad 1^2=1,\quad i^2=-1$$

点击阅读全文...

11 Jan

狄拉克函数:级数逼近

魏尔斯特拉斯定理

将狄拉克函数理解为函数的极限,可以衍生出很丰富的内容,而且这些内容离严格的证明并不遥远。比如,定义
$$\delta_n(x)=\left\{\begin{aligned}&\frac{(1-x^2)^n}{I_n},x\in[-1,1]\\
&0,\text{其它情形}\end{aligned}\right.$$
其中$I_n = \int_{-1}^1 (1-x^2)^n dx$,于是不难证明
$$\delta(x)=\lim_{n\to\infty}\delta_n(x)$$
这样,对于$[a,b]$上的连续函数$f(x)$,我们就得到
$$f(x)=\int_{-1}^1 f(y)\delta(x-y)dy = \lim_{n\to\infty}\int_{-1}^1 f(y)\delta_n(x-y) dy$$
这里$-1 < a < b < 1$,并且我们已经“不严谨”地交换了积分号和极限号,但这不是特别重要。重要的是它的结果:可以看到
$$P_n(x)=\int_{-1}^1 f(y)\delta_n(x-y) dy$$
是$x$的一个$2n$次多项式,因此上式表明$f(x)$是一个$2n$次的多项式的极限!这就引出了著名的“魏尔斯特拉斯定理”:

闭区间上的连续函数都可以用多项式一致地逼近。

点击阅读全文...

14 Dec

基于Conditional Layer Normalization的条件文本生成

从文章《从语言模型到Seq2Seq:Transformer如戏,全靠Mask》中我们可以知道,只要配合适当的Attention Mask,Bert(或者其他Transformer模型)就可以用来做无条件生成(Language Model)和序列翻译(Seq2Seq)任务。

可如果是有条件生成呢?比如控制文本的类别,按类别随机生成文本,也就是Conditional Language Model;又比如传入一副图像,来生成一段相关的文本描述,也就是Image Caption。

相关工作

八月份的论文《Encoder-Agnostic Adaptation for Conditional Language Generation》比较系统地分析了利用预训练模型做条件生成的几种方案;九月份有一篇论文《CTRL: A Conditional Transformer Language Model for Controllable Generation》提供了一个基于条件生成来预训练的模型,不过这本质还是跟GPT一样的语言模型,只能以文字输入为条件;而最近的论文《Plug and Play Language Models: a Simple Approach to Controlled Text Generation》将$p(x|y)$转化为$p(x)p(y|x)$来探究基于预训练模型的条件生成。

条件Normalization示意图

条件Normalization示意图

不过这些经典工作都不是本文要介绍的。本文关注的是以一个固定长度的向量作为条件的文本生成的场景,而方法是Conditional Layer Normalization——把条件融合到Layer Normalization的$\beta$和$\gamma$中去。

点击阅读全文...

3 Oct

【NASA每日一图】猎户座与彗星

图片说明:猎户座与彗星,版权: Rolando Ligustri

图片说明:猎户座与彗星,版权: Rolando Ligustri

点击阅读全文...

15 Aug

《方程与宇宙》:拉格朗日点的点点滴滴(四)

The New Calculation Of Lagrangian Point 1,2,3

L2_rendering

L2_rendering

关于n体问题,选择质心或其他定点为参考点,我们可以列出下面的运动方程:
$$\ddot{\vec{r}}_k=\sum_{i=1,i != k}^{n} Gm_i\frac{\vec{r}_i-\vec{r}_k}{|\vec{r}_i-\vec{r}_k|^3}\tag{19}$$
现在我们只考虑三体问题。天文学家一直希望能够找到三体问题的简洁解,可是很遗憾,庞加莱已经证明了三体问题的解是混沌的,也就是说任何微小的扰动都有可能造成不可预料的后果(可以形象的比喻为:巴西的一只蝴蝶翅膀的扇动,有可能因此美国的一场龙卷风)。

点击阅读全文...

16 Aug

《方程与宇宙》:拉格朗日点,复数,向量(五)

The New Calculation Of Lagrangian Point 4,5

上一回我们已经求出了拉格朗日点L1,L2,L3,并且希望能够求出L4,L5两个点。由于L4,L5与“地球-太阳”连线已经不共线了,所以前边的方法貌似不能够用了。为了得到一个通用的定义,我们可以采用以下方法来描述拉格朗日点:位于拉格朗日点的天体,它与太阳的连线以及地球与太阳的连线所组成的角的大小是恒定的。(这里为了方便,采用了地日系的拉格朗日点来描述,对于一般的三体问题是一样的)

对于L4,L5来说,我们或许可以设置一个新的向量来描述这两点的向径(如$\vec{R}$)。当我们这样做后,很快就会发现这样会令我们的计算走向死胡同。因为我们发现:已知两个向量的夹角和其中一个向量,我们很难把另一个向量用已知向量的式子表达出来。不能做到这一点,就不能找出$\vec{R}$与$\vec{r}$的关系,就无法联立方程求解。难道,我们这一条路走到尽头了吗?一开始BoJone也冥思苦想不得头绪,但是...

点击阅读全文...

27 Aug

与向量的渊源极深的四元数

当我们在使用向量进行几何、物理研究的时候,是否曾经想到:向量竟然起源于“数”?

当向量还没有发展起来的时候(虽然“有方向有大小的量”很早就被人们认识),复数已经得到了认可并且有了初步应用。当我们把复数跟向量联系起来时,我们也许会认为,因为复平面表示的复数运算与向量有着相似之处,才把复数跟几何联系起来。然而事实却相反,向量是从对复数乃至一种称为“四元数”的东西的研究中逐渐分离出来的。换句话说,历史中出现过“四元数”与向量分别研究几何的阶段,麦克斯韦(Maxwell) 将四元 数的数量部分和矢量部分分开,作为 实 体处理,作了大量的矢量分析。三维矢量分析的建立,及同四元数的正式分裂是18世纪80年代由Gibbs和Heaviside独立完成的。矢量代数被推广到矢量函数和矢量微积分,由此开始了四元数和矢量分析的争论,最终矢量分析占了上风。因而“四元数”渐渐离开了教科书。不过,“四元数”的一些特殊而巧妙的应用,仍然使我们不至于忘记它。

点击阅读全文...