关于“微分”的理解
By 苏剑林 | 2012-12-14 | 34602位读者 |我从来不想在教科书上的定义上纠结太多,因为我知道,真正对定义的理解,需要在长期的实践应用中慢慢感悟的,所以我们唯一需要做的是继续我们的研究。
但是前些天有些朋友问到我关于微分的理解,比如“dx是不是一定很小”等等,所以决定在此写写我的理解。
与微分联系很紧密的,也是我们很熟悉的东西,当然是“增量 ”啦,比如$\Delta y$、$\Delta x$等等,增量显然是可以任意大的(只要自变量还在定义域内)。那么考虑一个函数$y=f(x)$,函数的微分是怎么出现的呢?那是因为我们直接研究函数的增量是比较麻烦的,所以就引入了微分dy,当$\Delta x$很小时,它代表增量的主项:$\Delta y=dy+o(\Delta x)=A \Delta x+o(\Delta x)$,A是一个常数。
我们通常说$o(\Delta x)$是比$\Delta x$更高阶的无穷小项,但这个结果是不直观的。$o(\Delta x)$通常可以记为$O(\Delta x^2)$,它的意思是,存在某个正的常数k,使得$\Delta y-dy$可以控制在$k \Delta x^2$内!
要知道,$dy$是$\Delta x$的主项,既然$\Delta x$可以任意大,那么dy当然可以很大啦。对于自变量x来说,可以看成函数$y=f(x)=x$,因此它的微分显然就是$dx=\Delta x$,A=1;我们已经知道,对于其他函数来说,$A=f'(x)$,也就是说,$dy=f'(x)dx=f'(x)\Delta x$。显然,只要导数不为零,dy是可以任意大的,因为$\Delta x$可以取任意值。
很多人认为dx和dy一定会很小的主要原因是由于下面的法则:
$$\begin{aligned}f'(x)=\lim_{\Delta x \to 0} \frac{\Delta y}{\Delta x} \\ f'(x)=\frac{dy}{dx}\end{aligned}$$
所以dx和dy相当于$\Delta x \to 0$和$\Delta y \to 0$。我一开始也是这样理解的,感觉不会有什么问题,但是在学了大学微积分以及在理解量子力学概念的时候才确认我错了。上面的理解才是正确的。要问为什么$f'(x)=\frac{dy}{dx}$,倒不如很干脆的回答,因为dy的定义就是$dy=f'(x)dx$!这才不至于本末倒置了。
有些同学可能会提出以下反对意见:对于复合函数$y=f(g(x)),u=g(x)$,我们知道由链式法则:
$$\begin{aligned}dy=f'(u)u' dx=f'(u)u' \Delta x \\ dy=f'(u)du=f'(u) \Delta u\end{aligned}$$
那不是有$\Delta u=u' \Delta x$了?这不是明显的矛盾吗?
不错,这是一个很容易发现的矛盾。不过,这只不过是我们的记号太简陋了而已,要知道函数的微分是和自变量有关的,以x为自变量的时候,我们会有
$$\Delta y=dy+o(\Delta x)$$
可是以u为自变量的时候,我们变成了
$$\Delta y=dy+o(\Delta u)$$
既然u和x不相等,我们又怎么可以认为两条式子中的dy一样呢?说到这里,我想很多刚刚清醒过来的读者又会晕了,既然不同变量的dy不一致,那么教科书为什么又不用符号区别它呢?这其实有一个“潜规则”问题,就好像我们用函数加一撇表示导数$f'(x)$一样,我们并没有指定对什么变量求导,可以我们已经默认了是整个括号里边的内容作为变量。而对于dy,虽然它因变量而异,可以当它使用的时候,总会配合dx、du等一起使用,这时,就等价于指明了自变量符号了。而且虽然各个dy形式不同,但是它们之间相差也只是一个二阶无穷小项,因此同一记号也不会引起混乱。
转载到请包括本文地址:https://kexue.fm/archives/1815
更详细的转载事宜请参考:《科学空间FAQ》
如果您还有什么疑惑或建议,欢迎在下方评论区继续讨论。
如果您觉得本文还不错,欢迎分享/打赏本文。打赏并非要从中获得收益,而是希望知道科学空间获得了多少读者的真心关注。当然,如果你无视它,也不会影响你的阅读。再次表示欢迎和感谢!
如果您需要引用本文,请参考:
苏剑林. (Dec. 14, 2012). 《关于“微分”的理解 》[Blog post]. Retrieved from https://kexue.fm/archives/1815
@online{kexuefm-1815,
title={关于“微分”的理解},
author={苏剑林},
year={2012},
month={Dec},
url={\url{https://kexue.fm/archives/1815}},
}
May 20th, 2020
请问,在什么场景下用到比较大的dy? 量子力学哪部分用到比较大的dy?谢谢!
大小是相对的,1算是比较大,还是0.1就算比较大?这没有统一的标准。当初写这篇文章,关键之处在于澄清阶的概念,阶与大小没有必然关系。
May 21st, 2020
Got it, thanks!