我从来不想在教科书上的定义上纠结太多,因为我知道,真正对定义的理解,需要在长期的实践应用中慢慢感悟的,所以我们唯一需要做的是继续我们的研究。

但是前些天有些朋友问到我关于微分的理解,比如“dx是不是一定很小”等等,所以决定在此写写我的理解。

与微分联系很紧密的,也是我们很熟悉的东西,当然是“增量 ”啦,比如$\Delta y$、$\Delta x$等等,增量显然是可以任意大的(只要自变量还在定义域内)。那么考虑一个函数$y=f(x)$,函数的微分是怎么出现的呢?那是因为我们直接研究函数的增量是比较麻烦的,所以就引入了微分dy,当$\Delta x$很小时,它代表增量的主项:$\Delta y=dy+o(\Delta x)=A \Delta x+o(\Delta x)$,A是一个常数。

我们通常说$o(\Delta x)$是比$\Delta x$更高阶的无穷小项,但这个结果是不直观的。$o(\Delta x)$通常可以极为$O(\Delta x^2)$,它的意思是,存在某个正的常数k,使得$\Delta y-dy$可以控制在$k \Delta x^2$内!

要知道,$dy$是$\Delta x$的主项,既然$\Delta x$可以任意大,那么dy当然可以很大啦。对于自变量x来说,可以看成函数$y=f(x)=x$,因此它的微分显然就是$dx=\Delta x$,A=1;我们已经知道,对于其他函数来说,$A=f'(x)$,也就是说,$dy=f'(x)dx=f'(x)\Delta x$。显然,只要导数不为零,dy是可以任意大的,因为$\Delta x$可以取任意值。

很多人认为dx和dy一定会很小的主要原因是由于下面的法则:
$f'(x)=\lim_{\Delta x \to 0} \frac{\Delta y}{\Delta x}$
$f'(x)=\frac{dy}{dx}$
所以dx和dy相当于$\Delta x \to 0$和$\Delta y \to 0$。我一开始也是这样理解的,感觉不会有什么问题,但是在学了大学微积分以及在理解量子力学概念的时候才确认我错了。上面的理解才是正确的。要问为什么$f'(x)=\frac{dy}{dx}$,倒不如很干脆的回答,因为dy的定义就是$dy=f'(x)dx$!这才不至于本末倒置了。

有些同学可能会提出以下反对意见:对于复合函数$y=f(g(x)),u=g(x)$,我们知道由链式法则:
$dy=f'(u)u' dx=f'(u)u' \Delta x$
$dy=f'(u)du=f'(u) \Delta u$

那不是有$\Delta u=u' \Delta x$了?这不是明显的矛盾吗?

不错,这是一个很容易发现的矛盾。不过,这只不过是我们的记号太简陋了而已,要知道函数的微分是和自变量有关的,以x为自变量的时候,我们会有
$\Delta y=dy+o(\Delta x)$
可是以u为自变量的时候,我们变成了
$\Delta y=dy+o(\Delta u)$

既然u和x不相等,我们又怎么可以认为两条式子中的dy一样呢?说到这里,我想很多刚刚清醒过来的读者又会晕了,既然不同变量的dy不一致,那么教科书为什么又不用符号区别它呢?这其实有一个“潜规则”问题,就好像我们用函数加一撇表示导数$f'(x)$一样,我们并没有指定对什么变量求导,可以我们已经默认了是整个括号里边的内容作为变量。而对于dy,虽然它因变量而异,可以当它使用的时候,总会配合dx、du等一起使用,这时,就等价于指明了自变量符号了。而且虽然各个dy形式不同,但是它们之间相差也只是一个二阶无穷小项,因此同一记号也不会引起混乱。


转载到请包括本文地址:http://kexue.fm/archives/1815/

如果您觉得本文还不错,欢迎点击下面的按钮对博主进行打赏。打赏并非要从中获得收益,而是希望知道科学空间获得了多少读者的真心关注。当然,如果你无视它,也不会影响你的阅读。再次表示欢迎和感谢!