行列式的导数
By 苏剑林 | 2014-02-28 | 102484位读者 |在讨论曲线坐标系的积分时,通常都会出现行列式这个东西,作为“体积元”的因子。在广义相对论中,爱因斯坦场方程的作用量就带有度规的行列式,而在对其进行变分时,自然也就涉及到了行列式的求导问题。我参考了朗道的《场论》以及《数理物理基础--物理需用线性高等数学导引》,了解到相关结果,遂记录如下。
推导 #
设
\begin{equation}\boldsymbol{A}(t)=\left(a_{ij}(t)\right)_{n\times n}\end{equation}
是一个n阶矩阵,其中每个矩阵元素都是t的函数。其行列式为$|\boldsymbol{A}|$,自然地,考虑
\begin{equation}\frac{d}{dt}|\boldsymbol{A}|\end{equation}
由行列式的基本性质,有
\begin{equation}|\boldsymbol{A}(a_{ij}+\varepsilon)|-|\boldsymbol{A}|=\varepsilon A_{ij}\end{equation}
其中$|\boldsymbol{A}(a_{ij}+\varepsilon)|$是将矩阵$\boldsymbol{A}$的$a_{ij}$换成$a_{ij}+\varepsilon$后的行列式的值,而$A_{ij}$是行列式$|\boldsymbol{A}|$关于$a_{ij}$的代数余子式。上式给出
\begin{equation}\frac{\partial |\boldsymbol{A}|}{\partial a_{ij}}= A_{ij}\end{equation}
也就是说,代数余子式可以表示为行列式的偏导数。
那么
\begin{equation}\frac{d}{dt}|\boldsymbol{A}|=\sum_{i}\sum_{j}\frac{\partial |\boldsymbol{A}|}{\partial a_{ij}}\frac{d a_{ij}}{dt}=\sum_{i}\sum_{j} A_{ij}\frac{d a_{ij}}{dt}\end{equation}
(为了得出第一个等式,只需要给矩阵$\boldsymbol{A}$的每个元素都增加一个无穷小量,然后把增量后的矩阵的行列式展开,保留一阶无穷小项。)
所以
\begin{equation}\frac{d}{dt}|\boldsymbol{A}|=|\boldsymbol{A}|\sum_{i}\sum_{j} \frac{A_{ij}}{|\boldsymbol{A}|}\frac{d a_{ij}}{dt}\end{equation}
或许可以重写一下,会使得过程更加清楚
\begin{equation}\frac{d}{dt}|\boldsymbol{A}|=|\boldsymbol{A}|\sum_{j=k}\sum_{i} \frac{A_{ij}}{|\boldsymbol{A}|}\frac{d a_{ik}}{dt}\end{equation}
其中
\begin{equation}\frac{A_{ji}}{|\boldsymbol{A}|}\end{equation}
正好是矩阵$\boldsymbol{A}$的逆阵$\boldsymbol{A}^{-1}$的第$(i,j)$个元素$(\boldsymbol{A}^{-1})_{ij}$,而$\frac{d a_{ij}}{dt}$则是矩阵$\frac{d \boldsymbol{A}}{dt}$的元素。第一次求和即把两个矩阵相乘,得
\begin{equation}\left(\boldsymbol{A}^{-1}\frac{d \boldsymbol{A}}{dt}\right)_{jk}=\sum_{i} (\boldsymbol{A}^{-1})_{ji}\left(\frac{d\boldsymbol{A}}{dt}\right)_{ik}=\sum_{i} \frac{A_{ij}}{|\boldsymbol{A}|}\frac{d a_{ik}}{dt}\end{equation}
而第二次求和则相当于取矩阵的迹,所以
\begin{equation}\frac{d}{dt}|\boldsymbol{A}|=|\boldsymbol{A}| \text{Tr}\left(\boldsymbol{A}^{-1}\frac{d \boldsymbol{A}}{dt}\right)\end{equation}
用张量分析中的符号,则更加简单了,记$g=\det(g_{\mu\nu}),g_{\mu s} g^{s\nu}=\delta_{\mu}^{\nu}$,则
\begin{equation}dg=g g^{\mu\nu} dg_{\mu\nu}\end{equation}
例子 #
作为一个简单的应用,我们求
\begin{equation}\frac{d}{dt}|\boldsymbol{I}+t\boldsymbol{A}|\end{equation}
其中$\boldsymbol{I}$是单位矩阵,$\boldsymbol{A}$对同样大小的方阵。代入公式得到
\begin{equation}\frac{d}{dt}|\boldsymbol{I}+t\boldsymbol{A}|=|\boldsymbol{I}+t\boldsymbol{A}|\text{Tr}\big[(\boldsymbol{I}+t\boldsymbol{A})^{-1}\boldsymbol{A}\big]\end{equation}
那么
\begin{equation}\left(\frac{d}{dt}|\boldsymbol{I}+t\boldsymbol{A}|\right)_{t=0}=\text{Tr}\,\boldsymbol{A}\end{equation}
那么根据泰勒展开,当$|t|$充分小时,我们就有近似
\begin{equation}|\boldsymbol{I}+t\boldsymbol{A}|\approx 1 + t\times\text{Tr}\,\boldsymbol{A}\end{equation}
转载到请包括本文地址:https://kexue.fm/archives/2383
更详细的转载事宜请参考:《科学空间FAQ》
如果您还有什么疑惑或建议,欢迎在下方评论区继续讨论。
如果您觉得本文还不错,欢迎分享/打赏本文。打赏并非要从中获得收益,而是希望知道科学空间获得了多少读者的真心关注。当然,如果你无视它,也不会影响你的阅读。再次表示欢迎和感谢!
如果您需要引用本文,请参考:
苏剑林. (Feb. 28, 2014). 《行列式的导数 》[Blog post]. Retrieved from https://kexue.fm/archives/2383
@online{kexuefm-2383,
title={行列式的导数},
author={苏剑林},
year={2014},
month={Feb},
url={\url{https://kexue.fm/archives/2383}},
}
July 15th, 2015
收获;代数余子式可以表示为行列式的偏导数
ps:当初与张量分析有一页之缘,然而当初并不造是啥,以为是那书写的太繁杂了。
张量往往跟不变性有关,我感觉只有在物理学中,它的意义和作用才会突出。
^_^,本学期已看了张量,主要是看到了它的各种坐标系中物理公式形式不变性的优势
第(9)步是 矩阵×数 吧 不是两个矩阵相乘吧
$A_{ij}$和$a_{ik}$都有矩阵的含义
December 19th, 2017
推导出公式后如果能在有个具体计算例子就完美了!
October 14th, 2018
Corollary,
$$\mathrm d (\ln g)=g^{\mu\nu}\mathrm d g^{\mu\nu}=-g^{\mu\nu}\mathrm d g_{\mu\nu}.$$
March 4th, 2019
苏神你好,关于
$$(\boldsymbol{A}^{-1})_{ij}=\frac{A_{ji}}{|\boldsymbol{A}|} \tag{8}$$
请问式(8)下标次序,为什么可以替换呢?
我的理解是这里的矩阵$\boldsymbol{A}$是对称矩阵对吗?
如果是对称矩阵,则$a_{ij}, a_{ji}$将同时变化,则$\frac{d}{dt}|\boldsymbol{A}$后,式$(3)(4)(5)$将出现高阶的无穷小,那些无穷小都舍去。请问我的理解对吗?
不好意思,是我理解失误了,式$(8)$是根据逆矩阵和伴随矩阵的定义写的。
我稍微调整了一下描述,应该不会造成歧义了~
关于出现高阶无穷小的问题我查看了wikipedia。
https://en.wikipedia.org/wiki/Determinant#Derivative
理解应该没有问题
不大明白你的意思,你是说对称的行列式的导数如何计算?最终的计算公式还是$(10)$式呀。
July 9th, 2020
很受益,苏老师
November 7th, 2021
[...]H进行求导操作。在上式中包含有行列式,对行列式|W|进行求导的方法可参考这里。[...]
July 7th, 2024
苏神,为什么(7)式中要加一个j=k呢,这样为什么更清楚
这个看个人吧,对于当时的我来说比较清楚。我主要想的是先分离出一个$\sum_j a_{i,j}b_{j,k}$的形式来,这样的形式可以写成矩阵乘法。