线性代数之矩阵偏导续
矩阵偏导
针对y或者f(x)是元素,x是矩阵的情况,则元素对矩阵的求导形式如下:

那么由这个定义则有:

证明有两种方法:一种来源于矩阵偏导的定义,一种是借助矩阵迹的性质。
借助定义
通过多变量矩阵偏导的定义来阐述,这里因为是对X的转置求偏导,所以定义里的偏导的每个分量都相应的做了转置,即是相当于对X求偏导时转置了。进而由矩阵偏导的定义得最终的结果a的转置。
借助矩阵迹
矩阵迹的性质
矩阵的迹即矩阵主对角线之和,而且它有如下的性质:

因为这里f(x)是个标量,其定义是

这与矩阵的迹

不谋而合。
矩阵偏导结论
结论,这里不难发现:
针对多变量的标量函数

则

这里A和x可以都是矩阵。
完整证明
所以上述的证明将借助矩阵迹的性质,完整的证明见下:
Step 1 定义

Step 2 带入f

Step 3 f是标量,直接转为矩阵迹

Step 4 由矩阵性质3(矩阵乘交换迹不变)

Step 5 由矩阵性质6(矩阵转置迹不变)

注: 这里应用到矩阵乘和转置的性质:

Step 6 由矩阵转置的性质,则有

Step 7 此时Step6的形式是否和一般式

神似?而

。
注:这里表达式整理成了标准形式(只不过这里的“x”是
)。
所以最终得到结果











