机器学习中对矩阵的迹（trace）求导的一些操作

2023-05-13 20:31:08

机器学习中经常涉及到一些优化工作，优化时又涉及矩阵、向量的Frobenius 范数（Frobenius-Norm），这个F范数又可以转化成矩阵自乘求迹trace的形式，然后对trace求导。这块没学过矩阵论的话，有时候经常会感觉到困惑。所以这里找到一篇文章，有助于理解这块的内容。同时我也在一些地方留了笔记，更有助于理解。

Errata:

抱歉在F-Norm那块留的墨迹有错误，当时我想算一下Linear Regression求导，所以在那块写了一点墨迹，但是写的有误，这里重新写一下：

Y Y Y是n维列向量， θ \theta θ是n维列向量， X X X是mxn维矩阵：

机器学习中对矩阵的迹（trace）求导的一些操作

其实这里最重要的就是那个（4）和（5）式，搞定了这个，其实就明白所有trace的求导操作都是可以怎么弄了。只要把trace转化为求和式，就转化为我们熟悉的求导了。

机器学习中对矩阵的迹（trace）求导的一些操作

其实总的来看，线性的情况下用的比较多的是（9）、（11）、

（17），这个搞定，很多线性情况都可以解决了。

这里再写一下：

（9）：

∂ t r ( A X B ) ∂ X = ( B A ) T = A T B T \frac{\partial{tr(AXB)}}{\partial{X}} = (BA)^{T}=A^TB^T ∂X∂tr(AXB)=(BA)T=ATBT

（11）：

∂ t r ( A X T B ) ∂ X = B A \frac{\partial{tr(AX^TB)}}{\partial{X}} = BA ∂X∂tr(AXTB)=BA

机器学习中对矩阵的迹（trace）求导的一些操作

继续阅读

分类算法的评价指标

K-近邻算法以及图像分类应用

weka之NB算法

使用weka的select attribute

weka中分类器算法

在weka中集成自己的算法

【多变量线性回归】学习记录序思路实现终

申请评分模型拒绝推断（RI）方法申请评分模型拒绝推断（RI）方法

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

Apache 虚拟主机搭建过程

【趋高机器视觉】机器视觉技术原理解析及解决方案

吴恩达 coursera ML 第七课总结+作业答案前言目录正文模型表示作业答案

XGBoost Plotting API以及GBDT组合特征实践 XGBoost Plotting API以及GBDT组合特征实践

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告

判断浏览器类型与版本以及ios安卓判别