机器学习学习笔记（10）----softmax回归

2023-05-08 11:38:31

logistic回归解决的是二元分类问题，对于多元分类问题，需要通过softmax回归模型来解决。回顾一下logistic模型(《机器学习学习笔记（8）----logistic回归模型》)，假设事件A发生的概率是p，那么：

p=1/(1+exp(-wTx)) (1)

其中：wT=（w0 w1 ..... wn)，x=（x0 x1 ...... xn）T，x0=1，T表示矩阵的转置。

如果对（1）式右边的分数表达式的分子和分母都乘以一个exp(w1Tx)，得：

p=exp(w1Tx)/(exp(w1Tx)+exp(w2Tx)) (2)

那么对于A事件不发生的概率：

1-p=exp(w2Tx)/(exp(w1Tx)+exp(w2Tx)) (3)

这样，对于多元分类问题，假设有K个分类，那么第k个事件发生的概率，可以写成：

机器学习学习笔记（10）----softmax回归

（4）

接下来，我们用y=k表示第k个事件发生，那么

P(y=k|x)= Pk =hk(x) (5)

假设我们的训练集有m个样例，那么第i个样例的条件概率可以表示成：

机器学习学习笔记（10）----softmax回归

(6)

I(y(i)=j)被称为指示函数。可以看出，当y(i)=k时，公式（6）简化成公式（5）。

与logistic回归相似，我们假设训练集中的各个样本都是相互独立的，那么这些样本对于y=y（i）同时出现的联合概率：

机器学习学习笔记（10）----softmax回归

（7）

问题转换成L(w)的最大值，对（7）式两端取对数：

机器学习学习笔记（10）----softmax回归

(8)

类似logistic回归模型，可以定义损失函数：

J(w) = -(1/m)l(w) (9)

把(8)代入到(9)式，得到softmax的损失函数的公式：

机器学习学习笔记（10）----softmax回归

（10）

对于损失函数求最小值和对数似然函数求出最大值实际上是等价的，后面的工作就是求J(w)的梯度了。

机器学习学习笔记（10）----softmax回归

(11)

同样，这个损失函数的最小值没有解析解。

因此我们需要用批量梯度下降优化方法通过每次把所有的样本作为输入，通过迭代计算来获得最优的wr参数。

对于随机梯度下降优化方法，可以抽取公式(11)的i=k时的值，得梯度公式：

机器学习学习笔记（10）----softmax回归

（12）

参考资料：

《Python机器学习算法：原理，实现与案例》

机器学习学习笔记（10）----softmax回归

继续阅读

简单文档分类——朴素贝叶斯算法朴素贝叶斯算法简单文档分类实例步骤总结朴素贝叶斯分类调用(sklearn)

【分类算法】什么是分类算法定义分类与聚类分类过程方法

分类算法的评价指标

K-近邻算法以及图像分类应用

weka之NB算法

使用weka的select attribute

weka中分类器算法

在weka中集成自己的算法

【多变量线性回归】学习记录序思路实现终

申请评分模型拒绝推断（RI）方法申请评分模型拒绝推断（RI）方法

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

【趋高机器视觉】机器视觉技术原理解析及解决方案

吴恩达 coursera ML 第七课总结+作业答案前言目录正文模型表示作业答案

XGBoost Plotting API以及GBDT组合特征实践 XGBoost Plotting API以及GBDT组合特征实践

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告